Подход к оценке числа кластеров в концепции устойчивости кластеризации

В работе предлагается рассматривать неточности исследуемых данных для определения «правильного» числа кластеров. Полагаем, что кластеризация является устойчивой, если группировки возмущенных данных для соответствующего числа кластеров не отличаются по составу в результате многочисленных повторений. Исследуемые данные всегда имеют ошибки различной природы, величины и носят случайный характер. Основным настраиваемым параметром предлагаемых алгоритмов является уровень дисперсии шумов, добавляемых к исследуемым данным. С другой стороны, множество дисперсий отражает уровень ошибок в исследуемых данных. Достоверная, точная и правильная кластеризация состоит из кластеров, которые имеют минимальный уровень зависимости от уровня возмущений.

Общественные науки в целом
Диссертации

Вуз: Санкт-Петербургский государственный университет (СПбГУ)

ID: 587d36825f1be77c40d59105
UUID: 176142cc-8df9-4b9f-bf38-98d05b440c49
Язык: Русский
Опубликовано: больше 7 лет назад
Просмотры: 7

Ложкинс Алексейс

Источник: Санкт-Петербургский государственный университет


0

Комментировать 0

Рецензировать 0

Скачать - 833986 bytes


Поделиться работой
Current View

Рецензии:

  Авторизуйтесь, чтобы добавить рецензию

- у работы пока нет рецензий -

Для лиц старше 18 лет