Кластеризация с поиском дубликатов на примере патентов

Предметом данной работы является поиск дубликатов в базе патентов. Показано, что данную задачу можно свести к кластеризации патентов. Задача кластеризации решается с помощью методов Canopy Clustering и Mini-Batch K-Means. Построен алгоритм поиска дубликатов в кластерах. Приведены оценки качества алгоритма кластеризации и результаты кластеризации и поиска дубликатов.

Общественные науки в целом
Дипломы

Вуз: Санкт-Петербургский государственный университет (СПбГУ)

ID: 587d362f5f1be77c40d588c8
UUID: 49e335f9-30ea-47ba-9d86-759bf045e747
Язык: Русский
Опубликовано: больше 4 лет назад
Просмотры: 15

Зайцев Андрей Алексеевич

Источник: Санкт-Петербургский государственный университет


0

Комментировать 0

Рецензировать 0

Скачать - 515262 bytes


Поделиться работой
Current View

Рецензии:

  Авторизуйтесь, чтобы добавить рецензию

- у работы пока нет рецензий -

Для лиц старше 18 лет