Распознавание типов изображений документов

В данной работе предложен метод кластеризации изображений отсканированных документов. Описаны методы обработки изображений с целью извлечения признаков, применение быстрых алгоритмов LSH для кластеризации признаков. Идея алгоритма заключается в подсчёте характеристик изображения, описывающих форму текста, понижении их размерности при помощи хеширования и нахождения похожих изображений. Были сделаны уточнения стандартных алгоритмов. Приведены результаты работы алгоритма на тестовой выборке изображений и описана реализация.

Общественные науки в целом
Дипломы

Вуз: Санкт-Петербургский государственный университет (СПбГУ)

ID: 587d36475f1be77c40d58b51
UUID: ba101dc6-4cb7-412c-b6b9-407d13a19eab
Язык: Русский
Опубликовано: больше 7 лет назад
Просмотры: 11

Васильев Павел Сергеевич

Источник: Санкт-Петербургский государственный университет


0

Комментировать 0

Рецензировать 0

Скачать - 0 байт


Поделиться работой
Spinner

Публикация в настоящий момент конвертируется

Пожалуйста, перезагрузите страницу через некоторое время...

Рецензии:

  Авторизуйтесь, чтобы добавить рецензию

- у работы пока нет рецензий -

Для лиц старше 18 лет