Использование деривационных преобразований терминоэлементов для автоматического поиска терминов (на материале медицинской терминологии)

Выпускная квалификационная работа созданию программы по автоматическому извлечению терминологии из медицинских текстов на основе деривационных преобразований терминоэлементов. Работа состоит из введения, трёх глав, заключения, списка литературы и двух приложений. Объём работы составляет 76 станиц. Автоматическое извлечение терминологии – подзадача автоматического извлечения информации – область, развивающаяся в данный момент очень активно. Автоматическое извлечение терминологии служит для создания словарей, тезаурусов, онтологий, помогает в разработке логико-понятийной системы конкретной области знания и унификации терминологии, используется при создании систем автоматического перевода, при создании баз знаний. Актуальность данной работы обусловлена необходимостью создания процедуры автоматического извлечения терминологии из медицинских текстов на русском языке. Такая процедура даст возможность полуавтоматического составления словарей медицинских терминов, заполнения баз данных, улучшит качество поиска по текстам с медицинской тематикой, что, в свою очередь, позволит создать приложения для автоматического заполнения и ведения медицинских документов. Программа предназначена для выделения однословных узко специальных терминов из медицинских текстов. Алгоритм по автоматическому выделению терминов строится на предположении, что в текстах можно выделить целые деривационные ряды терминов, на основе которых и строится работа нашей программы. В ходе работы был выделен ряд опорных основ и аффиксов, на основе которых и производилось дальнейшее выделение терминов. Материалом для исследования корпус медицинских текстов по офтальмологии. Корпус был автоматически размечен морфологическим анализатором, после чего был разработан сам алгоритм выделения терминологии и реализована программа извлечения терминологии.

Комплексные проблемы общественных наук
Диссертации

Вуз: Санкт-Петербургский государственный университет (СПбГУ)

ID: 587d36895f1be77c40d591b6
UUID: 2ad1a9c7-abe2-4c8e-b1ea-d2c75c63ae30
Язык: Русский
Опубликовано: около 7 лет назад
Просмотры: 16

Шадричева Валерия Федоровна

Источник: Санкт-Петербургский государственный университет


0

Комментировать 0

Рецензировать 0

Скачать - 9238600 bytes


Поделиться работой
Current View

Рецензии:

  Авторизуйтесь, чтобы добавить рецензию

- у работы пока нет рецензий -

Для лиц старше 18 лет