Разрешение стрелочной омонимии в конструкциях с сирконстантами средствами онтологической семантики

В работе описывается экспериментальное исследование метода разрешения синтаксической неоднозначности в конструкциях со стрелочной омонимией с сирконстантами на русском языке с помощью онтологической семантики на основе универсального лингвистического процессора AIIRE (Artificial Intelligence Information Retrieval Engine). Целью исследования является определение возможностей, а так же оценка трудоемкости и эффективности выбранного метода в решении данной проблемы. Выделено три типа неоднозначных конструкций с сирконстантами и так же семь подтипов. Составлены соответствующие поисковые запросы в синтаксический подкорпус Национального Корпуса Русского Языка (НКРЯ). В результате автоматической работы алгоритма на языке Python выгружен список из 22 703 неоднозначных конструкций. Репрезентативная выборка на основе результатов поиска из 8 592 конструкций и список их 2206 лемм автоматически составляются с помощью алгоритма на языке Python на основе закона Парето. Неоднозначность в конструкциях устраняется путем автоматического разбора и последующего ручного выбора правильных вариантов. Однако на этом этапе возможны следующие проблемы: «разрывы» внутри конструкций, которые обозначают отсутствие нужных семантических связей внутри конструкции, а также большое количество вариантов синтаксического анализа, называемое комбинаторным взрывом. Эти проблемы решаются с помощью таких инструментов AIIRE, как Ontohelper и онтология. Онтология используется для обработки языковых данных и понимается как набор лексических значений или понятий и отношений между ними. Ontohelper – это вспомогательный инструмент с интерфейсом редактирования, где можно моделировать и задавать с помощью онтологических отношений валентности глаголов. 1416 понятий, соответствующих лексическим единицам из списка лемм, их связи и валентности, моделируются в онтологии и в Ontohelper. В результате получаются корректные разборы для 972 конструкций, и обосновывается, что эффективность данного метода зависит от качества и правильности моделирования понятий в онтологии. Ключевые слова: онтология, онтологическая семантика, синтаксическая неоднозначность, стрелочная омонимия, валентность глаголов, синтаксический анализ.

Языкознание
Дипломы

Вуз: Санкт-Петербургский государственный университет (СПбГУ)

ID: 5f00d538cd3d3e00013e9223
UUID: 96d0ae40-a058-0138-0d38-0242ac180006
Язык: Русский
Опубликовано: больше 4 лет назад
Просмотры: 52

11.04

Алина Захарова

Санкт-Петербургский государственный университет (СПбГУ)


0

Комментировать 0

Рецензировать 0

Скачать - 2,2 МБ


Поделиться работой
Current View

Рецензии:

  Авторизуйтесь, чтобы добавить рецензию

- у работы пока нет рецензий -

Для лиц старше 18 лет