Автоматическое пополнение предметно-ориентированных тональных словарей (на материале отзывов о банковских организациях)

В работе рассматривается алгоритм автоматического составления тональных словарей, которые используются в процедурах анализа тональности. В исследовании был использован русскоязычный корпус текстов отзывов о банках. Основная идея подхода – оценка корреляции двух случайных событий: «слово содержится в отзыве» и «отзыв описывает недостатки/достоинства». Для оценки корреляции были построены таблицы сопряженности и применен критерия согласия Пирсона («Хи-квадрат»). Так, были получены словари тональных лексем (702 слова) и конструкций (400 словосочетаний). Удалось выделить как общеупотребительные тонально окрашенные слова и словосочетания (грубый, отвратительный, доброжелательный, потрясающе, неприятная ситуация, страшный сон), так и относящиеся к банковской сфере (ипотечный кредит, приличный кэшбэк, минимальный процент, банкомат зажевал (карту), огромная комиссия). В основе оценки качества работы алгоритма был использован метод кросс-валидации, показавший достаточно высокие результаты: полнота (67,4%) и точность (78,4%). Данный алгоритм в дальнейшем можно применить для автоматического составления предметно-ориентированных тональных словарей других предметных областей, а также его можно использовать для маркетинговых исследований банковских услуг.

Языкознание
Дипломы

Вуз: Санкт-Петербургский государственный университет (СПбГУ)

ID: 5a6f88247966e12684eea0e9
UUID: 4aa9e4d6-becd-4ee7-9f42-362513312174
Язык: Русский
Опубликовано: около 6 лет назад
Просмотры: 27

Юшина Татьяна Андреевна

Источник: Санкт-Петербургский государственный университет


0

Комментировать 0

Рецензировать 0

Скачать - 1,1 МБ


Поделиться работой
Current View

Рецензии:

  Авторизуйтесь, чтобы добавить рецензию

- у работы пока нет рецензий -

Для лиц старше 18 лет