Анализ тональности отзывов пользователей

В работе рассматривается проблема определения тональности отзывов пользователей о фильмах. Решение данной задачи имеет высокое прикладное значение, в частности может применяться к новостным статьям, блогам. Целью данной работы является исследование и разработка метода анализа тональности текстов. Для решения задачи анализа тональности отзывов пользователей в данной квалификационной работе использовалось два подхода – основанный на словаре и основанный на машинном обучении. Были разобраны разнообразные подходы, которые использовались для создания словаря сентиментов для других языков. За основу для создания собственного словаря сентиментов был взят словарь ключевых слов, составленных на основе коллекций отзывов о фотоаппаратах, книгах и фильмах. Полученный словарь сентиментов был расширен с помощью технологии word2vec от компании google. Для демонстрации подхода, основанного на машинном обучении был использован наивный байесовский классификатор. Экспериментальная часть работы была основана на использовании одной из основных русскоязычных коллекций отзывов о фильмах с портала imhoment.ru. Было произведено сравнение оценки качества работы двух подходов на 30 выборках, созданных на основе 7500 отзывов, не входящих в обучающую выборку для наивного байесовского классификатора. Исследование показало более высокую точность подхода, основанного на словаре.

Общественные науки в целом
Дипломы

Вуз: Санкт-Петербургский государственный университет (СПбГУ)

ID: 587d36395f1be77c40d589cc
UUID: 5b61c6fd-b53b-4426-91e8-73263d5f2b2d
Язык: Русский
Опубликовано: больше 4 лет назад
Просмотры: 862

Журавлева Любовь Викторовна

Источник: Санкт-Петербургский государственный университет


0

Комментировать 0

Рецензировать 0

Скачать - 1059139 bytes


Поделиться работой
Current View

Рецензии:

  Авторизуйтесь, чтобы добавить рецензию

- у работы пока нет рецензий -

Для лиц старше 18 лет