Автоматические методы анализа социологических данных

В данной работе рассматривается задача автоматического анализа тональности русскоязычных текстов, собранных с платформы Twitter. Для решения данной задачи используются подходы основанные на машинном обучении с учителем. В качестве классификаторов были выбраны метод опорных векторов и наивный байесовский классификатор. Для экспериментов были использованы автоматически и вручную размеченные сообщения с платформы Twitter. В результате на автоматически размеченной коллекции были получены результаты метрики качества классификации macro f1 score 0.75. На вручную размеченных коллекциях значение метрики принимает значение от 0.31 до 0.70.

Математика
Дипломы

Вуз: Санкт-Петербургский государственный университет (СПбГУ)

ID: 587d36395f1be77c40d589ca
UUID: fe878b66-c7d4-4a82-ad4a-1de6f2f01b20
Язык: Русский
Опубликовано: больше 7 лет назад
Просмотры: 17

Гарипов Эмиль Ильдарович

Источник: Санкт-Петербургский государственный университет


0

Комментировать 0

Рецензировать 0

Скачать - 767259 bytes


Поделиться работой
Current View

Рецензии:

  Авторизуйтесь, чтобы добавить рецензию

- у работы пока нет рецензий -

Для лиц старше 18 лет