Исследование параметров сегментации при статистическом машинном переводе с арабского на русский язык

Статистический машинный перевод успешно применяется для перевода с арабского на русский язык. Однако, дополнение таких статистических систем лингвистической информацией еще недостаточно изучено. Наша идея заключается в том, что морфологическая сегментация арабских текстов может улучшить качество перевода. Это может происходить потому, что в арабском языке некоторые служебные части речи имеют тенденцию записываться слитно с другими словами, в отличие от русского. В этой работе мы, во-первых, рассмотрели процесс статистического машинного перевода. Затем, было предложено несколько схем для сегментации арабских текстов. После этого, с помощью системы Moses были обучены соответствующие модели перевода. В завершение, мы оценили результаты каждой из этих моделей на тестовом корпусе. В результате, для лучшей схемы мы получили улучшение в 0,95 пунктов BLEUScore.

Комплексные проблемы общественных наук
Диссертации

Вуз: Санкт-Петербургский государственный университет (СПбГУ)

ID: 587d366f5f1be77c40d58f17
UUID: 600672aa-6f8b-4019-b96b-06accd703784
Язык: Русский
Опубликовано: около 7 лет назад
Просмотры: 4

Бань Дмитрий Юрьевич

Источник: Санкт-Петербургский государственный университет


0

Комментировать 0

Рецензировать 0

Скачать - 0 байт


Поделиться работой
Spinner

Публикация в настоящий момент конвертируется

Пожалуйста, перезагрузите страницу через некоторое время...

Рецензии:

  Авторизуйтесь, чтобы добавить рецензию

- у работы пока нет рецензий -

Для лиц старше 18 лет