ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ
ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ФИЛОЛОГИЧЕСКИЙ ФАКУЛЬТЕТ
КАФЕДРА МАТЕМАТИЧЕСКОЙ ЛИНГВИСТИКИ
СВЕТЛАНА СЕРГЕЕВНА ПИВОВАРОВА
МЕТОДИКА ИЗВЛЕЧЕНИЯ КАНДИДАТОВ ДЛЯ МНОГОЯЗЫЧНОГО
(АНГЛО-ФРАНКО-РУССКОГО) ТЕРМИНОЛОГИЧЕСКОГО СЛОВАРЯ
Выпускная квалификационная работа по направлению подготовки
035700 «Лингвистика»
НАУЧНЫЙ РУКОВОДИТЕЛЬ:
ВИКТОР ПАВЛОВИЧ ЗАХАРОВ
кандидат филологических наук,
доцент кафедры математической лингвистики
Санкт-Петербург
2016
Аннотация
В данной работе исследуется проблема извлечения переводной
терминологии из многоязычных параллельных корпусов текстов. Целью
исследования является разработка методики выделения кандидатов в термины
для многоязычного (англо-франко-русского) терминологического словаря на базе
параллельного корпуса текстов. В работе рассматриваются теоретические
вопросы выделения терминов и терминологических словосочетаний в
параллельных корпусах текстов, особенности построения терминов и их
переводных эквивалентов в английском, русском и французском языках, а также
описывается методика извлечения терминов-кандидатов для многоязычного
терминологического словаря. В практической части данного исследования описан
эксперимент по извлечению переводных терминов-кандидатов из англо-франкорусского параллельного корпуса международных юридических текстов,
представлен анализ разработанной методики и оценка полученных результатов.
Ключевые слова: переводная терминология, параллельные корпусы текстов,
термины-кандидаты, переводной терминологический словарь, морфосинтаксические
шаблоны, автоматическое выделение терминов
The graduation qualification paper deals with the extraction of terminology from
multilingual parallel corpora and is aimed at developing a procedure for extracting term
candidates from a parallel corpus for a multilingual (English-French-Russian) glossary of
terms. The paper addresses theoretical issues of term extraction based on parallel
corpora, describes characteristic features of English, French and Russian terms and their
translation equivalents as well as a procedure for extracting term candidates for a
multilingual glossary of terms. Finally, the paper presents the results of an experiment
aimed at extracting terms and their translation equivalents from the parallel EnglishFrench-Russian corpus of international legal documents and their evaluation.
Keywords: translation of terminology, parallel corpora, term candidates, glossary of terms,
morphosyntactic patterns, automatic extraction of terminology
2
Оглавление
Введение ................................................................................................................................................................... 5
Глава 1. Выделение терминов и терминологических словосочетаний в
параллельных корпусах текстов ................................................................................................................ 8
1.1. Понятие термина и кандидата в термины ....................................................................... 8
1.2. Термин в переводном многоязычном словаре .............................................................. 9
1.3. Методы выделения терминов-кандидатов в корпусах текстов ....................... 11
1.3.1. Методы выделения однословных терминов-кандидатов в корпусах
текстов ........................................................................................................................................................... 11
1.3.2. Методы выделения терминологических словосочетаний в корпусах
текстов ........................................................................................................................................................... 12
1.3.2.1. Статистический метод ........................................................................................... 12
1.3.2.2. Лингвистический метод ....................................................................................... 13
1.3.2.3. Смешанный метод .................................................................................................... 14
1.4. Алгоритмы выделения терминов-кандидатов на базе многоязычных
параллельных корпусах текстов ............................................................................................................. 16
1.5. Многоязычные терминологические базы данных ................................................... 18
1.6. Выводы ............................................................................................................................................... 21
Глава 2. Методика извлечения терминов-кандидатов для многоязычного
терминологического словаря ................................................................................................................... 23
2.1. Методы исследования................................................................................................................ 23
2.2. Морфосинтаксические шаблоны ......................................................................................... 23
2.2.1. Анализ морфосинтаксических шаблонов на основе переводных
словарей ........................................................................................................................................................ 24
2.2.2. Анализ переводных соответствий между морфосинтаксическими
шаблонами ................................................................................................................................................... 30
2.2.3. Итоговый набор морфосинтаксических шаблонов и их переводных
соответствий .............................................................................................................................................. 33
2.3. Инструменты исследования .................................................................................................. 35
2.4.
Алгоритм
выделения
переводных
терминов-кандидатов
из
многоязычного (англо-франко-русского) корпуса текстов ................................................... 36
2.5. Выводы ............................................................................................................................................... 38
Глава 3. Эксперимент. Выделение переводных терминов-кандидатов из англофранко-русского корпуса текстов международных документов ........................................ 39
3
3.1. Выделение однословных терминов-кандидатов ...................................................... 39
3.2. Выделение терминологических биграмм ...................................................................... 40
3.3. Анализ и оценка работы алгоритма .................................................................................. 44
3.3.1. Анализ результатов эксперимента (выделение однословных
терминов-кандидатов) ......................................................................................................................... 46
3.3.2. Анализ результатов эксперимента (выделение биграмм) ...................... 48
3.4. Выводы ............................................................................................................................................... 53
Заключение ......................................................................................................................................................... 54
Список литературы ......................................................................................................................................... 57
Приложения ........................................................................................................................................................ 64
Приложение 1. Релевантные переводные однословные термины-кандидаты
для англо-франко-русского терминологического словаря .................................................... 64
Приложение 2. Релевантные переводные терминологические биграммы для
англо-франко-русского терминологического словаря ............................................................. 75
Приложение 3. Нерелевантные однословные переводные эквиваленты ........104
Приложение 4. Нерелевантные переводные биграммы ..............................................106
4
Введение
Извлечение терминологии является важной задачей современных корпусных
исследований. С развитием науки и техники терминосистемы различных отраслей
знаний меняются, тогда как существующие лексикографические источники –
терминологические словари, терминологические банки и базы данных,
терминологические стандарты – не всегда своевременно отражают информацию о
новых терминах и обозначаемых ими понятиях. В связи с постоянным изменением
терминосистем различных предметных областей возникает потребность в
разработке и совершенствовании методов выделения современной терминологии,
необходимых для решения задач в области терминоведения, общей и прикладной
лексикографии, информационного поиска и машинного перевода [5, с. 40].
Немаловажную роль в современном многоязычном мире играет перевод научнотехнической литературы: ведутся многочисленные исследования по разработке
эффективных методов извлечения переводной терминологии
и создания
многоязычных переводных терминологических словарей [10; 11; 17; 23; 28; 32; 36;
39; 42; 51; 65].
В многоязычной лексикографии широкое применение находят параллельные
корпусы текстов – совокупности документов, переведённых на два или несколько
языков и выровненных на уровне слов и предложений. Многоязычные
параллельные корпусы используются, в основном, в задачах перевода и
переводных исследованиях [33, p. 4]: для автоматического создания переводных
словарей, выделения терминов для многоязычных терминологических баз
данных, уточнения значений слов и словосочетаний определённой предметной
области, верификации значений терминов и терминологических словосочетаний,
уже зафиксированных в двуязычных и многоязычных словарях, и оценки
адекватности перевода [6, с. 55]. Кроме того, параллельные корпусы текстов
широко используются для обучения систем машинного перевода, проверки
качества машинного перевода, тестирования и оценки качества выравнивания на
уровне предложений (слов, словосочетаний), а также для обучения и тестирования
программ по извлечению многоязычной информации и многоязычных
классификаторов предметных областей [63].
Благодаря
корпусным
исследованиям
были
разработаны
и
усовершенствованы программные средства для профессиональных переводчиков
и пользователей систем машинного перевода [42]. Ярким примером прогресса в
области корпусных исследований в лексикографии вообще и переводной
лексикографии в частности является корпусный менеджер SketchEngine
(www.sketchengine.co.uk). На данный момент в этой системе разработаны
специальные модули для работы с параллельными корпусами текстов, а также
5
переводными терминами и терминологическими словосочетаниями (модули
Bilingual terminology extraction и Bilingual Wordsketches) [51].
Таким образом, проблема, рассматриваемая в данной работе, является
многосторонней и включает в себя такие аспекты, как использование
многоязычных параллельных корпусов текстов в исследованиях по терминологии,
создание
многоязычных
терминологических
ресурсов
(переводных
терминологический словарей, многоязычных терминологических банков, баз
данных), оценка переводной терминологии, методы выделения терминов в
многоязычных корпусах текстов, современные инструменты для работы с
многоязычными корпусами текстов и переводной терминологией.
Целью данного исследования является разработка методики выделения
кандидатов (терминов и терминологических словосочетаний) для многоязычного
(англо-франко-русского) терминологического словаря на основе многоязычного
параллельного корпуса текстов.
Для достижения поставленной цели было необходимо решить следующие
теоретические и практические задачи:
1. Описать понятие термина-кандидата для переводного терминологического
словаря;
2. Описать методы и алгоритмы извлечения переводных терминов-кандидатов
из многоязычных параллельных корпусов текстов;
3. Выявить особенности построения терминов и терминологических
словосочетаний и их переводных эквивалентов в английском, русском и
французском языках (на примере гуманитарной области знаний);
4. Разработать алгоритм выделения терминов-кандидатов и их переводных
эквивалентов из многоязычного параллельного корпуса текстов;
5. Проверить работу данного алгоритма на основе англо-франко-русского
корпуса международных юридических текстов и оценить его эффективность.
Объектом исследования являются термины и терминологические
словосочетания в многоязычных специальных корпусах текстов. Предмет
исследования – переводные термины-кандидаты для многоязычного
терминологического словаря. В данной работе используются такие методы, как
статистический, лексикографический, сопоставительный анализ и эксперимент.
Материалом исследования является параллельный англо-франко-русский
корпус
международных
юридических
текстов
объёмом
412 000
словоупотреблений.
Теоретическая значимость работы определяется разработкой методики
выделения переводных терминов-кандидатов на базе многоязычного
параллельного корпуса текстов, сочетающей использование морфосинтаксических
6
шаблонов и статистических метрик. Практическая значимость данного
исследования заключается в том, что полученные результаты могут
использоваться для создания переводных терминологический словарей,
расширения существующих многоязычных терминологических ресурсов, а также
для создания лингвистических баз данных для систем машинного перевода.
Данная работа состоит из введения, трёх глав, заключения, списка
литературы из 65 названий и четырёх приложений. В первой главе
рассматриваются теоретические вопросы, связанные с выделением терминов и
терминологических словосочетаний в параллельных корпусах текстов. Вторая
глава посвящена описанию методики извлечения терминов-кандидатов для
многоязычного терминологического словаря. В третьей главе описан эксперимент
по извлечению переводных терминов-кандидатов из англо-франко-русского
корпуса международных текстов и представлен анализ алгоритма выделения
кандидатов в термины, разработанного в рамках данного исследования, и оценка
полученных результатов.
7
Глава 1. Выделение терминов и терминологических
словосочетаний в параллельных корпусах текстов
1.1. Понятие термина и кандидата в термины
В наиболее общем смысле термин – это слово или словосочетание, которое
соотносится с определённым понятием в какой-либо отрасли знаний [20, с. 265].
Согласно определению в теории языков для специальных целей, термин – это
единица конкретного естественного или искусственного языка, которая обладает
в результате стихийно сложившейся или особой коллективной договорённости
специальным терминологическим значением. Это значение отражает основные и
наиболее существенные признаки понятия, с которым соотносится термин [14, с.
42]. Наиболее важными признаками терминов являются его соотнесённость с
конкретным научным понятием, точность значения и системность, т.е.
вовлечённость в терминосистему. К термину также предъявляются такие
требования, как формальная краткость, однозначность, независимость от
контекста и стилистическая нейтральность, однако на практике такие требования
соблюдаются не всегда [18, с. 44].
В корпусной лингвистике общепринятым является понятие «кандидат в
термин», или «термин-кандидат», а под выделением терминов и
терминологических словосочетаний в корпусах текстах чаще всего
подразумевается выделение именно терминов-кандидатов. Этот факт объясняется
тем, что термин не существует вне терминосистемы [14, с. 52]: определение того,
является ли слово или словосочетание термином в конкретных текстах, зависит от
характера его связи с понятием и его положением в терминосистеме, т.е. от того,
соотносится ли данное слово или словосочетание с конкретным научным
понятием, которое отражено в заранее построенной логико-понятийной системе
[20, с. 270]. Кроме того, оценка «терминологичности» того или иного слова или
словосочетания осуществляется при совместном участии лингвиста и специалиста
в определённой области знаний, поэтому напрямую об автоматическом
выделении терминов в корпусах текстах говорить нельзя.
При извлечении терминологии из параллельного корпуса текстов,
представляющего собой совокупность документов, переведённых на два и
несколько языков [6, с. 1] и чаще всего выровненных на уровне предложений
и/или слов, к терминам-кандидатам применяется следующие критерии.
Во-первых, в качестве терминов-кандидатов принимаются именные группы,
то есть имена существительные и словосочетания с существительным в качестве
главного слова [4] вследствие того, что номинативный характер термина является
одним из его важных отличительных признаков [16, с. 29–30]. Во-вторых,
кандидат в термин должен обозначать объект или действие, релевантное для
8
данной области знаний, т.е. входить в контекст определённой предметной области
[52, с. 500]. В-третьих, термин-кандидат в параллельном корпусе текстов должен
иметь адекватные переводные эквиваленты и переводиться последовательно;
иными словами, перевод термина-кандидата должен носить системный характер.
Наконец,
термин-кандидат,
представляющий
собой
терминологическое
словосочетание, должен иметь высокую степень связанности, совместной
встречаемости образующих его компонентов.
1.2. Термин в переводном многоязычном словаре
Одним из наиболее важных типов терминологических словарей – переводной,
или толково-переводной, словарь, который позволяет получить информацию о
слове, обозначаемом им понятии и его переводном эквиваленте на другом языке
(в случае двуязычного словаря) или на нескольких других языках (в случае
словаря многоязычного). В терминоведческой деятельности немаловажную роль
играет перевод научно-технической литературы, поэтому переводные
терминологические словари являются важным источником при переводе
специального текста [20, с. 255].
Перевод научно-технического текста предполагает поиск переводных
эквивалентов для того или иного термина в языке-источнике. При отсутствии
эквивалента в переводном языке возникает проблема создания нового термина,
который наиболее полно отражает значение термина в языке-источнике. Новый
термин может быть создан следующими способами:
на основе слов общего, неспециального языка, которые приобретают таким
образом новую семантику (например, слово русского языка дерево стало
использоваться в качестве термина информатики и теории классификации), в
том числе и при использовании различных словообразовательных ресурсов
переводного языка (термины минералогии кристалличность, радужник,
хрупкость);
путём прямого заимствования из языка-источника (например, термины
информатики, заимствованные из английского языка – апгрейд, декремент,
интерфейс; термины лингвистики, заимствованные из греческого языка –
фонология,
фонетика,
тема,
рема;
термины
кораблестроения,
заимствованные из нидерландского языка – ахтерштевень, верфь, фал и т.д.);
с помощью семантического или структурного, словообразовательного
калькирования (термин информатики древовидная структура образован
путём семантического калькирования от английского термина tree structure;
термин географии полуостров образован путём словообразовательного
калькирования от немецкого термина Halbinsel).
9
В настоящее время многие термины, в частности, в таких отраслях, как
информатика и информационные технологии, возникают в английском языке, а
затем переводятся на другие языки. Из-за различий в морфологии языков и
несоответствия традиций в области терминологии, принятых в том или ином
языке, сопоставление переводных эквивалентов терминам английского языка не
всегда является последовательным и систематичным. Вследствие этого возникает
проблема стандартизации и унификации многоязычных терминов. Авторы [34]
указывают на то, что при сопоставлении терминов в разных языках должны
соблюдаться следующие принципы:
•
•
•
•
•
принцип семантического соответствия;
принцип формального соответствия;
принцип функционального соответствия;
принцип распространённости терминов («term dissemination»);
принцип соответствия терминологической традиции.
Принцип семантического соответствия заключается в том, что при создании
терминологических переводных эквивалентов необходимо учитывать семантику
моделей, по которым строятся термины, характерных для системы того или иного
языка. Принцип формального соответствия состоит в том, что слова, имеющие
одинаковую форму в исходном языке, должны иметь одинаковую форму и в языке
перевода. Создание новых терминов должно опираться на устойчивые
словообразовательные модели данного языка. Принцип функционального
соответствия включает в себя краткость термина, простоту его использования и
его благозвучие. При заимствовании термина из другого языка или создания
нового термина необходимо учитывать простоту использования термина с точки
зрения его морфологических (склонение) и лексических (сочетаемость с другими
словами) свойств. Согласно принципу распространённости, термины должны
широко использоваться в научной письменной и устной речи, т.е. обладать
высокой
частотой
встречаемости.
В
соответствии
с
принципом
терминологической традиции, создание нового термина должно опираться на
принятые в данном языке терминологические принципы и учитывать
предыдущий опыт формирования терминологии.
Авторы [34] предлагают также ряд практических указаний, в соответствии с
которыми необходимо проводить соответствие между терминологическими
переводными эквивалентами в разных языках, однако подчёркивают, что данные
принципы не являются универсальными и абсолютными:
один термин исходного языка должен соответствовать одному конкретному
термину в языке перевода;
разным терминам языка-источника должны соответствовать разные
термины языка перевода;
10
если термин исходного языка неоднозначен, то в качестве переводного
эквивалента в языке перевода должно быть выбрано слово со сходной
степенью неоднозначности;
новый термин должен соответствовать данной терминосистеме и иметь
сходство с аналогичными и родственными ему терминами;
переводные эквиваленты должны быть связаны отношением обратимости,
т.е. при переводе термина на исходный язык должен использоваться тот же
термин, к которому был подобран данный переводной эквивалент;
при заимствовании термина из языка-источника необходимо учитывать то,
как он включается в систему языка перевода с точки зрения семантики,
фонетики и морфологии;
при выборе между заимствованными эквивалентами и словами,
принадлежащими языку перевода (исконными словами), необходимо
отдавать предпочтение исконными словам.
Таким образом, при работе с многоязычной переводной терминологией
важную роль играет поиск адекватных переводных эквивалентов, их
стандартизация и унификация.
1.3. Методы выделения терминов-кандидатов в корпусах текстов
В корпусной лингвистике были разработаны различные методы извлечения
кандидатов в термины и терминологические словосочетания из корпусов текстов.
Подходы, описанные в данной работе, являются общепринятыми и широко
используемыми в современных корпусных исследованиях.
1.3.1. Методы выделения однословных терминов-кандидатов в корпусах
текстов
Основным методом извлечения однословных кандидатов в термины из
корпусов текстов является метод относительной частоты. Показатель
«терминологичности» того или иного слова – это его относительная частота в
специальном корпусе текстов по сравнению с его частотой в общем
(общеязыковом, неспециальном) корпусе текстов. Слова, которые встречаются в
специальном тексте с высокой относительной частотой, образуют список
терминов-кандидатов предметной области, к которой принадлежит данный текст.
Таким образом, слово, редко встречающееся в общем корпусе, но при этом широко
представленное в тексте какой-либо отрасли знаний – хороший кандидат на роль
термина. При этом существует более сложный метод относительной частоты,
учитывающий равномерное/неравномерное распределение терминов в тексте.
Не менее эффективным оказывается и выделение однословных терминовкандидатов на основе простой частоты («raw frequency») слова и использовании
11
порогового значения статистической значимости [37; 58; 62]. Недостаток данного
метода заключается в том, что таким образом выделяется ограниченное число
кандидатов в термины (извлекаются только те слова, которые встречаются в
корпусе определённое число раз) и отсекаются слова с низкой частотой
встречаемости, которые, тем не менее, могут быть терминами.
1.3.2. Методы выделения терминологических словосочетаний в корпусах
текстов
Среди подходов к выделению терминологических словосочетаний
(многословных терминов) в корпусах текстов основными являются (1)
статистический метод, основанный на подсчёте частоты совместной
встречаемости компонентов словосочетания и мерах ассоциации, (2)
лингвистический метод, в основе которого лежит использование определённых
морфосинтаксических шаблонов и (3) смешанный метод, который предполагает
сочетание статистического и лингвистического методов.
1.3.2.1. Статистический метод
В корпусной лингвистике широко применяется статистический метод
выделения терминологических словосочетаний. Этот подход основан, прежде
всего, на использовании мер ассоциации, которые позволяют установить, является
ли совместная встречаемость слов случайной или она статистически значима.
Меры ассоциации (MI (mutual information), t-score, z-score, log-likelihood, chisquare (χ2)), описанные в работах [37; 41; 54; 56; 58], используются главным
образом для выделения коллокаций, статистически устойчивых словосочетаний
[29, с. 63]. Однако, как подтверждается в работе [37], статистические меры могут
быть использованы и для выделения терминологических словосочетаний.
Наиболее эффективной с точки зрения извлечения терминологии является
мера log-likelihood (логарифмическая функция правдоподобия) [37, p. 40, 45]. В
отличие от других статистических мер, в частности, от меры MI, которая имеет
свойство завышать статистическую значимость редких словосочетаний,
логарифмическая функция правдоподобия оказывается более эффективной для
выделения как редких, так и высокочастотных словосочетаний [58, p. 43]. Согласно
[37, p. 40] мера log-likelihood осуществляет ранжирование на основе частоты
встречаемости компонентов словосочетания и эффективно работает как на
больших корпусных данных, так и на данных небольшого объёма.
Кроме того, наиболее простой статистический показатель – частота
совместной встречаемости – оказывается во многих случаях не менее
эффективным, чем сложные меры ассоциации [58, p. 42 – 44]. В работе [37, p. 45]
отмечается, что простая частота совместной встречаемости слов является
12
хорошим показателем терминологического характера словосочетаний. Тем не
менее, использование данного статистического показателя не позволяет выделить
редкие словосочетания, которые могут оказаться терминами. Как отмечает [58, p.
34], большую часть словосочетаний в корпусе текстов составляют словосочетания,
которые встречаются один или два раза, но могут быть релевантными терминамикандидатами.
Статистический метод часто используется при выделении многословных
терминов, но даёт ограниченные, неполные результаты и приводит к достаточно
большому количеству шума в конечных данных. Преимущество данного подхода
заключается в том, что его можно применять к неразмеченным корпусам текстов.
Стоит отметить, что качество выделяемых словосочетаний существенно
повышается при использовании лингвистической информации.
1.3.2.2. Лингвистический метод
В основе лингвистического метода лежит предположение о том, что
терминологические словосочетания строятся по более или менее закреплённым
морфосинтаксическим шаблонам – образцам построения терминологических слов
и словосочетаний [17, с. 125], характерным для конкретного языка. Иными
словами, лингвистические критерии учитывают типичную структуру именных
терминологических словосочетаний (частеречную принадлежность составных
элементов термина, синтаксические связи между ними). Необходимость
использования морфосинтаксических шаблонов при выделении словосочетаний
обуславливается в работах [43, p. 181], [58, p. 46]: авторы подчёркивают важность
определения грамматических характеристик компонентов словосочетаний и
установления между ними синтаксических отношений.
В рамках лингвистического подхода широкое распространение получил язык
шаблонов LSPL. Данный язык задаёт последовательность элементов-слов, из
которых состоит описываемая языковая конструкция, а также указывает условия
синтаксического согласования этих элементов. Так, Е.И. Большакова [9] выделила
основные морфосинтаксические образцы терминологических словосочетаний для
русского языка (каждый шаблон фиксирует часть речи входящих в термин слов и
их морфологические характеристики):
A1 N1 <A1 = N1> (N1) – словосочетание из существительного и
согласованного с ним прилагательного (опорная точка);
N1 N2<c = gen> (N1) – словосочетание из двух существительного, второе из
которых стоит в родительном падеже (период упреждения);
N1 A2 N2<c= gen> <A2 = N2> (N1) – словосочетание из трёх слов: двух
существительных, второе из которых стоит в родительном падеже, и
13
прилагательного, согласованном со вторым существительным (технология
двойной накачки).
П. Браславский [10] выделяет следующие типы шаблонов:
[сущ. + прил.(Р.п.) + сущ.(Р.п.)] – словарь иностранных слов;
[прил. + прил. + сущ.] – тепловая импульсная сварка;
[прил. + сущ. + сущ.(Р.п.)] – автоматическая обработка текстов;
[сущ. + сущ.(Р.п.) + сущ.(Р.п.)] – методы нанесения покрытий;
[прил. + сущ.] – файловая система;
[прич. + сущ.] – вытесняющая многозначность;
[сущ. + сущ.(Р.п.)] – менеджер памяти;
[сущ. + сущ. (Т.п.)] – управление ресурсами;
[сущ. + ‘-‘ + сущ.] – файл-сервер.
К лингвистическому подходу выделения терминологических словосочетаний
относится метод графовых моделей [28], который включает в себя следующие
этапы. Сначала на основе текста выполняется построение взвешенного
неориентированного графа, вершинами которого являются слова данного текста,
а рёбрами – связи между ними. Затем производится ранжирование вершин графа и
сборка словосочетаний на основе вершин, имеющих наибольший вес. При сборке
словосочетаний обязательное требование к последовательностям слов
заключается в том, чтобы словосочетание включало в свой состав хотя бы одно
имя существительное. Наконец, из общего набора словосочетаний выбираются
наиболее значимые последовательности слов, которые могут считаться
терминами-кандидатами исходного текста. В основе метода графовых моделей
лежит наблюдение, что два слова, расположенные рядом в тексте, связаны друг с
другом семантическими отношениями.
В некоторых работах выделяют также семантические методы извлечения
терминов и терминологических сочетаний с опорой на их семантическую близость
(WordNet для английского языка, RussNet для русского языка) [24], однако до сих
пор такие методы не получили широкого распространения.
Эксперименты
по
выделению
терминологических
словосочетаний
показывают, что использование информации о лексических и синтаксических
особенностях
терминоупотреблений
повышает
точность
и
полноту
автоматического распознавания терминов.
1.3.2.3. Смешанный метод
Многие современные исследования направлены на использование
смешанного метода для извлечения терминов-кандидатов из корпусов текстов.
Данный подход заключается в совместном использовании статистического и
14
лингвистического методов: в одних случаях словосочетания сначала выделяются
на основе их лингвистических характеристик, а их терминологический характер
оценивается с помощью статистических мер ассоциации; в других случаях
морфологические, синтаксические фильтры применяются после статистической
обработки текстов и выделения статистически значимых словосочетаний [32].
Таким образом, смешанный метод опирается на лингвистический анализ,
предварительную лингвистическую обработку текста или последующую
обработку уже выделенных словосочетаний. Лингвистическая обработка может
включать в себя и сочетать такие типы анализа, как лемматизация,
морфологическая и синтаксическая разметка корпуса текстов [58, p. 45].
Лемматизация предполагает объединение словоформ в единую лексическую
единицу, благодаря чему подсчёт статистических мер ассоциации осуществляется
не для слов в их определённой грамматической форме, а для лемм [47, p. 250].
Лемматизация позволяет более эффективно выявлять словосочетания,
компоненты которых отличаются высокой степенью связанности [64], и приводит
к выделению статистически более значимых кандидатов в термины [41, p. 35].
Объединение словоформ в леммы является особенно важным для языков с
развитой морфологией [58, p. 45].
Морфологическая разметка корпуса текстов часто сводится к его частеречной
разметке, благодаря которой из дальнейшего анализа исключаются
последовательности слов, образующие шум в конечных данных: например,
сочетание глагола и предлога, сочетание предлога и артикля. Многие
исследования [35; 37; 59] показывают, что предварительная частеречная разметка
текстов при использовании статистических мер ассоциации значительно
улучшает качество выделения терминов-кандидатов.
Лингвистическая обработка на уровне синтаксиса представляет собой
сложную процедуру установления и анализа синтаксических отношений в корпусе
текстов на поверхностном (поверхностный синтаксический анализ) или
глубинном (глубинный синтаксический анализ) уровне. Поверхностный
синтаксический
анализ
позволяет
получить
относительно
простые
синтаксические структуры типа именных групп, тогда как глубинный
синтаксический анализ предполагает построение полной синтаксической
структуры предложения, включая определение предикатно-аргументных
отношений. По сравнению с частеречной разметкой корпуса текстов,
синтаксический анализ считается более эффективным, но в то же время и более
сложным и труднодоступным средством для выделения терминов-кандидатов [58,
p. 47].
Таким образом, совместное использование лингвистического анализа и
статистических мер ассоциации приводит к более точному выделению кандидатов
15
в термины, однако требует предварительной обработки текстов на уровне
морфологии и/или синтаксиса, поэтому смешанный метод является более
трудоёмким по сравнению со статистическим и лингвистическим методами.
1.4. Алгоритмы выделения терминов-кандидатов на базе многоязычных
параллельных корпусах текстов
Задача извлечения многоязычных терминов-кандидатов из параллельных
корпусов текстов решается в разных исследованиях по-разному [48, 49, 65],
однако чаще всего для выделения терминов и их переводных эквивалентов
используется
алгоритм
extract-then-align
(«выделение–выравнивание»),
предложенный в работах по извлечению двуязычной терминологии [36; 39; 44; 46;
53]. При таком подходе термины сначала выделяются отдельно для языкаисточника и языка перевода, а затем сопоставляются с помощью инструментов
выравнивания на уровне слов или предложений.
Авторы [49] рассматривают два варианта реализации данного алгоритма на
примере извлечения терминов-кандидатов из двуязычных параллельных
корпусов текстов: традиционный и расширенный. Традиционный вариант
включает в себя четыре этапа. На первом этапе производится выравнивание
текстов на уровне предложений: между предложениями из текстов на исходном
языке и языке перевода устанавливается соответствие. Стоит отметить, что это не
всегда прямое соответствие, так как одно предложение в тексте на исходном
языке может соответствовать нескольким предложениями в тексте на языке
перевода, и наоборот. Второй этап – морфологическая разметка параллельного
корпуса текстов. Третий этап, наиболее сложный и трудоёмкий, представляет
собой выравнивание корпуса на уровне слов, т.е. установление соответствий
между словами в уже выровненных предложениях. Как и при выравнивании
текстов на уровне предложений, соответствие между словами может быть
непрямым: словосочетание в тексте на языке оригинала может соответствовать
отдельному слову в тексте на языке перевода, и наоборот, отдельное слово в
одном языке может переводиться словосочетанием в другом языке. Выравнивание
параллельных текстов на уровне слов может выполняться в двустороннем
направлении. Например, для англо-русского корпуса текстов, выровненного на
уровне предложений, сначала производится выравнивание на уровне слов в
направлении английский – русский, а затем в обратном направлении, с русского на
английский. Затем полученные результаты объединяются, и разрешаются
спорные случаи. Как утверждают авторы [49], выравнивание текстов на уровне
слов в двустороннем направлении позволяет получить более точные соответствия
между переводными эквивалентами. Наконец, на последнем этапе данного
алгоритма на основе оценки простой частотности слов отбираются кандидаты для
конечного двуязычного словаря.
16
Расширенный вариант реализации алгоритма extract-then-align включает в
себя помимо вышеперечисленных этапов ещё один этап – применение метода
относительной частоты для выделения переводных эквивалентов, характерных
для определённой предметной области. Кандидатами в термины для двуязычного
переводного словаря считаются только те слова, которые отличаются более
высокой частотой встречаемости в корпусе текстов данной отрасли знаний по
сравнению с общим, неспециальным корпусом текстов. Таким образом, на данном
этапе из параллельного корпуса текстов выделяются кандидаты в термины,
которые затем сопоставляются со списком слов, полученном на этапе извлечения
двуязычного словаря. Слова, которые встречаются в обоих списках (в списке
кандидатов в термины и в списке слов двуязычного словаря), признаются для
данного параллельного корпуса текстов релевантными переводными
эквивалентами, характеризующими конкретную предметную область, т.е.
переводными терминами-кандидатами. На основании проведённого эксперимента
авторы [49] утверждают, что по сравнению с традиционным вариантом
расширенный вариант реализации данного алгоритма является более
эффективным и отличается более высокой точностью выделения переводных
кандидатов в термины [49, p. 2777].
Авторы другого исследования [48] предлагают реализовать алгоритм extractthen-align следующим образом. На первом этапе выделяются термины и
терминологические словосочетания в текстах на каждом из рассматриваемых
языков, входящих в состав параллельного корпуса. Однако в отличие от
большинства разработанных алгоритмов для извлечения терминологии, в данном
случае не используются заранее заданные морфосинтаксические шаблоны
терминов. Релевантность выделенных терминов-кандидатов оценивается с точки
зрения их независимости от внешнего контекста (external independence) и
внутренней связанности (internal coherence). Независимость от внешнего
контекста определяется на основании того, насколько часто тот или иной термин
встречается в разных контекстах. Под внутренней связанностью понимается
показатель того, насколько компоненты, входящие в состав терминологического
словосочетания, имеют тенденцию к совместной встречаемости. Внутренняя
связанность оценивается с помощью статистической меры ассоциации MI (mutual
information). На втором этапе осуществляется сопоставление выделенных из
текстов терминов-кандидатов, в основе которого лежит статистиковероятностный подход. В частности, используется метод предварительного
преобразования и обработки данных (data reduction), а также выборочный метод
на основе подкорпусов (sub-corpora sampling) [48, p. 4019]. Иными словами,
алгоритм extract-then-align может быть реализован в качестве статистического
алгоритма выделения терминов-кандидатов и установления переводных
соответствий между ними.
17
Итак, алгоритм extract-then-align реализуется по-разному в зависимости от
исследовательских и практических задач, но, в целом, сводится к двум основным
этапам – извлечению из исходного и переводного языков кандидатов в термины и
установление переводных соответствий между выделенными терминамикандидатами.
1.5. Многоязычные терминологические базы данных
Наряду с терминологическими переводными словарями важным
лексикографическим ресурсом при работе с многоязычной терминологией
являются терминологические базы данных [38, p. 1]. Терминологические базы
данных (termbases, ТБД) представляют собой базы данных, которые в качестве
данных содержат ключевые термины и их метаданные:
значение термина;
переводные эквиваленты термина на других языках;
синонимы термина (с указанием их характера – допустимые или
недопустимые);
сведения об области применения термина;
сведения о документе, которым утверждён данный термин
(национальный, международный стандарт и т.д.).
Большую ценность для перевода научно-технической литературы
представляют собой многоязычные терминологические базы данных с открытым
доступом. Среди открытых сетевых ТБД наиболее важными являются следующие.
Терминологическая база данных ИСО (ISO Concept Database, ISO/CDB) (доступ
по адресу http://cdb.iso.org/)
Терминологическая
база
ISO/CDB,
многоязычная
концептуальнотерминологическая база данных, была создана Международной организацией по
стандартизации ISO для поиска, разработки и поддержки терминологии во всех
стандартах ISO. Данная ТБД позволяет осуществлять поиск на английском,
французском, русском, испанском и немецком языках по таким категориям, как
термины и их определения, графические символы и коды (языков, стран, валют
и.т.д).
IATE (InterActive Terminology for Europe) (интерактивная терминологическая
база Евросоюза) (доступ по адресу http://iate.europa.eu/)
IATE – многоязычная терминологическая база Европейского союза, содержит
более 1 млн терминов на 23 официальных языках Евросоюза. Данный ресурс
используется в организациях и учреждениях стран Евросоюза и служит для
унификации, стандартизации и распространения специальных терминов,
18
связанных с деятельностью Европейского союза. Эта система объединяет
существующие терминологические базы данных переводческих организаций и
официальных учреждений Евросоюза.
UNITERM, The United Nations Terminology Database (терминологическая база
данных ООН) (доступ по адресу http://untermportal.un.org/)
UNITERM – многоязычная терминологическая база данных, которая содержит
терминологию и номенклатуру предметных областей, относящихся к
деятельности ООН. В настоящее время в системе представлены специальные
термины и терминологические сочетания на шести официальных языках
(английской, французском, испанском, русском, китайском и арабском). UNITERM
представляет собой открытый лингвистический ресурс для более эффективной
работы с официальными документами ООН. На данный момент в UNITERM
представлено более 85 000 терминов.
Терминологическая база
http://www.eurotermbank.com/)
данных
EuroTermBank
(доступ
по
адресу
EuroTermBank – многоязычный банк терминов, созданный для гармонизации
терминоведческой деятельности в странах Европейского союза. В настоящее
время EuroTermBank включает более 2,6 терминов на 33 европейских языках. В
основе данного лексикографического ресурса находятся электронные документы,
а также оцифрованные версии печатных словарей. Особое внимание при создании
данной терминологической базы было уделено языкам с небольшим или
недостаточным количеством ресурсов. К наиболее хорошо обеспеченным в плане
терминологии языкам в EuroTermBank относятся английский, русский, немецкий,
латышский и польский языки.
Multilingual Archival Terminology (многоязычная терминология архивных
документов) (доступ по адресу http://www.ciscra.org/mat/)
Multilingual Archival Terminology – электронный ресурс многоязычных
терминов и их определений в области архивного дела. Основная задача этой
терминологической базы данных – максимально широко представить
многообразие терминов архивного дела и документоведения и отразить
специфику данной отрасли в разных странах. В настоящее время Multilingual
Archival Terminology позволяет осуществлять поиск на 23 языках, в том числе на
английском, французском, русском, китайском, финском, арабском, немецком и
греческом. Данный ресурс отражает актуальную информацию о терминах
архивного дела благодаря возможности добавлять и редактировать термины и их
определения.
19
ITU Terms and Definitions (терминология международного союза электросвязи
(МСЭ))
(доступ
по
адресу
http://www.itu.int/net/ITUR/index.asp?redirect=true&category=information&rlink=terminologydatabase&lang=en&adsearch=&SearchTerminology=&collection=§or=&language=all
&part=abbreviationterm&kind=anywhere&StartRecord=1&NumberRecords=50)
ITU Terms and Definitions представляет собой электронный ресурс, который
содержит аббревиатуры, термины и их определения в сфере коммуникации.
Данная система позволяет осуществлять поиск на шести языках (английском,
арабском, китайском, испанском, русском и французском) и предоставляет ссылки
на источники терминов – публикации ITU (Международного союза электросвязи).
В настоящее время в ITU Terms and Definitions содержится около 130 000 терминов
и аббревиатур.
IMF Terminology, a multilingual directory (терминологическая база данных
Международного
валютного
фонда)
(доступ
по
адресу
http://www.imf.org/external/np/term/eng/index.htm)
IMF terminology – электронный ресурс, разработанный в рамках деятельности
Международного валютного фонда. На данный момент содержит более 150 000
терминов и терминологических словосочетаний, характерных для таких
предметных отраслей, как банковское дело и финансы. Данная терминологическая
база работает с 9 языками – английским, французским, русским, испанским,
арабским, китайским, португальским, немецким и японским.
METEOTERM
(доступ
http://wmo.multicorpora.net/MultiTransWeb/Web.mvc)
по
адресу
METEOTERM
–
терминологическая
база
данных
Всемирной
метеорологической организации, содержит специальные термины метеорологии и
климатологии на шести языках (английском, французском, русском, китайском,
арабском и испанском). Источниками данного ресурса являются Международный
метеорологический словарь, Международный словарь по гидрологии, а также
термины, которые встречаются в официальных документах и отчётах Всемирной
метеорологической организации.
Microsoft Language Portal (языковой портал Microsoft) (доступ по адресу
http://www.microsoft.com/Language/en-US/Default.aspx)
Microsoft Language Portal – электронный ресурс для поиска терминов
компании Miscrosoft и общей терминологии в сфере информационных технологий.
Данный портал содержит порядка 25 000 терминов на 100 языках и их
определения на английском языке. Microsoft Language Portal используется для
унификации и стандартизации терминов, связанных с разработкой и интеграцией
20
приложений в среде Miscrosoft, а также может служить основой для создания
многоязычных глоссариев в сфере IT.
MINÉFITERM (доступ по адресу http://www.minefiterm.finances.gouv.fr/)
MINÉFITERM – терминологическая база данных Центра переводов при
Министерстве экономики и финансов и Министерстве бюджета, государственных
счетов и гражданской администрации Франции. В настоящее время содержит
порядка 60 000 терминов на французском, английском, испанском, немецком,
итальянском, португальском, русском, голландском, китайском, японском и
арабском языках. Данная система является открытой и позволяет добавлять и
редактировать термины и их определения.
WIPO Pearl (доступ по адресу http://www.wipo.int/reference/en/wipopearl)
WIPO Pearl – многоязычный терминологический портал Всемирной
организации интеллектуальной собственности, который включает специальные
термины патентов на 10 языках (арабском, китайском, английском, французском,
немецком, японском, корейском, португальском, русском и испанском). Данный
ресурс позволяет осуществлять поиск в двух режимах – поиск по термину и поиск
по понятию (concept map search, концептуальный поиск). Концептуальный поиск
представляет собой поиск по графу, который отображает семантические
отношения между терминами. На данный момент WIPO Pearl содержит около 16
000 понятий и 105 000 терминов.
Многоязычные терминологические базы данных занимают важное место
среди лексикографических ресурсов для переводческой деятельности в сфере
специальной терминологии. ТБД не только являются источником терминов и их
переводных эквивалентов, но и выполняют функцию стандартизации и
гармонизации многоязычной терминологии.
1.6. Выводы
Переводной термин-кандидат в корпусной лингвистике – это слово или
словосочетание, которое представляет собой именную группу, обозначает понятие
определённой предметной области, имеет адекватные переводные эквиваленты и
высокую степень связанности входящих в его состав элементов.
В задачах извлечения терминологии из корпусов текстов используются
статистический, лингвистический и смешанный методы. Применение
статистического метода основано на предположении о том, что термины
отличаются от слов неспециального языка статистическими признаками, поэтому
для выделения терминов-кандидатов используются различные статистические
показатели (простая частота, относительная частота, меры ассоциации). В основе
21
лингвистического метода лежит наблюдение, что термины строятся по
определённым морфосинтаксическим шаблонам, характерным для конкретного
языка. Смешанный метод представляет собой совместное использование
статистического и лингвистического методов. В одних случаях после
статистической
обработки
текстов
применяются
морфологические
и
синтаксические
фильтры
для
выделения
статистически
значимых
словосочетаний, соответствующих заданному морфосинтаксическому шаблону. В
других случаях статистические меры подсчитываются для списка терминовкандидатов, извлечённых с помощью лингвистического метода.
Для выделения терминов-кандидатов и их переводных эквивалентов в
многоязычных параллельных корпусах текстов используется алгоритм extractthen-align («выделение–выравнивание»), который включает в себя два этапа –
извлечение кандидатов в термины отдельно для исходного языка и языка
перевода и установление переводных соответствий между выделенными
терминами-кандидатами.
22
Глава 2. Методика извлечения терминов-кандидатов для
многоязычного терминологического словаря
2.1. Методы исследования
Основная задача данного исследования заключается в разработке методики
выделения переводных терминов-кандидатов из многоязычного (англо-франкорусского) параллельного корпуса текстов. Решение этой задачи осуществляется с
помощью
алгоритма
extract-then-align
(«выделение–выравнивание»),
включающего в себя два основных этапа: извлечение кандидатов в термины для
каждого языка в составе многоязычного корпуса и установление переводных
соответствий между выделенными терминами-кандидатами.
Для выделения терминов-кандидатов из корпуса текстов используется
смешанный метод извлечения терминологии, который сочетает в себе
использование морфосинтаксических шаблонов, характерных для конкретного
языка, и подсчёт статистических метрик. Таким образом, для списка кандидатов в
термины, выделенных с помощью заданных морфосинтаксических шаблонов,
применяется статистический фильтр.
Установление переводных соответствий между извлечёнными из корпуса
текстов кандидатами выполняется на основе метода опорного языка (метод
языка-посредника, pivot-based approach), описанного в работах [30; 31]. В
соответствии с данным методом каждый из языков в многоязычном (в данном
случае, англо-франко-русском) корпусе текстов используется для проверки
соответствия между переводными эквивалентами в других языках. Иными
словами, делается предположение о том, что слова/словосочетания являются
переводными эквивалентами, если они представляют собой переводы одного и
того же слова/словосочетания в других языках.
2.2. Морфосинтаксические шаблоны
Одной из задач данного исследования является определение особенностей
построения терминов и терминологических словосочетаний в английском,
французском и русском языках, на примере гуманитарной области знаний. Цель
данного анализа состоит в том, чтобы сформировать конечный набор
морфосинтаксических шаблонов для выделения терминов-кандидатов в текстах
на английском, французском и русском языках.
Задача данного анализа заключалась, во-первых, в том, чтобы установить,
какие из морфосинтаксических шаблонов, по которым строятся термины и
терминологические сочетания гуманитарной предметной области, являются
наиболее частотными в английском, французском и русском языках, а также какие
23
соответствия существуют между переводными эквивалентами данных языков.
Исследовались термины и n-граммы терминов, где n – число знаменательных слов
(предлоги и союзы не учитывались как самостоятельные компоненты терминов).
Как было указано выше, терминами в данном исследовании считаются именные
группы, т.е. существительное или словосочетания с существительным в качестве
главного слова.
В
работе
были
проанализированы
следующие
переводные
терминологические словари: Терминологическая база данных по военной реформе
[27] и Экономический и коммерческий словарь [8]. Терминологическая база
данных по военной реформе была создана при поддержке Специальной рабочей
группы по военной реформе СРН (Совет Россия-НАТО) и Военного университета
Министерства обороны РФ (Москва). Данная терминологическая база,
включающая термины на английском, французском и русском языках, была
разработана с целью стандартизации и унификации переводных терминов,
которые возникли в результате сотрудничества России со странами НАТО. В
настоящее время терминологическая база данных по военной реформе включает в
свой состав термины, источниками которых являются рабочие документы Совета
Россия-НАТО, а также другие авторитетные источники в этой предметной области.
Англо-франко-русский экономический и коммерческий словарь, в свою очередь,
включает в себя основные термины экономического и коммерческого права, а
также тематический словарь основных видов экономической и коммерческой
деятельности.
Источники
англо-франко-русского
экономического
и
коммерческого словаря – профессиональная документация и статьи прессы в
сфере экономики и финансового дела.
2.2.1. Анализ морфосинтаксических шаблонов на основе переводных словарей
Частотный анализ в Терминологической базе данных по военной реформе
проводился для 1005 терминов и терминологических словосочетаний. Процентное
соотношение между n-граммами терминов в данной ТБД для английского,
французского и русского языков представлено на следующих диаграммах (см.
Диаграмма 1, Диаграмма 2, Диаграмма 3).
24
2% 1% 2%
однословные термины
биграммы
11%
8%
триграммы
21%
4-граммы
5-граммы
55%
6-граммы
термины из 7 и более слов
Диаграмма 1. Процентное соотношение между n-граммами терминов в
Терминологической базе данных по военной реформе для английского языка
2% 2% 2%
однословные термины
12%
9%
биграммы
триграммы
4-граммы
22%
5-граммы
51%
6-граммы
термины из 7 и более слов
Диаграмма 2. Процентное соотношение между n-граммами терминов в
Терминологической базе данных по военной реформе для французского языка
2% 2%
6%
однословные термины
7%
биграммы
11%
триграммы
4-граммы
25%
47%
5-граммы
6-граммы
термины из 7 и более слов
Диаграмма 3. Процентное соотношение между n-граммами терминов в
Терминологической базе данных по военной реформе для русского языка
25
Таким образом, в данной терминологической базе данных наиболее
частотными для английского, французского и русского языков оказались
биграммы и триграммы, наименее частотными – более сложные термины,
состоящие из пяти и более слов.
В Экономическом и коммерческом словаре были проанализированы 1920
терминов и терминологических словосочетаний. На следующих диаграммах
представлено соотношение между n-граммами в данном словаре для английского,
французского и русского языков (см. Диаграмма 4, Диаграмма 5, Диаграмма 6).
<1%
1%
однословные термины
5%
биграммы
47%
47%
триграммы
4-граммы
термины из 5 и более
слов
Диаграмма 4. Процентное соотношение между n-граммами терминов в
Экономическом и коммерческом словаре для английского языка
2%
<1%
однословные термины
9%
биграммы
45%
44%
триграммы
4-граммы
термины из 5 и более
слов
Диаграмма 5. Процентное соотношение между n-граммами терминов в
Экономическом и коммерческом словаре для французского языка
26
3% 1%
однословные термины
10%
биграммы
42%
триграммы
4-граммы
44%
термины из 5 и более
слов
Диаграмма 6. Процентное соотношение между n-граммами терминов в
Экономическом и коммерческом словаре для русского языка
Как видно из представленных диаграмм, наиболее частотными в
Экономическом и коммерческом словаре во всех языках являются однословные
термины и биграммы. Триграммы в данном словаре менее частотны, чем в
терминологической базе данных по военной реформе, тогда как 4-граммы и
термины, состоящие из 5 и более слов, являются наименее частотными.
Исследования показывают [37, p. 5–6], что большинство терминов длиной
более двух слов в действительности представляют собой сочетания однословных
терминов или терминологических биграмм. Более того, в соответствии с
результатами анализа, терминологические словосочетания, состоящие из трёх или
более слов, чаще всего строятся по индивидуальным, нетиповым
морфосинтаксическим шаблонам и обладают более низкой частотой
встречаемости по сравнению с терминологическими биграммами. По этим
причинам в данном исследовании приводится анализ морфосинтаксических
шаблонов наиболее частотных конструкций – однословных терминов и
терминологических биграмм.
Однословные термины в английском, французском и русском языках строятся
по
шаблону
существительного
(N).
Морфосинтаксические
шаблоны
терминологических
биграмм,
выделенные
в
результате
анализа
Терминологической базы данных по военной реформе и Экономического и
коммерческого словаря, представлены в Таблицах 1, 2 и 3 для английского,
французского и русского языков соответственно. В каждой таблице указывается:
тип шаблона терминологических биграмм: N – существительное; Adj –
прилагательное; prep – предлог; g, d, a, i, l – показатели падежей русского
языка (родительный, дательный, винительный, творительный, предложный
соответственно);
27
ранг шаблона в Терминологической базе данных по военной реформе (ТБД по
воен. реформе) с указанием процентной доли биграмм, построенных по
данному шаблону, от общего числа биграмм;
ранг шаблона в Экономическом и коммерческом словаре (Эк. и ком. словарь) с
указанием процентной доли биграмм, построенных по данному шаблону, от
общего числа биграмм;
средний ранг шаблона, определённый как среднее арифметическое рангов
шаблонов в данных словарях;
примеры терминологических биграмм, построенных по данному
морфосинтаксическому шаблону, из данных переводных словарей.
Таблица 1
Морфосинтаксические шаблоны терминологических биграмм
английского языка
Шаблон
Ранг [%]
ТБД по воен.
Эк. и ком.
реформе
словарь
Средний
ранг
N+N
1 [46%]
1 [57%]
1
Adj + N
2 [44%]
2 [34%]
2
N + of + N
3 [8%]
3 [5%]
3
N + prep + N
5 [<1%]
4 [3%]
4,5
N + and + N
4 [1%]
5 [<1%]
4,5
N + Adj
5 [<1%]
6 [<1%]
5,5
N’s + N
5 [<1%]
–
5
Примеры
army force, aviation fuel; barter
agreement, account sales
operational
activities,
tactical
employment; wholesale trade, social
work
course of action, interchangeability of
supplies; date of maturity, payer of
contango
law on defence, value for money;
payment at sight, cash with order
research and development, search and
rescue; assets and liabilities, reach and
frequency
accounts payable, accounts receivable;
tax payable
commandant’s
office,
veterans’
payments
28
Таблица 2
Морфосинтаксические шаблоны терминологических биграмм
французского языка
Шаблон
Ранг [%]
ТБД по воен.
Эк. и ком.
реформе
словарь
Средний
ранг
N + de + N
1 [52%]
1 [53%]
1
N + Adj
2 [42%]
2 [36%]
2
N+N
3 [3%]
3 [6%]
3
Adj + N
4 [1%]
4 [3%]
4
N + et + N
5 [<1%]
5 [<1%]
5
Примеры
compte d'avance, armée de terre; traite
de complaisance, agence de publicité
personne déplacée, terrorisme interne;
dispositions administratives, balance
déficitaire
essence aviation, élève officier; services
comptabilité, classe affaires
frais accessoires, grande formation;
petites annonces, mauvaise récolte
recherche et sauvetage, dépenses et
recettes; coût et fret, dommages et
intérêts
Таблица 3
Морфосинтаксические шаблоны терминологических биграмм русского
языка
Шаблон
Ранг [%]
ТБД по воен.
Эк. и ком.
реформе
словарь
Средний
ранг
Adj + N
1 [75%]
1 [62%]
1
N + Ng
2 [19%]
2 [23%]
2
N + prep + Nd
3 [2%]
5 [2%]
4
N + prep + Na
4 [1%]
3 [5%]
3,5
N + prep + Nl
5 [1%]
6 [2%]
5,5
N + prep + Ng
6 [<1%]
4 [3%]
5
N+и+N
6 [<1%]
7 [<1%]
6,5
N + Ni
7 [<1%]
8 [<1%]
8
Примеры
армейская
группировка,
ассимметричная
угроза;
акцептованная тратта, расчетная
группа
зона
конфликта,
модернизация
вооружения;
руководитель
делопроизводства, счет продаж
директива по планированию, затраты
по выбытию; отпуск по беременности,
проценты по займам
введение в строй, инвестиции в
оборону; продажа в кредит, выплата в
рассрочку
дежурство в воздухе, меморандум о
взаимопонимании; запись в журнале,
ниша на рынке
информация для общественности,
топливо для газотурбин; документы
против
акцепта,
продажа
с
производства
расходы и доходы, силы и средства;
активы и пассивы, стоимость и фрахт
управление войсками, управление
ресурсами; руководство сделками
29
2.2.2. Анализ переводных соответствий между морфосинтаксическими
шаблонами
Одной из наиболее важных вспомогательных задач данного исследования
является установление переводных соответствий между морфосинтаксическими
шаблонами, по которым строятся термины гуманитарной области знаний. В
результате анализа Терминологической базы данных по военной реформе и
Экономического и коммерческого словаря были выявлены наиболее значимые
соответствия между переводными эквивалентами языка источника (английский)
и языков перевода (французский, русский). Выявленные переводные соответствия
будут играть важную роль в экспериментальной части исследования, при
сопоставлении выделенных в разных языках кандидатов в термины.
Анализ соответствий между переводными эквивалентами английского,
французского и русского языков осуществляется для морфосинтаксических
шаблонов терминологических биграмм как наиболее частотных шаблонов.
Переводные соответствия анализируются для языковых пар английский–
французский, французский–русский, английский–русский. Учитываются наиболее
частотные соответствия, которые представляют собой закономерности, а не
индивидуальные случаи – единичные соответствия считаются периферийными.
В таблицах 4, 5 и 6 приведены переводные соответствия, выявленные в
результате анализа Терминологической базы данных по военной реформе и
Экономического и коммерческого словаря для языковых пар английский–
французский,
французский–русский,
английский–русский.
В
таблицах
указываются:
тип шаблона в языке-источнике;
соответствующий ему тип шаблона в языке перевода;
ранг переводного соответствия в Терминологической базе данных по военной
реформе (ТБД по воен. реформе) с указанием процентной доли данного
переводного соответствия от общего числа соответствий;
ранг переводного соответствия в Экономическом и коммерческом словаре
(Эк. и ком. словарь) с указанием процентной доли данного переводного
соответствия от общего числа соответствий;
средний ранг типа соответствия, определённый как среднее арифметическое
типов переводных соответствий в данных словарях;
примеры терминов и их переводных эквивалентов, характерных для данного
типа переводного соответствия.
30
Таблица 4
Переводные соответствия между морфосинтаксическими шаблонами
биграмм английского и французского языков
Шаблон
Шаблон
английского французского
языка
языка
Ранг [%]
ТБД по воен.
Эк. и ком.
реформе
словарь
Средний
ранг
Adj + N
N + Adj
1 [31%]
2 [18%]
1,5
N+N
N + de + N
2 [26%]
1 [20%]
1,5
N + of + N
N + de + N
3 [7%]
5 [4%]
N+N
N + Adj
4 [5%]
3 [11%]
3,5
N+N
N + prep + N
5 [3%]
4 [9%]
4,5
Adj + N
N + de + N
5 [3%]
7 [3%]
6
N+N
N+N
6 [3%]
6 [3%]
6
Adj + N
Adj + N
7 [<1%]
10 [2%]
8,5
N + and + N
N + et + N
7 [<1%]
11 [2%]
9
Adj + N
N + prep + N
8 [<1%]
8 [3%]
8
N + prep + N
N + prep + N
–
9 [2%]
9
4
Примеры
operational activities –
activités
opérationnelles;
documentary credit –
crédit documentaire
warfare
skills
–
techniques de combat;
exchange
bureau
–
bureau de change
disposition of forces –
positionnement
des
forces; rate of exchange
– taux de change
combat readiness –
aptitude opérationnelle;
bank account – compte
bancaire
border
security
–
sécurité aux frontières;
field work – travail sur
le terrain
tactical unit – unité de
combat; staple food –
nourriture de base
host nation – pays hôte;
account sales – compte
ventes
tactical formation –
grande
unité;
free
circulation
–
libre
circulation
search and rescue –
recherche et sauvetage;
reach and frequency –
couverture et repetition
budgetary funding –
financement
sur
le
budget; bad cheque –
chèque sans provision
cheque without cover –
chèque sans couverture,
accordance with order –
conforme
à
la
commande
31
Таблица 5
Переводные соответствия между морфосинтаксическими шаблонами
биграмм французского и русского языков
Шаблон
французского
языка
Шаблон
русского
языка
Ранг [%]
ТБД по воен. Эк. и ком.
реформе
словарь
Средний
ранг
N + Adj
Adj + N
1 [33%]
1 [25%]
1
N + de + N
N + Ng
2 [13%]
2 [14%]
2
N + de + N
Adj + N
2 [13%]
3 [13%]
2,5
N + prep + N
Adj + N
3 [3%]
4 [4%]
3,5
N+N
Adj + N
4 [2%]
5 [2%]
4,5
N + de + N
N + prep + Nd
5 [<1%]
8 [<1%]
6,5
N + Adj
N + Ng
6 [<1%]
6 [2%]
6
N + de + N
N + prep + Na
6 [<1%]
8 [<1%]
7
Adj + N
Adj + N
7 [<1%]
7 [2%]
7
N + prep + N
N + prep + Na
–
7 [2%]
7
Примеры
législation administrative
–
административное
законодательство;
balance déficitaire –
пассивный баланс
déclaration de guerre –
объявление
войны;
relevé de compte –
баланс банка
disponibilité
des
équipements
–
техническая
оснащенность; balance
des
paiements
–
платежный баланс
éléments hors bilan –
забалансовые статьи;
vente avec rabais –
бартерная продажа
coopération interagences
–
межведомственное
взаимодействие; wagon
couchettes – спальный
вагон
directives de planification
–
директива
по
планированию; loyer de
l’argent – проценты по
займам
pause opérationnelle –
приостановка
операции; capital social –
капитал компании
dépenses de défense –
расходы на оборону;
licence d’ importation –
лицензия на импорт
juste valeur – реальная
стоимость;
grand
magasin
–
универсальный
магазин
investissement pour la
défense – инвестиции в
оборону
32
Таблица 6
Переводные соответствия между морфосинтаксическими шаблонами
биграмм английского и русского языков
Шаблон
английского
языка
Шаблон
русского
языка
Ранг [%]
ТБД по воен.
Эк. и ком.
реформе
словарь
Средний
ранг
Adj + N
Adj + N
1 [33%]
2 [22%]
1,5
N+N
Adj + N
2 [19%]
1 [22%]
1,5
N+N
N + Ng
3 [9%]
3 [12%]
3
N + of + N
N + Ng
4 [3%]
4 [3%]
4
N+N
N + prep + Nd
5 [<1%]
6 [1%]
5,5
N+N
N + prep + Na
6 [<1%]
5 [3%]
5,5
Adj + N
N + Ng
6 [<1%]
6 [1%]
6
Примеры
operational flexibility –
боевая гибкость; bleak
market
–
бесперспективный
рынок
army force – армейская
группировка;
land
reform – земельная
реформа
resistance movement –
движение
сопротивления; capital
outflow
–
отток
капитала
prevention of aggression
–
предотвращение
агрессии; breach of a law
– нарушение закона
contracting
officer
–
специалист
по
контрактам;
sickness
benefit – пособие по
болезни
defence investment –
инвестиции в оборону;
profits tax – налог на
прибыль
operational
pause
–
приостановка операции;
authorized
capital
–
капитал компании
2.2.3. Итоговый набор морфосинтаксических шаблонов и их переводных
соответствий
Анализ Терминологической базы данных по военной реформе и
Экономического и коммерческого словаря позволяет сделать следующие выводы.
Однословные термины в английском, французском и русском языках строятся
по шаблону имени существительного. Наиболее частотными шаблонами биграмм
в английском языке являются сочетание двух существительных (N + N),
прилагательного и существительного (Adj + N) и двух существительных с
предлогом of (N + of + N). Данные шаблоны покрывают примерно 98 процентов
33
всех шаблонов в ТБД военной реформы и около 96 процентов в Экономическом и
коммерческом словаре. Для французского языка наиболее значимые шаблоны –
сочетание двух существительных с предлогом (N + prep + N, большая часть из них
представлена шаблоном N + de + N), сочетание существительного и
прилагательного (N + Adj), сочетание двух существительных (N + N) и сочетание
прилагательного и существительного (Adj + N). Эти шаблоны покрывают около 98
процентов всех терминологических сочетаний в обоих словарях. Наиболее
значимыми в русском языке являются сочетания прилагательного и
существительного (Adj + N), двух существительных, одно из которых стоит в
форме родительного падежа (N + Ng), двух существительных, одно из которых
стоит в форме винительного падежа, с предлогом (N + prep + Na), а также двух
существительных, одно из которых стоит в форме дательного падежа, с предлогом
(N + prep + Nd). Такие шаблоны составляют около 97 процентов и 92 процентов в
ТБД военной реформы и Экономическом и коммерческом словаре соответственно.
Именно эти морфосинтаксические шаблоны будут использоваться в
экспериментальной части данного исследования для выделения терминовкандидатов из корпуса текстов.
Такой выбор используемых шаблонов обусловлен тем, что однословные
термины и терминологические биграммы составляют большую часть от всех
терминов, зафиксированных в рассмотренных нами терминологических словарях.
Использование наиболее частотных шаблонов позволит получить более точные
результаты, в то время как редко встречающиеся шаблоны могут стать
источником шума – большого числа нетерминологических словосочетаний. Кроме
того, именно эти шаблоны используются в значимых переводных соответствиях,
перечисленных ниже.
К наиболее частотным, и, как следствие, наиболее значимым переводным
соответствиям относятся следующие:
языковая пара [английский] => [французский]:
o [Adj + N] => [N + Adj]
o [N + N] => [N + de + N]
o [N + of + N] => [N + de + N]
o [N + N] => [N + Adj]
o [N + N] => [N + prep + N]
o [Adj + N] => [N + de + N]
o [N + N] => [N + N]
языковая пара [французский] => [русский]:
o [N + Adj] => [Adj + N]
o [N + de + N] => [N + Ng]
o [N + de + N] => [Adj + N]
34
o [N + prep + N] => [Adj + N]
o [N + N] => [Adj + N]
o [Adj + N] => [Adj + N]
o [N + prep + N] => [N + prep + Na]
языковая пара [английский] => [русский]:
o [Adj + N] => [Adj + N]
o [N + N] => [Adj + N]
o [N + N] => [N + Ng]
o [N + of + N] => [N + Ng]
o [N + N] => [N + prep + Nd]
o [N + N] => [N + prep + Na]
Данные переводные соответствия будут использоваться для сопоставления
выделенных терминов-кандидатов из параллельного корпуса текстов.
2.3. Инструменты исследования
Для проверки разработанного в рамках данного исследования алгоритма был
создан параллельный корпус международных юридических текстов на
английском, французском и русском языках. В состав данного корпуса вошли
официальные
документы
международных
организаций
НАТО
(http://www.nato.int/cps/en/natolive/57772.htm)
и
ООН
(http://www.un.org/ru/documents/instruments/docs_ru.asp),
которые
имеют
официальные переводы на нескольких европейских языках, включая английский,
французский и русский. Общий объём корпуса составляет около 412 000
словоупотреблений. Объём текстов на английском языке равен приблизительно
132 000 словоупотреблений (5262 леммы), на французском языке – 159 000
словоупотреблений (5504 леммы), на русском языке – 121 000 словоупотреблений
(6653 леммы).
Тексты были выровнены на уровне предложений с помощью инструмента
LFAligner (http://sourceforge.net/projects/aligner/). Преимущества этой программы
заключаются в том, что она находится в открытом доступе, позволяет работать
одновременно с несколькими языками и имеет графический редактор для
редактирования неправильно выровненных предложений. В результате
выравнивания получилось 5034 выровненных троек предложений на английском,
французском и русском языках.
Для извлечения переводного словаря тексты были выровнены на уровне слов
с помощью программного модуля Anymalign (https://anymalign.limsi.fr). Как и
LFAligner, данный инструмент выполняет выравнивание одновременно для
нескольких языков, но является статистическим, вследствие чего выходные
данные зависят от объёма корпуса текстов. Результаты работы модуля Anymalign
35
отображаются в виде списка слов и их предполагаемых переводных эквивалентов,
ранжированного по частоте встречаемости обнаруженных переводных
соответствий, с указанием их вероятности. В переводной англо-франко-русский
словарь включались слова только тех знаменательных частей речи, которые
отражаются в морфосинтаксических шаблонах, разработанных на предыдущем
этапе исследования, т.е. существительные и прилагательные. Объём словаря
составляет 2714 переводных лемм.
Морфологическая разметка англо-франко-русского корпуса текстов
осуществлялась с помощью морфоанализатора TreeTagger (http://www.cis.unimuenchen.de/~schmid/tools/TreeTagger/) – языконезависимого вероятностного
инструмента для частеречной разметки и лемматизации текстов, в основе
которого лежит бинарное дерево решений. Преимущество данной программы
заключается в том, что она работает для большого числа языков, включая
немецкий, английский, французский, итальянский, испанский, русский,
болгарский, китайский, польский, эстонский и др. Согласно результатам
исследования [57, p. 6], TreeTagger обладает высокой точностью (около 96%) и
является эффективным инструментом для морфологической разметки корпусов
текстов.
2.4.
Алгоритм
выделения
переводных
терминов-кандидатов
многоязычного (англо-франко-русского) корпуса текстов
из
В рамках данного исследования была разработана следующая методика
выделения переводных кандидатов в термины для многоязычного (англо-франкорусского) словаря. Алгоритм включает в себя два основных этапа: (1) выделение
терминов-кандидатов (однословных терминов-кандидатов и терминологических
биграмм) из текстов на английском, французском и русском языках; (2)
установление переводных соответствий между выделенными кандидатами в
термины.
Выделение кандидатов в термины, в свою очередь, состоит из двух основных
шагов. На первом шаге из морфологически размеченного корпуса текстов
извлекаются последовательности слов, соответствующие морфосинтаксическим
шаблонам однословных терминов и терминологических биграмм, выделенным на
предыдущем этапе исследования для английского, французского и русского
языков. Второй шаг заключается в оценке специфичности выделенных слов и
словосочетаний. Для каждого кандидата подсчитывается статистическая мера –
простая частота встречаемости для отдельных слов, мера log-likelihood для
биграмм. Затем выполняется ранжирование выделенных слов/словосочетаний на
основе приписанных им значений статистической меры: слова/словосочетания,
значение которых превышает установленный порог статистической значимости,
36
считаются кандидатами в термины; слова/словосочетания, не «преодолевшие»
порог значимости, признаются нетерминологическими и исключаются из
дальнейшего анализа.
Установление переводных соответствий между выделенными терминамикандидатами в англо-франко-русском корпусе текстов осуществляется, как было
указано выше, с помощью метода опорного языка. Сопоставление возможных
переводных эквивалентов основано на значимых переводных соответствиях,
обнаруженных
в
результате
анализа
терминологических
словарей
(Терминологической базы данных по военной реформе и Экономического и
коммерческого словаря). Переводные соответствия устанавливаются попарно
между языками (английский – французский, французский – русский, английский –
русский), а затем каждый язык используется в качестве языка-посредника (в
соответствии с методом опорного языка), в результате чего образуются англофранко-русские тройки переводных эквивалентов.
Рассмотрим данный этап алгоритма на следующем примере. Списки
статистически значимых терминов-кандидатов, выделенных из текстов на
английском, французском и русском языках, содержат для каждого
слова/словосочетания
информацию
о
его
словоформе,
лемме
и
морфосинтаксическом шаблоне. С помощью извлечённого из параллельного
корпуса текстов переводного англо-франко-русского словаря осуществляется
перевод лемм кандидатов английского языка на французский язык. Полученные
таким образом переводные эквиваленты сравниваются с леммами кандидатов
французского языка: если переведённая лемма кандидата английского языка
совпадает с леммой кандидата французского языка, то такие леммы считаются
переводными эквивалентами. Подобное сравнение проводится также между
кандидатами французского и русского языков, а затем между кандидатами
английского и русского языков. В результате выделяются переводные
эквиваленты для пар языков английский – французский, французский – русский,
английский – русский. На следующем шаге английский, французский и русский
язык выступают поочерёдно в качестве опорного языка. С помощью французского
языка устанавливаются соответствия между кандидатами английского и русского
языков, которые имеют одинаковые переводные эквиваленты из списка
кандидатов французского языка; английский язык в качестве языка-посредника
позволяет сопоставить французские и русские кандидаты, которые имеют
одинаковые переводные эквиваленты среди кандидатов английского языка;
наконец, за опорный язык принимается русский язык, и устанавливаются
переводные соответствия между английскими и французскими кандидатами,
имеющими одинаковые переводные эквиваленты из списка кандидатов русского
языка. Формируются списки переводных троек, которые затем объединяются в
общий список переводных терминов-кандидатов. В результате проведения
37
данных операций образуется конечный список англо-франко-русских троек
переводных эквивалентов.
Таким образом, описанная методика позволяет выделить из многоязычного
параллельного корпуса текстов кандидаты для англо-франко-русского
терминологического словаря, представляющие собой переводные англо-франкорусские однословные термины-кандидаты и терминологические биграммы.
2.5. Выводы
Алгоритм выделения терминов-кандидатов для терминологического англофранко-русского словаря состоит из двух основных этапов. На первом этапе из
параллельного англо-франко-русского корпуса извлекаются статистически
значимые слова/словосочетания в соответствии с морфосинтаксическими
шаблонами однословных терминов и терминологических биграмм, характерными
для английского, французского и русского языков. Второй этап заключается в
сопоставлении выделенных для каждого языка терминов-кандидатов на
основании
наиболее
значимых
переводных
соответствий
между
морфосинтаксическими шаблонами терминов. В результате работы данного
алгоритма формируется список переводных англо-франко-русских терминовкандидатов.
Для определения набора морфосинтаксических шаблонов, по которым
строятся термины гуманитарной области знаний, были проанализированы
Терминологическая база данных по военной реформе и Экономический и
коммерческий словарь. Задача данного анализа состояла в том, чтобы, во-первых,
установить, какие из морфосинтаксических шаблонов терминов являются
наиболее частотными в английском, французском и русском языках, и, во-вторых,
определить наиболее характерные соответствия между переводными
эквивалентами данных языков.
Наиболее частотными морфосинтаксическими шаблонами терминов
гуманитарной области знаний в английском, французском и русском языках
являются шаблоны однословных терминов и терминологических биграмм,
вследствие чего алгоритм, разработанный в рамках данного исследования,
направлен, прежде всего, на выделение терминов-кандидатов, соответствующих
именно этим морфосинтаксическим шаблонам.
38
Глава 3. Эксперимент. Выделение переводных терминовкандидатов из англо-франко-русского корпуса текстов
международных документов
В экспериментальной части данного исследования разработанная методика
используется для выделения терминов-кандидатов из параллельного англофранко-русского корпуса международных юридических документов, описанного
выше. С этой целью на языке программирования C# была написана программа,
которая состоит из двух модулей, соответствующих основным этапам алгоритма:
выделение кандидатов в термины из текстов на каждом из языков параллельного
корпуса текстов (английском, французском, русском) и установление переводных
соответствий для выделенных терминов-кандидатов.
3.1. Выделение однословных терминов-кандидатов
На первом этапе из морфологически размеченного корпуса международных
текстов отдельно для английского, французского и русского языков были
выделены одиночные слова, соответствующие шаблону имени существительного.
В текстах на английском языке было выделено 3117 существительных, в текстах
на французском языке – 2383 существительных, в текстах на русском языке – 2658
существительных.
Для оценки статистической значимости выделенных существительных
использовалась
простая
частота
встречаемости,
т.е.
для
каждого
существительного подсчитывалась его частота в корпусе текстов. Для исключения
из дальнейшего анализа статистически незначимых слов был установлен порог
частоты встречаемости. Согласно [35], оптимальным порогом частоты является
частота, равная пяти, поэтому в данном исследовании статистически значимыми
считались те существительные, которые встречаются в текстах на английском,
французском и русском языках как минимум пять раз. Таким образом, в
англоязычной части корпуса статистически значимыми оказались 1040 терминовкандидатов (33% от общего числа существительных), в текстах на французском
языке – 953 (40% от общего числа существительных), в русскоязычной части
корпуса – 1001 (38% от общего числа существительных).
На следующем этапе с помощью извлечённого из параллельного корпуса
переводного словаря устанавливались переводные соответствия между
следующими парами языков: английский – французский, французский – русский,
английский – русский. Между английскими и французскими терминамикандидатами было установлено 530 переводных соответствий, между
французскими и русскими кандидатами – 523 соответствия, между английскими и
русскими кандидатами – 530 переводных соответствий.
39
Наконец, с помощью метода опорного языка были получены тройки
переводных соответствий (английский – французский – русский). В качестве
опорного языка выступали поочерёдно английский (выделено 530 переводных
троек), французский (473 переводных троек) и русский языки (548 переводных
троек). В результате работы алгоритма было получено 564 англо-франко-русские
тройки слов, которые затем были оценены с точки зрения релевантности.
3.2. Выделение терминологических биграмм
На первом этапе из морфологически размеченного корпуса международных
документов
извлекались
последовательности
слов,
соответствующие
морфосинтаксическим
шаблонам,
выделенным
в
рамках
анализа
терминологических словарей. Затем выделенные таким образом биграммы были
оценены с точки зрения их статистической значимости и связанности образующих
их компонентов. Для этого использовалась статистическая мера log-likelihood,
которая исходит из таблицы смежности для каждой пары слов (W1, W2),
определённой следующим образом:
W1
-W1
W2
a
c
-W2
b
d
где
a – частота пар, в состав которых входят оба компонента W1 и W2
b – частота пар, в состав которых входит только компонент W1
c – частота пар, в состав которых входит только компонент W2
d – частота пар, в состав которых не входит ни компонент W1, ни компонент
W2
Сумма a + b + c + d (=N) – это общее число встречаемости всех пар,
построенных по данному морфосинтаксическому шаблону. Иными словами,
значения меры log-likelihood подсчитываются для каждой пары слов из списка
биграмм, соответствующих одному морфосинтаксическому шаблону.
Формула меры log-likelihood в соответствии с данной таблицей смежности
задаётся таким образом:
𝐿𝑜𝑔 − 𝑙𝑖𝑘𝑒𝑙𝑖ℎ𝑜𝑜𝑑
= 𝑎 log 𝑎 + 𝑏 log 𝑏 + 𝑐 log 𝑐 + 𝑑 log 𝑑 − (𝑎 + 𝑏) log(𝑎 + 𝑏)
− (𝑎 + 𝑐 ) log(𝑎 + 𝑐 ) − (𝑏 + 𝑑 ) log(𝑏 + 𝑑 ) − (𝑐 + 𝑑 ) log(𝑐 + 𝑑 )
+ (𝑎 + 𝑏 + 𝑐 + 𝑑 ) log(𝑎 + 𝑏 + 𝑐 + 𝑑)
Определение порога статистической значимости для биграмм представляет
собой особую сложность. Порог частоты, равный пяти, который рекомендуется в
работах [60] и [35], является высоким для словосочетаний, так как словосочетания
имеют более низкие показатели частоты, чем одиночные слова. С одной стороны,
40
такой порог статистической значимости позволяет отсечь большое количество
статистически незначимых словосочетаний; с другой стороны, низкочастотные
словосочетания могут оказаться терминами-кандидатами, поэтому использование
высокого порога частоты может привести к потере числа значимых с точки зрения
«терминологичности» биграмм. В работе [37] порог частоты снижается до двух –
объясняется это тем, что благодаря морфосинтаксическим шаблонам количество
статистически незначимых словосочетаний сокращается. Однако при таком пороге
частоты по сравнению с более высоким порогом, равным пяти, увеличивается
количество нерелевантных биграмм, вследствие чего снижается и точность
алгоритма в целом. В то же время, использование низкого порога частоты
позволяет выделять редкие терминологические словосочетания.
Вследствие того, что, опираясь на частоту встречаемости биграмм, мера loglikelihood выполняет своего рода функцию нормализации значений
высокочастотных и низкочастотных словосочетаний, было принято решение
установить порог статистической значимости на основании значений меры loglikelihood, а не простой частоты совместной встречаемости.
Для определения порога значимости на предмет релевантности были
проанализированы словосочетания, выделенные из текстов корпуса на
английском языке, построенные по шаблону прилагательного и существительного
(Adj + N). Исследовались два списка биграмм: первый список включал в себя
словосочетания, которые имеют значение меры log-likelihood, большее или равное
10, второй список состоял из словосочетаний со значением меры log-likelihood,
большим или равным 5. В результате данного вспомогательного анализа порог
значимости был определён следующим образом: статистически значимым
считается то словосочетание, которое имеет значение меры log-likelihood, большее
или равное 5 или неопределённое значение. Выбор такого порога обусловлен
попыткой найти оптимальный баланс между количеством релевантных биграмм и
точностью их выделения. Высокий порог статистической значимости (равный 10)
обладает более высоким показателем точности, однако выделяет значительно
меньшее общее количество словосочетаний. Следует отметить, что в данном
случае порог значимости определяется эмпирическим путём, а потому не является
величиной постоянной и может варьироваться в зависимости от целей
исследования и материала, лежащего в его основе.
В таблице 7 указываются количественные показатели, полученные на данном
этапе алгоритма: для каждого типа морфосинтаксического шаблона английского,
французского и русского языков приводится общее количество словосочетаний,
соответствующих данному шаблону (словоформ и лемм), а также статистически
значимые биграммы, построенные по этому шаблону.
41
Таблица 7
Количественные данные этапа выделения статистически значимых
биграмм
Шаблон биграммы
N+N
Adj + N
N + of + N
N + Adj
N+N
Adj + N
N + de + N
N + prep + N
Adj + N
N + Ng
N + prep + Na
N + prep + Nd
Общее
количество
(леммы)
Шаблоны английского языка
2989
1388
9287
4221
1907
1230
Шаблоны французского языка
8549
3559
1463
888
2300
1151
6684
3454
2982
1799
Шаблоны русского языка
12939
5154
9431
4443
594
384
975
660
Общее количество
(словоформы)
Статистически
значимые биграммы
618
1780
526
1588
443
569
1081
586
2628
1388
215
262
На следующем шаге алгоритма устанавливались переводные соответствия
между биграммами из полученных списков статистические значимых
словосочетаний для пар языков английский – французский, французский –
русский, английский – русский. С помощью переводного словаря, извлечённого
для данного корпуса текстов, а также списка однословных терминов-кандидатов,
выделенных на предыдущем этапе, биграммы в виде лемм переводились с
исходного языка на язык перевода, в соответствии с переводными соответствиями
между морфосинтаксическими шаблонами данной пары языков. Полученные
формы биграмм сравнивались затем с биграммами переводного языка:
совпадающие биграммы выделялись в качестве переводных эквивалентов.
Результаты
данного
этапа
алгоритма
отображены
в
таблице
8.
42
Таблица 8
Установление переводных соответствий между языковыми парами
Количество
выделенных
пар
Английский – французский
(общее количество пар – 437)
Adj + N
N + Adj
266
N+N
N + Adj
14
N+N
N+N
11
N + of + N
N + de + N
64
N+N
N + de + N
66
N+N
N + prep + N
12
Adj + N
N + de + N
4
Французский – русский
(общее количество пар – 478)
N + Adj
269
Adj + N
N + de + N
141
N + Ng
N + de + N
9
Adj + N
N + prep + N
1
Adj + N
N+N
9
Adj + N
Adj + N
36
Adj + N
N + prep + N
13
N + prep + Na
Английский – русский
(общее количество пар – 481)
Adj + N
316
Adj + N
N+N
20
Adj + N
N+N
52
N + Ng
N + of + N
81
N + Ng
N+N
9
N + prep + Nd
N+N
3
N + prep + Na
Шаблон языка
источника
Шаблон языка
перевода
Последний этап данного эксперимента заключался в установлении
переводных соответствий между тройками биграмм английского, французского и
русского языков с помощью метода опорного языка. В том случае, когда в качестве
опорного языка выступал французский язык, было выделено 320 троек
переводных эквивалентов. Для английского языка в качестве опорного было
получено 322 переводных эквивалента. Наконец, для русского языка в качестве
языка-посредника было выделено 363 англо-франко-русских троек. В результате
объединения данных списков биграмм было получено 373 переводных
эквивалента, которые затем были оценены с точки зрения их
релевантности/нерелевантности.
43
3.3. Анализ и оценка работы алгоритма
При оценке точности алгоритма возникает ряд трудностей. Вследствие того,
что термин не существует вне терминосистемы и тесно связан с определённой
логико-понятийной моделью, для определения «терминологичности» того или
иного слова/словосочетания необходима оценка экспертов – специалистов в
данной предметной области. Оценка переводных терминов является ещё более
сложной задачей и требует совместной работы специалиста конкретной области
знаний и профессионального переводчика, лингвиста.
Однако цель данного исследования заключалась в разработке методики
выделения терминов-кандидатов для переводного словаря, а не собственно
терминов, поэтому для оценки релевантности выделенных терминов-кандидатов
и их переводных эквивалентов использовались следующие формальные критерии:
(1) наличие данного слова/словосочетания и его переводного эквивалента
в существующих переводных терминологических словарях и ТБД
определённой предметной отрасли;
(2) вхождение данного термина-кандидата в состав словосочетаний,
зафиксированных в переводных терминологических словарях и ТБД
определённой предметной отрасли;
(3) наличие
данных
слов/словосочетаний
в
одноязычных
терминологических словарях соответствующей тематики.
Таким образом, если слово/словосочетание из списка выделенных терминовкандидатов удовлетворяет хотя бы одному из этих критериев, то оно считается
релевантным термином-кандидатом для переводного терминологического
словаря. Иными словами, оценка релевантности выделенных кандидатов в
термины осуществляется на основании их вхождения в переводные или
одноязычные терминологические словари. Проблема, возникающая при
использовании таких критериев, связана с тем, что терминология подвержена
быстрым изменениям, которые могут быть не зафиксированы в словарях, что
вновь приводит к необходимости экспертной оценки. В связи с этим приведённый
ниже анализ работы алгоритма носит приблизительный характер и не является
его окончательной оценкой.
Следующая трудность при оценке алгоритма связана с характерными
чертами предметной области созданного в рамках данного исследования
параллельного корпуса международных юридических текстов. Особенность
международных юридических документов заключается в том, что они
характеризуются разной тематической направленностью в сфере международных
отношений и, как следствие, терминологической неоднородностью [13, с. 237]. В
текстах международных юридических документов отражаются различные виды
44
взаимоотношений между государствами (политические, экономические,
юридические), а также проблемы в области военных действий и международных
конфликтов,
экологии,
культуре,
здравоохранении.
Терминологическая
неоднородность текстов по международным отношениям выражается в более
частом явлении синонимии и многозначности по сравнению с текстами
естественных и технических наук, а также в наличии терминов с нечёткими,
размытыми границами обозначаемых ими общих понятий. Следовательно,
возникает вопрос о том, терминологические словари какой предметной области
необходимо принимать во внимание и использовать для оценки релевантности
выделенных терминов-кандидатов.
Тем не менее, можно утверждать, что центральными темами международных
документов являются сферы политики, права и экономики, поэтому для оценки
качества работы алгоритма были использованы следующие терминологические
словари и терминологические базы данных:
Англо-русский юридический словарь [2] (доступен на ABBYY Lingvo-Online по
адресу http://www.lingvo-online.ru/);
Англо-русский экономический словарь [1] (доступен на ABBYY Lingvo-Online
по адресу http://www.lingvo-online.ru/);
Французско-русский юридический словарь [21] (доступен на ABBYY LingvoOnline по адресу http://www.lingvo-online.ru/);
UNTERM, многоязычная терминологическая база данных ООН (доступ по
адресу http://untermportal.un.org/);
Русско-английский военно-политический словарь [25];
Терминологическая база данных по военной реформе [27];
Экономический и коммерческий словарь [8];
Le grand dictionnaire terminologique, GDT (доступ по адресу
http://www.granddictionnaire.com/);
Burton's
Legal
Thesaurus
(доступ
по
адресу
http://legaldictionary.thefreedictionary.com);
Большой
юридический
словарь
(доступ
по
адресу
http://jurisprudence.academic.ru/);
Финансовый
словарь
(доступ
по
адресу
http://dic.academic.ru/contents.nsf/fin_enc/);
Экономический
словарь
(доступ
по
адресу
http://dic.academic.ru/contents.nsf/econ_dict/);
Dictionary of Military and Associated Terms [40];
Словарь современных военно-политических и военных терминов Россия–
НАТО [26].
45
Таким образом, оценка выделенных слов и словосочетаний на предмет того,
могут ли они считаться кандидатами в термины для переводного словаря, носит
двусторонний характер: во-первых, это оценка «терминологичности» данных слов
и словосочетаний, а во-вторых, это оценка адекватности их переводных
эквивалентов. Релевантность выделенных слов и словосочетаний определяется на
основе их наличия/отсутствия в переводных терминологических словарях и базах
данных.
Релевантными
терминами-кандидатами
признаются
те
слова/словосочетания, которые удовлетворяют хотя
бы одному из
вышеперечисленных формальных критериев (с. 44).
3.3.1. Анализ результатов эксперимента (выделение однословных терминовкандидатов)
В результате работы алгоритма было выделено 564 англо-франко-русских
троек слов. В соответствии с выделенными нами формальными критериями
релевантными терминами-кандидатами можно считать 483 тройки. Таким
образом, точность алгоритма выделения однословных терминов-кандидатов
равна 86%. Частота встречаемости терминов-кандидатов в текстах на английском
языке находится в диапазоне от 5 до 931, в текстах на французском языке – от 2 до
974, в текстах на русском языке – от 4 до 957. В таблице 9 представлены терминыкандидаты с наиболее высокой частотой встречаемости (ранжирование
осуществлялось по терминам-кандидатам английского языка как языкаисточника). Полный список однословных терминов-кандидатов с указанием их
частоты встречаемости для каждого языка и переводных эквивалентов, не
зафиксированных в терминологических словарях (выделены курсивом),
представлен в Приложении 1. Нерелевантные переводные эквиваленты с
указанием их частоты встречаемости приведены в Приложении 3.
Таблица 9
Однословные термины-кандидаты
Английский
язык
security
alliance
development
state
force
force
cooperation
cooperation
defence
country
right
Частота
931
605
535
535
507
507
502
502
490
424
356
Французский
язык
sécurité
alliance
développement
état
vigueur
force
coopération
collaboration
défense
pays
droit
Частота
974
211
620
97
63
496
533
24
477
813
546
Русский язык
безопасность
союз
развитие
государство
сила
сила
сотрудничество
сотрудничество
оборона
страна
право
Частота
957
651
528
530
733
733
571
571
329
742
496
46
Таблица 9 (продолжение)
Английский
язык
effort
capability
party
article
operation
commitment
commitment
member
crisis
Французский
язык
355 effort
344 capacité
319 partie
Частота
310
293
269
269
252
249
article
opération
engagement
obligation
membre
crise
Частота
Русский язык
298 усилие
469 способность
240 государствоучастник
298 статья
303 операция
215 обязательство
76 обязательство
271 член
247 кризис
Частота
354
130
38
309
312
216
216
197
203
Наиболее частыми причинами выделения нерелевантных кандидатов
оказались следующие. Во-первых, это ошибки, возникшие в результате
неправильного морфологического анализа слова. К ним относятся, в частности,
прилагательные, которым была приписана категория имени существительного:
universal – universel – всеобщий, military – militaire – военный. Во-вторых, это ошибки,
связанные с неправильным выравниванием на уровне слов. Примерами ошибок
такого рода являются, например, тройки слов capability – capacité – средство, person
– personne – инвалид, world – paix – мир, membership – adhésion – членство,
relationship – rapport – доклад, achievement – objectif – цель. Стоит отметить, что
такие ошибки являются наиболее частыми. Наконец, нерелевантными
кандидатами являются слова, имеющие высокие показатели относительной
частоты, но принадлежащие неспециальному, общему языку. Такими являются,
например, тройки слов role – rôle – роль, regard – égard – связь (чаще всего
встречаются в словосочетаниях in this regard – à cet égard – в этой связи), future –
avenir – будущее, december – décembre – декабрь, fight – lutte – борьба, periphery –
périphérie – периферия, proportion – proportion – часть.
Среди выделенных терминов-кандидатов можно выделить переводные
эквиваленты,
которые
не
зафиксированы
в
вышеперечисленных
терминологических переводных и одноязычных словарях. Благодаря тому, что они
обладают довольно высокой частотой встречаемости и последовательно
соотносятся с терминами других языков, зафиксированными в словарях, их также
можно
считать
терминами-кандидатами.
Например,
существительное
французского языка people соотносится с английским термином-кандидатом
people и русским термином-кандидатом народ, поэтому его также можно
рассматривать в качестве термина-кандидата. Аналогичными терминамикандидатами, не зафиксированными в терминологических словарях, являются,
например, существительные английского языка actor (соответствует франц.
47
structure и рус. структура), expertise (соответствует франц. compétence и рус.
компетенция), существительные французского языка cadre (соответствует англ.
framework и рус. рамки), monde (соответствует англ. world и рус. мир), acteur
(соответствует англ. structure и рус. структура), réussite (соответствует англ.
success и рус. успех), orientation (соответствует англ. guidance и рус. указание),
pourparler (соответствует англ. talk и рус. переговоры) и существительные русского
языка реагирование (соответствует англ. response и франц. réaction, réponse),
контекст (соответствует англ. context и франц. contexte), учение (соответствует
англ. exercise и франц. exercice), совместимость (соответствует англ. interoperability
и франц. interopérabilité), сдерживание (соответствует англ. deterrence и франц.
dissuasion). Термины-кандидаты, не зафиксированные в терминологических
переводных и одноязычных словарях, чаще всего встречаются в текстах на
французском и русском языках.
Алгоритм позволяет выделить и некоторые варианты переводных
эквивалентов, например, cooperation (англ.) – coopération, collaboration (франц.) –
сотрудничество (рус.); commitment, obligation, engagement (англ.) – engagement,
obligation (франц.) – обязательство (рус.); basis (англ.) – base, fondement (франц.) –
основа (рус.); purpose, objective (англ.) – but, objectif (франц.) – цель (рус.); effect
(англ.) – effet, conséquence (франц.) – последствие (рус.); guidance, direction (англ.) –
orientation, directive (франц.) – указание (рус.); negotiation, talk (англ.) – pourparler,
négociation (франц.) – переговоры (рус.), и др. Термины-кандидаты с относительно
низкой частотой встречаемости в корпусе текстов также выделяются алгоритмом:
privacy (англ., частота встречаемости – 5) – confidentialité (франц., частота
встречаемости – 6) – конфиденциальность (рус., частота встречаемости – 4);
rotation (англ., частота встречаемости – 5) – rotation (англ., частота встречаемости –
6) – ротация (рус., частота встречаемости – 6); separatist (англ., частота
встречаемости – 5) – séparatiste (франц., частота встречаемости – 5) – сепаратист
(рус., частота встречаемости – 5).
3.3.2. Анализ результатов эксперимента (выделение биграмм)
В результате работы данного алгоритма было выделено 373 англо-франкорусских переводных эквивалента. Используя вышеперечисленные формальные
критерии оценки, релевантными можно считать 224 переводные биграммы.
Точность выделения терминологических биграмм составляет 60%. Частота
встречаемости биграмм находится в диапазоне от 1 до 108 для текстов на
английском языке, от 1 до 124 для текстов на французском языке и от 1 до 125 для
текстов на русском языке. Значения меры log-likelihood лежат в промежутке от 5
до 375 для англоязычной части корпуса, от 5 до 392 для франкоязычной части
корпуса и от 5 до 404 для русскоязычной части корпуса. В данный список
включены также биграммы, которые имеют неопределённые значения меры log48
likelihood (∞). В таблице 10 приведены терминологические биграммы с
наибольшими
значениями
меры
log-likelihood
(Logl)
(ранжирование
осуществлялось по терминологическим биграммам английского языка как языкаисточника), с указанием частоты встречаемости (Freq). Список релевантных
биграмм – кандидатов в термины с указанием значений меры log-likelihood,
частоты совместной встречаемости, лемм и словоформ представлен в Приложении
2 (терминологические биграммы, не зафиксированные в терминологических
словарях
выделены
курсивом).
Список
нерелевантных
переводных
словосочетаний приведён в Приложении 4.
Таблица 10
Терминологические биграммы
Английский
язык
Logl
human right
375
indigenous
people
collective
defence
euro-atlantic
area
nuclear
weapon
missile
defence
territorial
integrity
international
law
crisis
management
crisis
management
international
community
fundamental
freedom
sustainable
development
political
dialogue
strategic
concept
international
organisation
security
challenge
crisis
response
359
271
242
226
219
191
159
147
147
141
138
129
121
108
94
92
84
Freq
Французский
язык
Logl
108 droit
de
l’homme
87 peuple
autochtone
75 défense
collective
61 région
euroatlantique
58 arme nucléaire
392
89 défense
antimissile
37 intégrité
territoriale
49 droit
international
57 gestion de la
crise
57 gestion de la
crise
45 communauté
internationale
29 liberté
fondamentale
41 développemen
t durable
37 dialogue
politique
28 concept
stratégique
30 organisation
internationale
40 défi
de
la
sécurité
26 réponse à la
crise
∞
Freq
Русский язык
124 право человека
Freq
Частота
404
125
356
87 коренной народ
346
100
261
74 коллективная
оборона
47 евроатлантически
й регион
∞ ядерное оружие
220
55
104
27
345
84
∞
17
193
36
159
57
105
22
19
7
173
51
109
27
168
42
121
37
166
41
100
36
34
16
71
27
154
259
169
178
123
81
175
131
144
110
171
124
107
77
85 противоракетная
оборона
34 территориальная
целостность
62 международное
право
38 кризисное
регулирование
26 регулирование
кризиса
56 международное
сообщество
30 основная свобода
41 устойчивое
развитие
37 политический
диалог
48 стратегическая
концепция
44 международная
организация
41 проблема
безопасности
25 реагирование
на
кризис
49
Нерелевантные словосочетания возникают, в основном, по следующим
причинам. Во-первых, это ошибки, связанные с неточным выравниванием корпуса
текстов на уровне слов. К таким словосочетаниям относятся такие англо-франкорусские тройки, как membership aspiration – aspiration à adhésion – стремление к
членству, threat environment – environnement de sécurité – обстановка безопасности,
security concern – préoccupation de sécurité – вопрос безопасности, response operation –
opération de réponse – сила реагирования. По сравнению с однословными
переводными эквивалентами, ошибок такого рода при выделении биграмм
оказалось значительно меньше. Основным типом нерелевантных словосочетаний
являются
переводные
эквиваленты,
которые
принадлежат
общему,
неспециальному языку, но обладают относительно высокими значениями меры
log-likelihood. Среди таких биграмм наиболее типичными являются сочетания
оценочного или квалифицирующего прилагательного и абстрактного
существительного: significant contribution – contribution significative – значительный
вклад, important role – rôle important – важная роль, significant progress – progrès
significatif – значительный прогресс, relevant provision – disposition pertinente –
соответствующее положение, recent year – année dernière – последний год,
unpredictable world – monde imprévisible – непредсказуемый мир, crucial role – rôle clé –
ключевая роль. Наконец, к нерелевантным биграммам относятся такие переводные
эквиваленты, которые имеют достаточно высокие показатели меры log-likelihood
(близкие к значениям этой меры у терминологических словосочетаний) и внешне
похожи на термины, но в действительности не носят терминологического
характера. Иными словами, в терминологических словарях не зафиксирован ни
один из переводных эквивалентов (английский, французский, русский), входящих
в состав такой тройки: political consultation – consultation politique – политическая
консультация, principle of indivisibility – principe d’indivisibilité – принцип
неделимости,
multinational
cooperation
– coopération
multinationale
–
многонациональное сотрудничество, subregional organization – organisation sousrégionale – субрегиональная организация, democratic society – société démocratique –
демократическое общество, planning process – processus de la planification – процесс
планирования, sector reform – réforme du secteur – реформа сектора. Однако такие
нетерминологические словосочетания, зафиксированные как лексические
элементы предметной области, могут оказаться полезными в ряде приложений.
Как и в случае с однословными терминами-кандидатами, в выделенных
тройках
словосочетаний
наряду
с
переводными
эквивалентами,
зафиксированными в перечисленных терминологических переводных и
одноязычных словарях, встречаются биграммы, которые в словарях не
зафиксированы, но тем не менее могут считаться релевантными кандидатами в
термины. К таким терминам-кандидатам относятся, в первую очередь, такие
эквиваленты,
которые
последовательно
соотносятся
с
переводными
терминологическими словосочетаниями. Например, словосочетание французского
50
языка valeur démocratique соответствует переводным эквивалентам democratic
value (англ.) и демократическая ценность (рус.), зафиксированным в
терминологических словарях, а потому может также считаться терминомкандидатом. Переводными эквивалентами такого характера являются, к примеру,
словосочетания английского языка resolution of dispute (соответствуют франц.
règlement du différend и рус. урегулирование спора), capability development
(соответствуют франц. développement de capacité и рус. развитие потенциала),
protection of children (соответствуют франц. protection des enfants и рус. защита
детей), словосочетания французского языка force militaire (соответствуют англ.
military capability и рус. военная сила), indépendance politique (соответствуют англ.
political independence и рус. политическая независимость), confiance mutuelle
(соответствуют англ. mutual confidence и рус. взаимное доверие), menace terroriste
(соответствуют англ. terrorist threat и рус. террористическая угроза), développement
social (соответствуют англ. social development и рус. социальное развитие),
словосочетания русского языка террористическое нападение (соответствуют англ.
terrorist attack и франц. attaque terroriste), обычная сила (соответствуют англ.
conventional force и франц. force conventionnelle), оборонное планирование
(соответствуют англ. defence planning и франц. planification de la défense),
энергетическая потребность (соответствуют англ. energy need и франц. besoin
énergétique), экономическое процветание (соответствуют англ. economic prosperity и
франц. prospérité économique).
Во-вторых, терминологическими могут считаться такие переводные
эквиваленты, которые последовательно встречаются в более крупных
терминологических словосочетаниях, зафиксированных в терминологических
словарях, т.к. большинство терминов длиной более двух слов в сущности
представляют собой сочетания однословных терминов или терминологических
биграмм [37, p. 5–6]. В работе [37] приводятся основные способы образования
терминологических
словосочетаний
длиной
более
двух
слов
из
терминологических биграмм и однословных терминов во французском языке:
сверхкомпозиция и модификация. Сверхкомпозиция представляет собой простое
соположение основного терминологического словосочетания и одиночного
существительного или замена компонента термина другим терминологическим
сочетанием. Так, термин из сферы коммуникаций modulation par [déplacement de
phase] (рус. манипуляция сдвигом фазы) образован сочетанием терминологической
биграммы и простого существительного, а в термине réseau de transit à satellites
(рус. спутниковая транзитная сеть) происходит замена компонента réseau в
терминологической биграмме réseau à satellites на терминологическое
словосочетание réseau de transit. Модификация – способ образования новых
терминов при помощи модификаторов (прилагательных, наречий, предложных
конструкций): вставка модификатора в структуру основного термина (liaisons
[multiples] par satellite – рус. множественные спутниковые связи) или
51
использование модификатора в препозиции или постпозиции к основному
термину (amplificateur [à faible bruit] – рус. усилитель с низким уровнем шума).
Данные отношения характерны и для выделенных нами терминологических
словосочетаний.
Например, тройка переводных эквивалентов regional conflict (англ.) – conflit
régional (франц.) – региональный конфликт (рус.) последовательно встречается в
переводных терминологических словосочетаниях major regional conflict (англ.) –
conflit régional majeur (франц.) – основной региональный конфликт (рус.). Между
данными словосочетаниями можно установить родо-видовые отношения
(основной региональный конфликт как разновидность регионального конфликта),
которые соответствуют отношениям модификации по определению [37, p. 6–7], а
потому данные биграммы могут считаться терминологическими. Переводные
биграммы response operation (англ.) – opération de réponse (франц.) – операция
реагирования (рус.) последовательно соответствуют терминологическим
словосочетаниям crisis response operation (англ.) – opération de réponse aux crises
(франц.) – операция реагирования на кризис (рус.), образованным путём
сверхкомпозиции, поэтому они также носят терминологический характер.
Терминологическими можно считать переводные эквиваленты peaceful resolution
(англ.) – règlement pacifique (франц.) – мирное урегулирование (рус.), встречающиеся
в составе терминов peaceful resolution of international disputes (англ.) – résolution
pacifique des différends internationaux (франц.) – мирное разрешение международных
споров (рус.), переводные биграммы poor country (англ.) – pays pauvre (франц.) –
бедная страна (рус.), образующие терминологические сочетания heavily indebted
poor countries (англ.) – pays pauvres très endettés (франц.) – бедные страны с высоким
уровнем задолженности (рус.) и др.
Алгоритм позволяет выделять терминологические словосочетания с низкой
частотой встречаемости в корпусе текстов: transnational crime (англ., частота
встречаемости – 4) – criminalité transnationale (франц., частота встречаемости – 4) –
транснациональная преступность (рус., частота встречаемости – 3); settlement of
dispute (англ., частота встречаемости – 4) – règlement du différend (франц., частота
встречаемости – 4) – урегулирование спора (рус., частота встречаемости – 2);
territorial dispute (англ., частота встречаемости – 3) – différend territorial (франц.,
частота встречаемости – 1) – территориальный спор (рус., частота встречаемости –
3); radioactive material (англ., частота встречаемости – 2) – matière radioactive
(франц., частота встречаемости – 2) – радиоактивный материал (рус., частота
встречаемости – 2). Как и в случае с однословными терминами-кандидатами, среди
выделенных терминологических словосочетаний можно обнаружить варианты
переводных эквивалентов: missile defence (англ.) – défense contre missile, défense
antimissile (франц.) – противоракетная оборона (рус.); crisis response (англ.) –
réponse aux crises (франц.) – кризисное реагирование, реагирование на кризис (рус.);
52
world economy, global economy (англ.) – économie mondiale (франц.) – глобальная
экономика (рус.).
3.4. Выводы
В экспериментальной части данного исследования методика выделения
кандидатов в термины для переводного терминологического словаря реализована
на примере параллельного англо-франко-русского корпуса международных
юридических текстов. Для оценки точности алгоритма применялись формальные
критерии – релевантность выделенных слов и словосочетаний определяется на
основе их наличия/отсутствия в переводных и одноязычных терминологических
словарях и базах данных. Главной особенностью текстов по международным
отношения является их широкая тематическая направленность, поэтому для
определения релевантности слов/словосочетаний, выделенных из параллельного
корпуса текстов, использовались терминологические словари в области
экономики, политики, права, военного дела.
Алгоритм позволяет выделять переводные термины-кандидаты, не
зафиксированные в терминологических словарях, варианты терминов, а также
термины с низкой частотой встречаемости в корпусе текстов. Преимущество
алгоритма заключается также в простоте его реализации. Оценивая алгоритм,
необходимо понимать, что качество его работы зависит не только от собственно
методики, но и от качества морфологической разметки текстов, качества
выравнивания на уровне слов, а также от выбранной статистической меры для
определения статистической значимости терминов-кандидатов.
Точность алгоритма выделения однословных терминов-кандидатов
составляет 86%; выделение терминологических биграмм осуществляется с
меньшей точностью – 60%. Согласно [59, p. 167], для лексикографических задач
приемлемой считается точность алгоритма, равная 40%, поэтому можно
утверждать, что разработанный алгоритм облает достаточно высокими
показателями точности.
53
Заключение
Одной из важных задач современных корпусных исследований является
извлечение переводной терминологии. Многоязычный параллельный корпус
текстов даёт возможность извлекать переводные термины и терминологические
словосочетания и тем самым может служить основой для создания и расширения
переводных терминологических словарей различных отраслей знаний, а также
повышения качества и эффективности машинного перевода.
Извлечение терминологии из корпусов текстов осуществляется с помощью
статистического, лингвистического и смешанного методов, описанных в
теоретической части данного исследования. Для выделения переводных
терминов-кандидатов из многоязычных параллельных корпусов текстов чаще
всего используется алгоритм extract-then-align («выделение–выравнивание»),
состоящий из двух основных этапов – непосредственно выделение кандидатов в
термины в корпусе текстов и установление переводных соответствий между
выделенными словами и словосочетаниями.
В ходе данного исследования была разработана методика выделения
терминов-кандидатов для англо-франко-русского терминологического словаря на
базе параллельного корпуса текстов. В основе методики лежит смешанный подход
для извлечения терминологии, который сочетает в себе использование
морфосинтаксических шаблонов и статистических мер для определения
статистической значимости кандидатов в термины. Анализ морфосинтаксических
шаблонов на примере переводных терминологических словарей позволил
определить наиболее частотные шаблоны терминов гуманитарной области
знаний для английского, французского и русского языков, а также наиболее
характерные переводные соответствия между терминами и терминологическими
словосочетаниями данных языков. Однословные термины и терминологические
биграммы являются наиболее частотными терминологическими конструкциями
для английского, французского и русского языков, поэтому алгоритм,
разработанный в рамках данного исследования, использовался для выделения
именно этих типов терминов.
Экспериментальная часть данной работы была направлена на извлечение
переводных терминов-кандидатов из англо-франко-русского параллельного
корпуса международных юридических текстов. Однословные термины и
терминологические биграммы выделялись в соответствии с наиболее частотными
морфосинтаксическими шаблонами терминов, а их статистическая значимость
оценивалась с помощью простой частоты встречаемости (для однословных
терминов) и статистической меры log-likelihood (для терминологических
биграмм). Статистически значимые кандидаты определялись на основании порога
статистической значимости, а переводные соответствия между ними
54
устанавливались посредством метода опорного языка. В результате работы
алгоритма было выделено 484 однословных переводных кандидата в термины и
224 переводных терминологических словосочетания. Созданный нами
параллельный корпус текстов имеет самостоятельную ценность и может быть
использован в других исследованиях.
Оценка релевантности выделенных терминов-кандидатов осуществлялась на
основе формальных критериев – наличия или отсутствия данного слова или
словосочетания в переводных и одноязычных терминологических словарях и
многоязычных терминологических базах данных. Международные юридические
тексты
характеризуются
широкой
тематической
направленностью
и
терминологической неоднородностью, поэтому для оценки релевантности
терминов-кандидатов использовались терминологические словари разных
предметных отраслей.
Согласно результатам эксперимента, точность данного алгоритма для
выделения однословных терминов-кандидатов составляет 86%, для выделения
терминологических биграмм – 60%. Такие показатели точности являются
оптимальными для лексикографических задач. Анализ эффективности алгоритма
проводился на основании формальных критериев, поэтому для более точной
оценки релевантности выделенных переводных терминов-кандидатов требуется
участие специалистов данной предметной области и профессиональных
переводчиков.
Достоверность
полученных
результатов
обеспечивается
представительностью корпуса текстов и большим числом использованных
лексикографических ресурсов.
Представленная методика, с одной стороны, базируется на обширном анализе
научной литературы по данной теме; с другой стороны, полученные результаты
хорошо коррелируют с результатами других исследований.
Достоинства разработанного алгоритма заключаются в том, что он позволяет
выделять термины-кандидаты, не зафиксированные в существующих переводных
терминологических словарях, варианты терминов, а также редкие термины и
терминологические словосочетания. Стоит отметить, что описанная методика и
алгоритм отличаются простотой реализации, носят достаточно универсальный
характер и могут быть использованы для выделения терминов-кандидатов
различных предметных областей. При оценке алгоритма необходимо учитывать,
что на качество его работы влияет не только собственно методика, но и качество
выравнивания на уровне слов, качество морфологической разметки и выбор
статистической меры для оценки статистической значимости кандидатов в
термины.
55
Практическая значимость данного исследования заключается в том, что
выделенные переводные кандидаты в термины могут использоваться для
создания переводных терминологических словарей, расширения существующих
многоязычных терминологических ресурсов (терминологических банков, баз
данных), а также для создания лингвистических баз данных для систем
машинного перевода и других приложений.
56
Список литературы
1. Англо-русский экономический словарь. – ABBYY, 2001. – [Электронный
ресурс].
URL:
http://www.lingvo.ua/ru/LingvoDictionaries/Details?dictionary=LingvoEconomic
s+(En-Ru) (дата обращения: 16.05.2016).
2. Андрианов С.Н., Никифоров А.С., Берсон А.С. Англо-русский юридический
словарь. – М.: ABBYY Press, 2009. – 568 с.
3. Анисимова А.Г. К вопросу о переводе терминов гуманитарных наук // Язык,
сознание, коммуникация: Сб. статей / Отв. ред. В.В. Красных, А.И. Изотов. – М.:
МАКС Пресс, 2002. – Вып. 21. – 184 с.
4. Ахманова О.С., Минаева Л.В. О предмете и метаязыке учебной лексикографии
// Словари и лингвострановедение. – М.: Русский язык, 1982. – С. 5–11.
5. Беляева
Л.Н.
Автоматизированная
лексикография:
гуманитарные
технологии. – СПб.: Изд-во РГПУ им. А.И. Герцена, 2011. – 75 с.
6. Беляева Л.Н. Лексикографический потенциал параллельного корпуса
текстов // Труды международной конференции «Корпусная лингвистика –
2004». – СПб., 2004. – С. 55–64.
7. Беляева Л.Н. Параллельный корпус текстов в задачах лексикографического
анализа // Труды международной научной конференции «Корпусная
лингвистика – 2013». – СПб., 2013. – [Электронный ресурс]. URL:
http://corpora.phil.spbu.ru/Works2013/Беляева.pdf
(дата
обращения:
16.05.2016).
8. Бенжамен Г., Пике М. Экономический и коммерческий словарь. Англофранко-русский словарь. – М.: Международные отношения, 1993. – 448 с.
9. Большакова Е.И., Васильева Н.Э., Морозов С.С. Лексико-синтаксические
шаблоны для автоматического анализа научно-технических текстов //
Десятая Национальная конференция по искусственному интеллекту с
международным участием КИИ-2006: Труды конференции в 3-х томах. Т. 2. –
М.: Физматлит, 2006. – С. 506–524.
10. Браславский П., Соколов Е. Сравнение четырех методов автоматического
извлечения двухсловных терминов из текста // Компьютерная лингвистика
и интеллектуальные технологии: Труды международной конференции
«Диалог–2006».– М.: РГГУ, 2006. – С. 88–94. – [Электронный ресурс]. URL:
http://www.dialog-21.ru/digests/dialog2006/materials/html/Braslavski.htm
(дата обращения: 16.05.2016).
11. Браславский, П., Соколов, Е. Сравнение пяти методов извлечения терминов
произвольной длины // Компьютерная лингвистика и интеллектуальные
технологии: По материалам ежегодной Международной конференции
«Диалог 2008». – М.: РГГУ, 2008. – С. 67–74.
57
12. Васильева Н. Э. Шаблоны употреблений терминов и их использование при
автоматической обработке научно-технических текстов // Компьютерная
лингвистика и интеллектуальные технологии: Труды международной
конференции «Диалог–2004». — М.: РГГУ, 2004. — С. 96–101.
13. Вдовина О. А. Языковая специфика научного текста по международным
отношениям // Вестник МГИМО, 2010. – №5. – С.235–245.
14. Герд А.С. Введение в изучение языков для специальных целей: Учеб. пособие.
– СПб.: Филологический факультет СПбГУ, 2011. – 60 с.
15. Гринев C. B. Введение в терминоведение. – М.: Московский лицей, 1993. – 309
с.
16. Гринев-Гриневич, С.В. Терминоведение: Учеб. пособие. – М.: Академия, 2008.
– 303 с.
17. Ефремова
Н.Э.,
Большакова
Е.И.,
Носков
А.А.,
Антонов
В.Ю.
Терминологический анализ текста на основе лексико-синтаксических
шаблонов // Компьютерная лингвистика и интеллектуальные технологии:
По материалам ежегодной Международной конференции «Диалог 2010». –
М.: РГГУ, 2010. – С. 124–129.
18. Лантюхова Н.Н., Загоровская О.В., Литвинова Т.А. Термин: определение
понятия и его сущностные признаки // Вестник ВИ ГПС МЧС России, 2013. –
№1 (6). – С. 42–45.
19. Лейчик В.М. Терминоведение: предмет, методы, структура. – М.: Изд-во ЛКИ,
2007. – 256 с.
20. Лексикография русского языка: учебник для высших учебных заведений
Российской Федерации / А. С. Герд, Л. А. Ивашко, И. С. Лутовинова и др.; под
ред. Д. М. Поцепни / Учебно-методический комплекс по курсу
«Лексикография русского языка». – СПб.: Филологический факультет СПбГУ,
2013. – 704 с.
21. Мачковский Г.И. Французско-русский юридический словарь. – М.: ABBYY
Press, 2009. – 551 с.
22. Митрофанова О.А., Захаров В.П. Автоматизированный анализ терминологии
в русскоязычном корпусе текстов по корпусной лингвистике //
Компьютерная лингвистика и интеллектуальные технологии: По
материалам ежегодной Международной конференции «Диалог 2009». – М.:
РГГУ, 2009. – С. 321–328. – [Электронный ресурс]. URL: http://www.dialog21.ru/dialog2009/materials/pdf/49.pdf (дата обращения: 16.05.2016).
23. Морозова Ю.И. Извлечение переводных соответствий из корпуса
параллельных текстов с использованием методов дистрибутивной
семантики // Труды международной научной конференции «Корпусная
лингвистика – 2013». – СПб., 2013. – [Электронный ресурс]. URL:
http://corpora.phil.spbu.ru/Works2013/Морозова.pdf
(дата
обращения:
16.05.2016).
58
24. Новикова Д.С. Автоматическое выделение терминов из текстов предметных
областей и установление связей между ними // Труды всероссийской
конференции «Информационно-телекоммуникационные технологии и
математическое моделирование высокотехнологичных систем». – М.: РУДН,
2012.
–
[Электронный
ресурс].
URL:
http://conf.sci.pfu.edu.ru/index.php/ittmm/2012/paper/view/245/409
(дата
обращения: 16.05.2016).
25. Русско-английский военно-политический словарь. – Женева, 2002. –
[Электронный ресурс]. URL: http://www.twirpx.com/file/1636431 (дата
обращения: 16.05.2016).
26. Словарь современных военно-политических и военных терминов Россия–
НАТО. – Москва–Брюссель, 2001. – [Электронный ресурс]. URL:
http://www.twirpx.com/file/988419 (дата обращения: 16.05.2016).
27. Терминологическая база данных по военной реформе. – Специальная
рабочая группа Совета Россия–НАТО, 2005. – [Электронный ресурс]. URL:
http://www.nato.int/docu/other/ru/2005/050715/Database.pdf
(дата
обращения: 16.05.2016).
28. Усталов Д. А. Извлечение терминов из русскоязычных текстов при помощи
графовых моделей // Теория графов и приложения: материалы
конференции. – Екатеринбург: Уральский университет, 2012. – С. 62–69. –
[Электронный ресурс]. URL: http://koost.eveel.ru/science/CSEDays2012.pdf
(дата обращения: 16.05.2016).
29. Хохлова М.В. Исследование лексико-синтаксической сочетаемости в русском
языке с помощью статистических методов (на базе корпусов текстов): дис. …
канд. фил. наук. – СПб., 2010. – 211 с.
30. Ács J. Pivot-based Multilingual Dictionary Building using Wiktionary //
Proceedings of the 9th International Conference on Language Resources and
Evaluation (LREC'2014). – Reykjavik, 2014. – [Электронный ресурс]. URL:
http://www.lrec-conf.org/proceedings/lrec2014/pdf/864_Paper.pdf
(дата
обращения: 15.05.2016).
31. Aker A., Paramita M., Pinnis M., Gaizauskas R. Bilingual dictionaries for all EU
languages // Proceedings of the 9th International Conference on Language
Resources and Evaluation (LREC'2014). – Reykjavik, 2014. – [Электронный
ресурс].
URL:
http://www.lrecconf.org/proceedings/lrec2014/pdf/803_Paper.pdf
(дата
обращения:
15.05.2016).
32. Alegria I., Gurrutxaga A., Lizaso P., Saralegi X., Ugartetxea S., Urizar R.: Linguistic
and statistical approaches to basque term extraction // Proceedings of GLAT 2004:
The production of specialized texts. – Barcelona: ENST Breagne, 2004. –
[Электронный
ресурс].
URL:
59
https://www.elhuyar.eus/media/content/files/Erauzterm-Glatos-2004.pdf (дата
обращения: 15.05.2016).
33. Biel Ł. Corpus-Based Studies of Legal Language for Translation Purposes:
Methodological and Practical Potential // Online proceedings of the XVII European
LSP Symposium 2009. – Aarhus, 2010. – [Электронный ресурс]. URL:
http://www.academia.edu/596750/CorpusBased_Studies_of_Legal_Language_for_Translation_Purposes (дата обращения:
15.05.2016).
34. Borzovs J., Ilziņa I., Keiša I., Pinnis M., Vasiļjevs A. Terminology Localization
Guidelines for the National Scenario // Proceedings of the 9th International
Conference on Language Resources and Evaluation (LREC'2014). – Reykjavik,
2014.
–
[Электронный
ресурс].
URL:
http://www.lrecconf.org/proceedings/lrec2014/pdf/1189_Paper.pdf
(дата
обращения:
15.05.2016).
35. Church K., Hanks P. Word association norms, mutual information, and
lexicography // Computational Linguistics. – 1990. – Vol. 16. – Issue 1. – P. 22–29.
36. Daille B., Gaussier É., Langé J.-M. Towards automatic extraction of monolingual and
bilingual terminology // Proceedings of the 15th International Conference on
Computational Linguistics. – Kyoto, 1994. – P. 515–521.
37. Daille B. Combined Approach for Terminology Extraction: Lexical Statistics and
Linguistic Filtering. Technical papers // UCREL Technical Papers. – 1995. – Vol. 5.
–
[Электронный
ресурс].
URL:
http://ucrel.lancs.ac.uk/papers/techpaper/vol5.pdf
(дата
обращения:
15.05.2016).
38. Désilets A., Huberdeau L.-P., M., Quirion J. Building a Collaborative Multilingual
Terminology System // Proceedings of the ASLIB Translating and the Computer
Conference. – London, 2009. – [Электронный ресурс]. URL: http://wikitranslation.com/tiki-download_wiki_attachment.php?attId=57 (дата обращения:
15.05.2016).
39. Déjean H., Gaussier É., Sadat F. Bilingual terminology extraction: an approach
based on a multilingual thesaurus applicable to comparable corpora //
Proceedings of the 19th International Conference on Computational Linguistics. –
Taiwan,
2002.
–
[Электронный
ресурс].
URL:
http://www.xrce.xerox.com/Research-Development/Publications/2002-025
(дата обращения: 15.05.2016).
40. Department Of Defense Dictionary Of Military And Associated Terms: Joint
Publication 1-02. – US Department of Defense, 2010. – [Электронный ресурс].
URL: https://fas.org/irp/doddir/dod/jp1_02.pdf (дата обращения: 15.05.2016).
41. Evert S. The statistics of word cooccurences word pairs and collocations. PhD
thesis. – Institut für Maschinelle Sprachverarbeitung (IMS): Universität Stuttgart,
60
2004.
–
353
p.
[Электронный
ресурс].
URL:
http://elib.unistuttgart.de/handle/11682/2573 (дата обращения: 5.10.2010).
42. Fantinuoli C., Zanettin F. Creating and using multilingual corpora in translation
studies // New directions in corpus-based translation studies. – Berlin: Language
Science
Press,
2015.
–
[Электронный
ресурс].
URL:
http://www.academia.edu/12810278/Creating_and_using_multilingual_corpora_i
n_translation_studies (дата обращения: 15.05.2016).
43. Firth J.R. Selected papers of J.R. Firth, 1952–1959. – London: Harlow, Longman,
1968. – 219 p.
44. Gaussier E., Langé J.-M., Meunier F. Towards Bilingual Terminology // Proceedings
of the Joint ALLC/ACH Conference. – Oxford, 1992. – P. 121–124.
45. Guinovart X., Simoes A. Parallel corpus-based bilingual terminology extraction //
Proceedings of the 8th International Conference on Terminology and Artificial
Intelligence. – Toulouse, 2009. – [Электронный ресурс]. URL:
http://sli.uvigo.es/arquivos/TIA09.pdf (дата обращения: 15.05.2016).
46. Ha L.A., Fernandez G., Mitkov R., Corpas G. Mutual bilingual terminology extraction
// Proceedings of the 6th International Conference on Language Resources and
Evaluation (LREC'2008). – Marrakech, 2008. – [Электронный ресурс]. URL:
http://www.lrec-conf.org/proceedings/lrec2008/pdf/463_paper.pdf
(дата
обращения: 15.05.2016).
47. Heid U. On ways words work together – research topics in lexical combinatorics //
Proceedings of the 6th Euralex International Congress on Lexicography (EURALEX
’94). – Amsterdam, 1994. – P. 226–257.
48. Heylen K., Bond S., De Hertog D., Vulić I., Kockaert H. TermWise: A CAT-tool with
Context-Sensitive Terminological Support // Proceedings of the 9th International
Conference on Language Resources and Evaluation (LREC'2014). – Reykjavik,
2014.
–
[Электронный
ресурс].
URL:
http://www.lrecconf.org/proceedings/lrec2014/pdf/706_Paper.pdf
(дата
обращения:
15.05.2016).
49. Hilgert L., Lopes L., Freitas A., Vieira R., Hogetop D., Vanin A. Building Domain
Specific Bilingual Dictionaries // Proceedings of the 9th International Conference
on Language Resources and Evaluation (LREC'2014). – Reykjavik, 2014. –
[Электронный
ресурс].
URL:
http://www.lrecconf.org/proceedings/lrec2014/pdf/1112_Paper.pdf
(дата
обращения:
15.05.2016).
50. Kilgarriff A., Jakubíček M., Kovář V., Rychlý P., Suchomel V. Finding Terms in
Corpora for Many Languages with the Sketch Engine // Proceedings of the
Demonstrations at the 14th Conference of the European Chapter of the Association
for Computational Linguistics. – Goethenburg, 2014. – [Электронный ресурс].
URL:
https://www.sketchengine.co.uk/wpcontent/uploads/Finding_Terms_2014.pdf (дата обращения: 15.05.2016).
61
51. Kilgarriff A. Terminology finding, parallel corpora and bilingual word sketches in
the Sketch Engine // Proceedings of the ASLIB 35th Translating and the Computer
Conference. – London, 2013. –
[Электронный ресурс]. URL:
https://www.sketchengine.co.uk/wpcontent/uploads/2015/05/Terminology_finding_2013.pdf (дата обращения:
15.05.2016).
52. Lefever E., Macken L., Hoste V. Language-independent bilingual terminology
extraction from a multilingual parallel corpus // Proceedings of the 12th
Conference of the European Chapter of the ACL. – Athens, 2009. – [Электронный
ресурс].
URL:
http://www.academia.edu/2957382/Languageindependent_bilingual_terminology_extraction_from_a_multilingual_parallel_corpu
s (дата обращения: 15.05.2016).
53. Lu B., Tsou B.K. Towards bilingual term extraction in comparable patents //
Proceedings of the 23rd Pacific Asia Conference on Language, Information and
Computation (PACLIC). – Hong Kong, 2009. – P. 755–762. – [Электронный
ресурс]. URL: http://www.aclweb.org/anthology/Y09-2038 (дата обращения:
15.05.2016).
54. Manning Ch., Schütze H. Foundations of Statistical Natural Language Processing. –
Massachusetts: MIT Press, 1999. – 717 p.
55. Nenadic G., Okazaki N., Ananiadou S. Towards a terminological resource for
biomedical text mining // Proceedings of the 5th International Conference on
Language Resources and Evaluation (LREC'2006). – Genoa, 2006. – [Электронный
ресурс]. URL: http://www.lrec-conf.org/proceedings/lrec2006/pdf/352_pdf.pdf
(дата обращения: 15.05.2016).
56. Oakes M. Statistics for corpus linguistics. – Edinburgh: Edinburgh University Press,
1998. – 303 p.
57. Schmid H. Probabilistic Part-of-Speech Tagging Using Decision Trees //
Proceedings of International Conference on New Methods in Language Processing.
– Manchester, 1994. – [Электронный ресурс]. URL: http://www.cis.unimuenchen.de/~schmid/tools/TreeTagger/data/tree-tagger1.pdf
(дата
обращения: 15.05.2016).
58. Seretan V. Syntax-Based Collocation Extraction. – Berlin: Springer, 2011. – 222 p.
59. Smadja F. Retrieving collocations from text: Xtract // Computational Linguistics. –
1993. – Vol. 19. – Issue 1. – P. 143–177. [Электронный ресурс]. URL:
http://www.aclweb.org/anthology/J93-1007 (дата обращения: 16.05.2016).
60. Smadja F., McKeown K. Automatically extracting and representing collocations for
language generation // Proceedings of the 28th Annual Meeting of the Association
for Computational Linguistics. – Pittsburgh, 1990. – [Электронный ресурс]. URL:
https://www.aclweb.org/anthology/P/P90/P90-1032.pdf (дата обращения:
16.05.2016).
62
61. Somers H. Bilingual parallel corpora and Language Engineering // Anglo-Indian
Workshop "Language Engineering for South-Asian Languages". – Mumbai, 2001. –
[Электронный ресурс]. URL: http://www.emille.lancs.ac.uk/lesal/somers.pdf
(дата обращения: 16.05.2016).
62. Špela V. Using parallel corpora for translation-oriented term extraction. –
Ljubljana: Crotian Philological Society, 2000. – [Электронный ресурс]. URL:
https://www.researchgate.net/publication/233544867_Using_Parallel_Corpora_fo
r_Translation-Oriented_Term_Extraction (дата обращения: 16.05.2016).
63. Steinberger R., Pouliquen B., Widiger A., Ignat C., Erjavec T., Tufis D., Varga D. The
JRC-Acquis: A multilingual aligned parallel corpus with 20+ languages file //
Proceedings of the 5th International Conference on Language Resources and
Evaluation (LREC'2006). – Genoa, 2006. – [Электронный ресурс]. URL:
https://arxiv.org/ftp/cs/papers/0609/0609058.pdf
(дата
обращения:
16.05.2016).
64. Stubbs M. Words and Phrases: Corpus Studies of Lexical Semantics. – Oxford:
Blackwell, 2001. – 267 p.
65. Zadeh B., Handschuh S. Evaluation of Technology Term Recognition with Random
Indexing // Proceedings of the 9th International Conference on Language
Resources and Evaluation (LREC'2014). – Reykjavik, 2014. – [Электронный
ресурс].
URL:
http://www.lrecconf.org/proceedings/lrec2014/pdf/920_Paper.pdf
(дата
обращения:
16.05.2016).
63
Приложения
Приложение 1. Релевантные переводные однословные термины-кандидаты
для
англо-франко-русского
терминологического
словаря
(упорядочены по частоте английского эквивалента)
Английский эквивалент
Частота
Французский эквивалент
Частота
Русский эквивалент
Частота
security
931
sécurité
974
безопасность
957
alliance
605
alliance
211
союз
651
development
535
développement
620
развитие
528
state
535
état
97
государство
530
force
507
vigueur
63
сила
733
force
507
force
496
сила
733
cooperation
502
coopération
533
сотрудничество
571
cooperation
502
collaboration
24
сотрудничество
571
defence
490
défense
477
оборона
329
country
424
pays
813
страна
742
right
356
droit
546
право
496
effort
355
effort
298
усилие
354
capability
344
capacité
469
способность
130
party
319
partie
240
государство-участник
article
310
article
298
статья
309
operation
293
opération
303
операция
312
commitment
269
engagement
215
обязательство
216
commitment
269
obligation
76
обязательство
216
member
252
membre
271
член
197
crisis
249
crise
247
кризис
203
council
242
conseil
совет
265
partner
234
partenaire
249
партнер
177
partnership
220
partenariat
219
партнерство
167
disability
219
handicap
31
area
213
domaine
250
область
384
support
210
soutien
153
поддержка
232
peace
202
paix
263
мир
274
implementation
195
réalisation
threat
194
menace
196
угроза
224
treaty
190
traité
157
договор
212
stability
190
stabilité
200
стабильность
194
contribution
178
contribution
169
вклад
222
principle
176
principe
199
принцип
201
action
176
action
131
действие
299
principle
176
principe
199
принцип
213
people
170
peuple
137
народ
177
challenge
169
défi
141
проблема
116
challenge
169
problème
50
проблема
116
23
64
инвалидность
реализация
38
29
76
64
progress
168
progrès
151
прогресс
135
mission
167
mission
186
миссия
118
measure
166
mesure
310
мера
374
accordance
164
correspondance
соответствие
198
programme
161
programme
181
программа
207
basis
160
base
162
основа
192
basis
160
fondement
14
основа
192
law
154
loi
23
закон
70
need
153
besoin
175
потребность
89
dialogue
151
dialogue
162
диалог
153
committee
150
comité
107
комитет
144
resource
146
ressource
145
ресурс
155
convention
141
convention
163
конвенция
133
territory
139
territoire
149
территория
154
reform
139
réforme
139
реформа
144
policy
138
politique
98
политика
110
response
136
réaction
26
реагирование
121
response
136
réponse
81
реагирование
121
decision
135
décision
172
решение
300
decision
135
solution
31
решение
300
importance
133
importance
119
важность
84
agreement
132
accord
107
соглашение
132
system
132
système
141
система
181
level
131
niveau
205
уровень
281
initiative
125
initiative
110
инициатива
136
issue
123
question
165
вопрос
294
region
123
région
205
регион
220
region
123
zone
35
регион
220
activity
120
activité
148
деятельность
114
nation
120
nation
52
нация
276
responsibility
118
responsabilité
111
ответственность
management
116
gestion
126
управление
113
weapon
116
arme
144
оружие
164
declaration
115
déclaration
145
заявление
information
113
information
94
информация
112
information
113
renseignement
34
информация
112
framework
112
cadre
261
рамка
190
value
111
valeur
112
ценность
process
110
processus
conflict
109
conflit
authority
106
autorité
assistance
106
aide
terrorism
106
terrorisme
organisation
105
goal
104
environment
training
2
97
77
58
97
процесс
140
123
конфликт
120
100
власть
52
70
помощь
181
118
терроризм
114
organisation
312
организация
532
objectif
183
цель
527
104
environnement
108
обстановка
87
104
entraînement
44
подготовка
130
65
organization
104
organisation
goal
104
but
training
104
formation
consultation
103
consultation
consultation
103
conseil
government
102
gouvernement
use
101
respect
312
организация
532
68
цель
527
98
подготовка
130
110
консультация
124
23
консультация
124
105
правительство
111
utilisation
37
использование
100
101
respect
98
уважение
world
100
monde
80
мир
274
work
99
travail
136
работа
221
meeting
99
réunion
102
заседание
community
96
communauté
93
сообщество
80
ability
94
capacité
469
способность
130
ability
94
aptitude
39
способность
130
protocol
93
protocole
26
протокол
87
end
91
fin
95
конец
19
structure
91
structure
101
структура
159
communication
91
communication
101
сообщение
60
structure
91
acteur
56
структура
159
institution
89
institution
108
институт
34
provision
89
disposition
170
положение
98
control
89
maîtrise
68
контроль
99
purpose
87
but
68
цель
527
purpose
87
objectif
183
цель
527
protection
86
protection
99
защита
192
approach
85
approche
80
подход
92
interest
84
intérêt
112
интерес
116
freedom
82
liberté
99
свобода
106
transparency
79
transparence
78
прозрачность
36
assembly
79
assemblée
57
ассамблея
75
plan
79
plan
130
access
79
accès
72
доступ
84
child
76
enfant
70
ребенок
50
participation
76
participation
78
участие
154
education
76
éducation
27
образование
55
education
76
enseignement
37
образование
55
service
75
service
120
услуга
57
report
75
rapport
101
доклад
59
year
74
année
component
74
élément
opportunity
74
possibilité
77
resolution
74
résolution
103
year
74
an
opportunity
74
chance
9
review
72
revue
27
обзор
49
attack
71
attaque
43
нападение
45
risk
71
risque
74
риск
56
51
130
43
план
год
элемент
возможность
резолюция
59
45
110
303
53
205
77
год
303
возможность
205
66
mean
70
moyen
145
concept
70
concept
75
концепция
84
planning
70
planification
69
планирование
86
strategy
70
stratégie
71
стратегия
92
concept
70
concept
68
концепция
78
population
69
population
88
население
82
rule
67
règle|règles
26
правило
37
objective
67
objectif
arm
67
armement
76
вооружение
task
67
tâche
56
задача
context
67
contexte
78
контекст
57
technology
67
technologie
59
технология
62
ally
67
allié
37
союзник
56
objective
67
but
68
цель
527
obligation
66
obligation
76
обязательство
216
step
66
mesure
310
шаг
57
step
66
mesure
310
мера
374
obligation
66
engagement
215
обязательство
216
relation
65
relation
115
отношение
282
instrument
65
instrument
70
инструмент
33
instrument
65
outil
9
инструмент
33
paragraph
64
paragraphe
68
пункт
70
proliferation
64
prolifération
72
распространение
85
condition
61
condition
95
условие
157
number
61
nombre
70
число
317
mechanism
61
mécanisme
65
механизм
108
procedure
59
procédure
73
процедура
66
non-proliferation
59
non-prolifération
53
нераспространение
44
actor
59
acteur
56
структура
159
actor
59
structure
101
структура
159
democracy
57
démocratie
60
демократия
51
request
56
demande
70
запрос
29
field
56
domaine
250
область
384
exercise
55
exercice
87
учение
51
integrity
54
intégrité
52
целостность
40
consideration
54
examen
49
рассмотрение
51
concern
54
préoccupation
33
озабоченность
37
mandate
54
mandat
72
мандат
52
republic
54
république
33
республика
54
form
53
forme
68
форма
60
interoperability
53
interopérabilité
55
совместимость
55
situation
52
situation
85
ситуация
62
change
51
changement
46
изменение
68
woman
50
femme
63
женщина
69
sector
50
secteur
61
сектор
47
relationship
49
rapport
101
conference
49
conférence
183
20
средство
цель
отношение
конференция
336
527
91
179
282
48
67
relationship
49
relation
115
отношение
282
effect
48
effet
81
последствие
96
effectiveness
effect
48
efficacité
59
эффективность
79
48
conséquence
42
последствие
96
effect
48
implication
8
последствие
96
element
47
élément
элемент
53
integration
47
intégration
39
интеграция
50
command
47
commandement
48
командование
25
agency
46
agence
15
агентство
19
session
46
session
44
сессия
31
deterrence
46
dissuasion
70
сдерживание
69
health
46
santé
37
здоровье
22
society
44
société
52
общество
49
prevention
44
prévention
52
предотвращение
75
individual
43
individu
лицо
82
case
43
cas
discrimination
43
discrimination
44
дискриминация
45
poverty
42
pauvreté
42
нищета
43
debt
42
dette
33
задолженность
41
recommendation
41
recommandation
41
рекомендация
44
group
40
groupe
38
группа
76
group
40
equipe
7
группа
76
body
39
organe
35
орган
113
land
39
terre
25
земля
23
coordination
39
coordination
55
координация
58
body
39
organisme
39
орган
representative
38
représentant
36
представитель
46
place
37
lieu
69
место
59
economy
36
économie
39
экономика
43
infrastructure
36
infrastructure
30
инфраструктура
34
destruction
36
destruction
38
уничтожение
34
investment
36
investissement
30
инвестиция
33
economy
36
économie
39
экономия
engagement
35
engagement
confidence
35
confiance
57
доверие
59
disarmament
35
désarmement
39
разоружение
37
growth
35
croissance
35
рост
41
violence
35
violence
35
насилие
37
engagement
35
obligation
76
обязательство
war
34
guerre
24
война
31
border
34
frontière
31
граница
39
headquarters
34
siège
45
штаб-квартира
30
covenant
34
pacte
41
пакт
36
manner
33
manière
120
образ
104
sea
33
mer
29
море
35
exchange
33
échange
35
обмен
45
solidarity
33
solidarité
34
солидарность
36
130
8
151
215
случай
обязательство
131
113
7
216
216
68
potential
33
potentiel
19
потенциал
268
life
33
vie
50
жизнь
58
independence
32
indépendance
30
независимость
32
employment
32
emploi
48
занятость
17
aspect
32
aspect
31
аспект
39
improvement
32
amélioration
45
улучшение
50
forum
32
forum
16
форум
34
success
32
succès
31
успех
39
proposal
32
proposition
42
предложение
56
success
32
réussite
14
успех
39
proposal
32
suggestion
7
предложение
56
ratification
31
ratification
32
ратификация
21
custom
31
coutume
12
обычай
13
delivery
31
vecteur
25
доставка
27
deployment
31
déploiement
37
развертывание
62
family
31
famille
31
семья
46
benefit
30
avantage
22
выгода
12
standard
30
norme
31
стандарт
21
solution
30
solution
31
решение
300
solution
30
décision
172
решение
300
document
29
document
24
документ
85
month
29
mois
36
месяц
27
transformation
29
transformation
37
трансформация
14
guidance
29
indication
12
указание
59
financing
29
financement
53
финансирование
42
guidance
29
orientation
28
указание
51
guidance
29
directive
14
указание
51
understanding
28
compréhension
20
понимание
18
regulation
28
réglementation
14
норма
32
adaptation
28
adaptation
32
адаптация
35
sovereignty
28
souveraineté
28
суверенитет
28
regime
28
régime
34
режим
33
commission
28
commission
27
комиссия
26
source
27
source
33
источник
33
determination
27
détermination
47
решимость
86
governance
27
gouvernance
24
правление
amendment
27
amendement
17
поправка
27
language
26
langue
26
язык
28
reduction
26
réduction
32
сокращение
45
centre
26
centre
25
центр
32
secretary
26
secrétaire
result
25
jurisdiction
6
105
секретарь
112
résultat
42
результат
75
25
juridiction
28
юрисдикция
25
deposit
24
dépôt
29
хранение
47
assessment
24
évaluation
28
оценка
52
crime
24
criminalité
11
преступность
11
vision
24
vision
17
видение
16
69
recovery
24
relèvement
19
восстановление
58
vision
24
conception
16
видение
16
recovery
24
reconstruction
23
восстановление
58
dispute
23
différend
20
спор
22
spirit
23
esprit
37
дух
28
application
23
application
91
применение
82
consensus
23
consensus
21
консенсус
23
option
23
option
18
вариант
30
intelligence
23
renseignement
34
информация
112
eradication
23
élimination
26
искоренение
28
competence
23
compétence
33
компетенция
20
application
23
usage
20
применение
82
intelligence
23
information
94
информация
112
status
22
statut
30
статус
24
entry
22
entrée
18
вступление
51
settlement
22
règlement
65
урегулирование
75
statement
22
déclaration
145
заявление
58
presence
22
présence
22
присутствие
22
prosperity
22
prospérité
22
процветание
19
consent
22
consentement
20
согласие
35
project
22
projet
34
проект
24
accountability
22
redevabilité
cost
21
coût
37
стоимость
18
nature
21
nature
25
характер
44
recognition
21
reconnaissance
22
признание
25
advice
21
avis
12
совет
265
link
21
lien
40
связь
246
indivisibility
21
indivisibilité
19
неделимость
transition
21
transition
22
переход
link
21
liaison
19
связь
246
office
20
bureau
23
бюро
10
day
20
jour
37
день
40
doctrine
20
doctrine
20
доктрина
20
consequence
20
conséquence
42
последствие
96
involvement
20
participation
78
участие
surveillance
20
surveillance
25
наблюдение
32
equality
20
égalité
70
равенство
19
culture
20
culture
23
культура
26
package
20
paquet
17
пакет
20
election
20
élection
18
выборы
20
expertise
20
compétence
33
компетенция
20
consequence
20
effet
81
последствие
96
consequence
20
implication
8
последствие
96
movement
19
circulation
9
передвижение
problem
19
problème
50
проблема
116
direction
19
orientation
28
указание
51
coherence
19
cohérence
23
согласованность
12
5
подотчетность
5
18
7
154
10
70
problem
19
défi
141
проблема
116
direction
19
directive
14
указание
51
violation
negotiation
18
violation
20
нарушение
33
18
négociation
19
переговоры
37
bank
18
banque
19
банк
19
endeavour
18
endeavour
18
стремление
21
network
18
réseau
21
сеть
17
negotiation
18
pourparler
15
переговоры
37
factor
17
facteur
21
фактор
40
legislation
17
législation
25
законодательство
16
damage
17
dommage
17
ущерб
42
period
17
période
17
период
31
good
17
bien
27
товар
26
function
17
fonction
51
функция
34
architecture
17
architecture
13
архитектура
quality
17
qualité
29
качество
sustainability
17
viabilité
16
жизнеспособность
good
17
marchandise
17
товар
26
justice
16
justice
16
справедливость
10
offence
16
infraction
17
правонарушение
14
notification
16
notification
19
уведомление
21
rehabilitation
16
réadaptation
9
реабилитация
8
stage
16
stade
12
этап
24
openness
16
ouverture
19
открытость
16
cohesion
16
cohésion
17
слаженность
17
flexibility
16
souplesse
15
гибкость
16
dignity
16
dignité
16
достоинство
20
faith
15
foi
24
преданность
5
representation
15
représentation
10
представленность
6
signature
15
signature
16
подписание
19
reciprocity
15
réciprocité
12
взаимность
13
expert
15
expert
7
эксперт
10
transfer
15
transfert
16
передача
33
talk
15
pourparler
15
переговоры
37
instability
15
instabilité
15
нестабильность
19
water
15
eau
14
вода
10
attention
15
attention
19
внимание
77
consolidation
15
consolidation
27
консолидация
13
talk
15
négociation
19
переговоры
37
aggression
14
agression
12
агрессия
15
foundation
14
fondement
14
основа
enlargement
14
élargissement
16
расширение
80
dimension
14
dimension
21
измерение
9
material
14
matière
184
материал
fulfilment
14
exécution
25
выполнение
capital
14
capital
15
капитал
14
victim
14
victime
17
жертва
15
6
96
7
192
21
211
71
stabilisation
14
stabilisation
15
стабилизация
18
tradition
14
tradition
14
традиция
17
foundation
14
base
основа
192
fulfilment
14
accomplissement
12
выполнение
211
text
13
texte
19
текст
13
payment
13
paiement
10
выплата
16
conclusion
13
conclusion
14
заключение
15
contact
13
contact
16
контакт
anniversary
13
anniversaire
12
годовщина
14
mix
13
combinaison
13
сочетание
18
diversity
13
diversité
19
многообразие
8
mobility
13
mobilité
13
мобильность
14
corruption
13
corruption
12
коррупция
14
coverage
13
couverture
13
прикрытие
9
exploitation
13
exploitation
13
эксплуатация
autonomy
13
autonomie
15
самостоятельность
8
complementarity
13
complémentarité
14
взаимодополняемость
9
exploitation
13
maltraitance
8
denunciation
12
dénonciation
11
денонсация
liaison
12
liaison
19
связь
approval
12
approbation
11
одобрение
space
12
espace
11
пространство
reinforcement
12
renforcement
trend
12
organ
162
эксплуатация
8
14
14
8
246
8
24
111
укрепление
234
tendance
14
тенденция
11
12
organe
35
орган
sanction
12
sanction
11
cанкция
10
oversight
12
contrôle
68
надзор
20
piracy
12
piraterie
21
пиратство
13
liaison
12
lien
40
связь
246
organ
12
organisme
39
орган
113
oversight
12
supervision
10
надзор
20
well-being
11
bien-être
13
благосостояние
12
expression
11
expression
10
выражение
12
amount
11
montant
12
сумма
15
receipt
11
réception
8
получение
35
strengthening
11
renforcement
111
укрепление
234
tool
11
outil
9
инструмент
33
trading
11
commerce
31
торговля
52
method
11
méthode
13
метод
23
tool
11
instrument
70
инструмент
33
method
11
mode
11
метод
23
name
10
nom
17
имя
34
choice
10
choix
13
выбор
12
predictability
10
prévisibilité
предсказуемость
11
man
10
homme
мужчина
20
president
10
président
accessibility
10
accessibilité
9
137
13
6
президент
доступность
113
7
18
72
citizen
10
citoyen
9
man
10
homme
137
гражданин
человек
19
187
nationality
9
nationalité
11
гражданство
9
power
9
pouvoir
14
полномочие
12
continent
9
continent
13
континент
8
export
9
exportation
12
экспорт
6
team
9
équipe
7
группа
76
housing
9
logement
12
жилье
5
leader
9
dirigeant
12
лидер
8
resilience
9
résilience
10
сопротивление
8
humanity
9
humanité
11
человечность
6
team
9
groupe
38
группа
collaboration
8
collaboration
24
сотрудничество
majority
8
majorité
police
8
police
difference
8
différence
type
8
type
research
8
hunger
7
большинство
76
571
10
17
полиция
9
5
различие
10
14
вид
47
recherche
26
исследование
10
8
faim
10
голод
9
generation
8
génération
5
поколение
5
saving
8
économie
39
экономия
7
donor
8
donateur
9
донор
9
disease
8
maladie
8
болезнь
8
collaboration
8
coopération
difference
8
distinction
7
различие
minority
8
minorité
8
меньшинство
8
birth
7
naissance
7
рождение
7
self-determination
7
autodétermination
5
самоопределение
8
intention
7
intention
20
намерение
14
data
7
donnée
17
данные
22
barrier
7
obstacle
12
барьер
7
mobilization
7
mobilisation
price
7
prix
reintegration
7
réinsertion
5
реинтеграция
narcotic
7
stupéfiant
8
наркотик
19
path
7
voie
путь
72
suggestion
7
suggestion
7
предложение
56
suggestion
7
proposition
42
предложение
56
production
6
production
10
производство
11
tax
6
taxe
10
налог
11
adversary
6
adversaire
safeguard
6
garantie
credibility
6
crédibilité
8
авторитет
tolerance
6
tolérance
6
терпимость
distinction
6
distinction
7
различие
reconciliation
6
réconciliation
6
примирение
modernisation
6
modernisation
7
модернизация
533
9
13
54
8
19
сотрудничество
571
10
мобилизация
19
цена
10
противник
гарантия
5
8
33
8
5
10
6
17
73
lack
6
absence
4
отсутствие
25
examination
6
examen
49
рассмотрение
51
distinction
6
différence
heritage
5
patrimoine
5
различие
10
8
наследие
9
behaviour
5
comportement
5
поведение
diplomacy
5
diplomatie
5
дипломатия
5
rotation
5
rotation
6
ротация
6
viability
5
viabilité
16
жизнеспособность
7
criterion
5
critère
7
критерий
10
introduction
5
introduction
6
введение
24
engine
5
moteur
6
двигатель
4
income
5
revenu
13
non-discrimination
5
non-discrimination
mode
5
mode
internet
5
internet
5
интернет
5
privacy
5
confidentialité
6
конфиденциальность
4
inclusiveness
5
inclusivité
4
вовлеченность
5
shortfall
5
insuffisance
8
нехватка
diversification
5
diversification
5
диверсификация
7
supplier
5
fournisseur
7
поставщик
5
separatist
5
séparatiste
5
сепаратист
5
mode
5
méthode
5
11
13
11
доход
12
недискриминация
10
метод
23
метод
10
23
74
Приложение 2. Релевантные переводные терминологические
терминологического словаря
(упорядочены по коэффициенту log-likelihood английского эквивалента)
Английский
эквивалент
(леммы)
Logl
Freq
Английский
эквивалент
(зафиксированные в корпусе
словосочетания)
Французский
эквивалент
(леммы)
human rights
droit
homme
87
indigenous
peoples
271
75
242
61
242
61
nuclear weapon
226
missile defence
missile defence
human right
375
108
indigenous
people
359
collective
defence
euro-atlantic
area
euro-atlantic
area
de
Logl
Freq
392
124
peuple
autochtone
356
collective
defence
défense
collectif
euro-atlantic
area
euro-atlantic
area
région
euroatlantique
zone
euroatlantique
58
nuclear
weapons,
nuclear weapon
arme nucléaire
219
89
missile defence,
missile defences
219
89
missile defence,
missile defences
биграммы
Французский
эквивалент
(зафиксированные в корпусе
словосочетания)
для
Русский
эквивалент
(леммы)
англо-франко-русского
Logl
Freq
droits de homme
право человек
404
125
87
peuples
autochtones
коренной народ
346
100
261
74
défense
collective
коллективный
оборона
220
55
154
47
27
12
евроатлантичес
кого регион
евроатлантичес
кого регион
104
54
région
euroatlantique
zone
euroatlantique
104
27
259
∞
armes
nucléaires, arme
nucléaire
ядерный
оружие
345
84
défense contre
missile
∞
15
défense
missiles
противоракетн
ый оборона
∞
62
défense
antimissile
∞
85
défense
antimissiles,
défense
противоракетн
ая оборона
∞
17
contre
Русский эквивалент
(зафиксированные в
корпусе
словосочетания)
прав
человека,
правам
человека,
правах
человека,
права человека, прав
людей, право людей,
правами человека
коренных народов,
коренные
народы,
коренным народам,
коренному народу
коллективной
обороны,
коллективная
оборона,
коллективной
обороне
евроатлантического
региона
евроатлантического
региона
ядерного
оружия,
ядерным
оружием,
ядерное
оружие,
ядерному
оружию,
ядерном оружии
противоракетной
обороны,
противоракетной
обороне
противоракетная
оборона
75
antimissile
practical
cooperation
217
62
practical
cooperation
coopération
pratique
185
57
coopération
pratique
практический
сотрудничеств
о
201
59
territorial
integrity
191
37
territorial
integrity
intégrité
territorial
169
34
intégrité
territoriale
территориальн
ый целостность
193
36
international
law
159
49
international law
droit
international
178
62
droit
international
международны
й право
159
57
crisis
management
147
57
crisis
management
gestion du crise
123
38
gestion
crises
des
кризисный
регулирование
105
22
crisis
management
147
57
crisis
management
gestion de crise
81
26
gestion de crises,
gestion de crise
регулирование
кризис
19
7
international
community
141
45
international
community
communauté
international
175
56
communauté
internationale
международны
й сообщество
173
51
практическое
сотрудничество,
практического
сотрудничества,
практическому
сотрудничеству
территориальная
целостность,
территориальной
целостности,
территориальную
целостность
международному
праву,
международным
правом,
международного
права,
международном
праве,
международное
право,
международные
права
кризисного
регулирования,
кризисном
регулировании
регулирование
кризисов,
регулировании
кризисов,
регулированию
кризисов,
регулирования
кризисов
международного
сообщества,
международным
сообществом,
76
fundamental
freedom
138
29
fundamental
freedoms
liberté
fondamental
131
30
libertés
fondamentales
основополагаю
щий свобода
fundamental
freedom
138
29
fundamental
freedoms
liberté
fondamental
131
30
libertés
fondamentales
основной
свобода
security
environment
130
52
security
environment
environnement
de sécurité
141
50
environnement
de sécurité
41
sustainable
development
développement
durable
sustainable
development
129
political
dialogue
121
37
political dialogue
dialogue
politique
strategic
concept
108
28
strategic concept
concept
stratégique
8
2
109
27
обстановка
безопасность
23
10
41
développement
durable,
développement
durables
устойчивый
развитие
168
42
110
37
dialogue
politique,
dialogue
politiques
политический
диалог
121
37
171
48
concept
stratégique
стратегический
концепция
166
41
144
международному
сообществу,
международное
сообщество
основополагающие
свободы
основные свободы,
основных
свобод,
основным свободам,
основными
свободами
обстановку
безопасности,
обстановке
безопасности,
обстановка
безопасности,
обстановки
безопасности
устойчивое развитие,
устойчивого
развития,
устойчивому
развитию,
устойчивым
развитием
политический
диалог,
политического
диалога,
политическом
диалоге,
политическому
диалогу
стратегическую
концепцию,
стратегической
концепции,
стратегическая
концепция
77
international
organisation
94
security
challenge
92
30
international
organisations,
international
organisation
organisation
international
44
organisations
internationales,
organisation
internationale
124
международны
й организация
40
security
challenges
défi de sécurité
107
41
défis de sécurité
objectif
de
développement
71
28
100
36
проблема
безопасность
34
16
objectifs
de
développement
цель развитие
73
39
development
goal
87
34
development
goals,
development
goal
crisis response
84
26
crisis response
réponse au crise
77
25
réponse
crises
aux
кризисный
реагирование
18
4
crisis response
84
26
crisis response
réponse au crise
77
25
réponse
crises
aux
реагирование на
кризис
71
27
private sector
82
19
private sector,
private sectors
secteur privé
73
15
secteur
privé,
secteurs privé
частный сектор
90
19
economic
growth
81
21
economic
growth
croissance
économique
68
19
croissance
économique
экономический
рост
77
23
международными
организациями,
международных
организаций,
международной
организации,
международные
организации,
международная
организация
проблем
безопасности,
проблемы
безопасности,
проблемами
безопасности
целях
развития,
целей развития, цели
развития
кризисного
реагирования
реагированию
на
кризис,
реагирования
на
кризис,
реагирование
на
кризис
частного
сектора,
частный
сектор,
частным сектором,
частном
секторе,
частному сектору
экономического
роста,
экономическому
росту,
экономический рост,
экономическим
ростом
78
close
cooperation
close
cooperation
close
cooperation
69
69
69
20
close
cooperation,
closer
cooperation
coopération
étroit
20
close
cooperation,
closer
cooperation
dialogue étroit
20
close
cooperation,
closer
cooperation
10
4
coopération
étroite
тесный
сотрудничество
83
23
7
2
dialogue étroit
тесный
сотрудничество
83
23
étroit
coopération
32
8
étroite
coopération
тесный
сотрудничество
83
23
étroit
collaboration
∞
6
étroite
collaboration
тесный
сотрудничество
83
23
forces nucléaires
ядерный сила
71
25
capacités
nucléaires
ядерный сила
71
25
capacités
de
défense, capacité
de défense
оборонный
потенциал
69
24
close
cooperation
69
20
close
cooperation,
closer
cooperation
nuclear force
68
24
nuclear forces,
nuclear force
force nucléaire
82
27
nuclear force
68
24
nuclear forces,
nuclear force
capacité
nucléaire
10
6
36
defence
capabilities,
defence
capability
capacité
défense
83
42
defence
capability
65
de
тесного
сотрудничества,
тесному
сотрудничеству,
тесном
сотрудничестве,
тесное
сотрудничество
тесного
сотрудничества,
тесному
сотрудничеству,
тесном
сотрудничестве,
тесное
сотрудничество
тесного
сотрудничества,
тесному
сотрудничеству,
тесном
сотрудничестве,
тесное
сотрудничество
тесного
сотрудничества,
тесному
сотрудничеству,
тесном
сотрудничестве,
тесное
сотрудничество
ядерных
сил,
ядерные
силы,
ядерными силами
ядерных
сил,
ядерные
силы,
ядерными силами
оборонного
потенциала,
оборонный
потенциал,
79
оборонных
потенциалов
terrorist attack
financial
institution
regional
cooperation
conventional
force
62
61
58
56
13
20
terrorist attacks
financial
institutions
attaque
terroriste
31
institution
financier
46
7
attaques
terroristes,
attaque
terroriste
террористичес
кий нападение
institutions
financières
финансовый
учреждение
69
21
региональный
сотрудничеств
о
77
27
обычный сила
56
18
23
regional
cooperation
coopération
régional
71
27
17
conventional
forces,
conventional
force
force
conventionnel
97
27
forces
conventionnelles
56
27
energy security
sécurité
énergétique
conventional
arm
55
14
conventional
arms
response
operation
51
20
response
operations
110
30
sécurité
énergétique
энергетический
безопасность
armement
conventionnel
71
16
armements
conventionnels
opération
réponse
48
17
opérations
réponse
de
6
18
coopération
régionale,
coopération
régionales,
coopération
régionaux
energy security
28
de
129
31
обычный
вооружение
98
20
операция
реагирование
8
4
террористических
нападений
финансовых
учреждений,
финансовыми
учреждениями,
финансовые
учреждения,
финансовым
учреждениям
регионального
сотрудничества,
региональном
сотрудничестве,
региональному
сотрудничеству,
региональное
сотрудничество
обычных
сил,
обычные
силы,
обычными силами
энергетической
безопасности,
энергетическая
безопасность,
энергетическую
безопасность
обычными
вооружениями,
обычных
вооружений,
обычного
вооружения
операций
реагирования,
операции
80
реагирования
новых
членов,
новыми
членами,
новые члены
гражданского
общества,
гражданским
обществом,
гражданское
общество
демократических
ценностей,
демократических
ценностях,
демократическим
ценностям,
демократические
ценности
международная
безопасность,
международную
безопасность,
международной
безопасности,
международной
безопасностью
международная
безопасность,
международную
безопасность,
международной
безопасности,
международной
безопасностью
new member
51
18
new members
nouveau
membre
29
16
nouveaux
membres
новый член
48
19
civil society
50
14
civil society
société civil
45
14
société civile
гражданский
общество
47
14
democratic
value
49
13
democratic
values
valeur
démocratique
52
13
valeurs
démocratiques
демократическ
ий ценность
54
13
47
sécurité
internationales,
sécurité
internationale,
sécurité
international
международны
й безопасность
61
25
11
stabilité
internationales,
stabilité
internationale
международны
й безопасность
61
25
международны
й стабильность
24
10
международной
стабильности
стратегический
партнерство
53
18
стратегического
партнерства,
стратегическое
international
security
international
security
48
48
25
international
security
sécurité
international
25
international
security
stabilité
international
stabilité
international
24
11
stabilité
internationales,
stabilité
internationale
partenariat
stratégique
59
20
partenariat
stratégique
international
security
48
25
international
security
strategic
partnership
47
17
strategic
partnership
111
24
81
партнерство
peaceful mean
military
capability
international
cooperation
military
capability
45
45
45
45
12
peaceful means
moyen
pacifique
39
11
moyens
pacifiques
мирный
средство
29
11
23
military
capabilities,
military
capability
capacité
militaire
37
21
capacités
militaires
военный
потенциал
22
14
22
international
cooperation
coopération
international
56
27
coopération
internationale,
coopération
internationales
международны
й
сотрудничество
57
26
23
military
capabilities,
military
capability
force militaire
45
21
forces militaires
военный сила
7
7
right of person
43
23
rights of persons,
right of persons
droit
personne
conflict
prevention
42
12
conflict
prevention
common
interest
41
13
common
interest,
common
du
35
21
jouissance
droits
des
prévention du
conflit
57
15
prévention
conflits
des
intérêt
commun
71
25
intérêt commun,
intérêts
communs
право человек
47
22
предотвращени
е конфликт
62
16
общий интерес
50
20
мирными
средствами, мирные
средства
военные
потенциалы,
военного
потенциала, военных
потенциалах,
военный потенциал,
военных
потенциалов
международного
сотрудничества,
международное
сотрудничество,
международному
сотрудничеству
военные
военных
военную силу
силы,
сил,
правах
инвалидов,
правами инвалидов,
прав
инвалидов,
правам инвалидов,
права
инвалидов,
право инвалидов
предотвращения
конфликтов,
предотвращение
конфликтов,
предотвращению
конфликтов,
предотвращению
конфликта,
предотвращении
конфликтов
общих
интересов,
общий
интерес,
общие интересы
82
interests
proliferation
weapon
of
41
10
proliferation
weapons
security interest
41
15
security interest
41
military force
of
prolifération du
arme
78
22
prolifération des
armes
распространени
е оружие
48
14
security
interests
intérêt
sécurité
de
21
10
intérêts
sécurité
de
интерес
безопасность
22
11
15
security
interests
intérêt
sécurité
de
21
10
intérêts
sécurité
de
вопрос
безопасность
48
23
38
20
military forces
force militaire
45
21
forces militaires
военный сила
7
7
military force
38
20
military forces
capacité
militaire
37
21
capacités
militaires
военный сила
7
7
political
independence
37
11
political
independence
indépendance
politique
35
11
indépendance
politique
политический
независимость
39
10
effective
measure
37
15
effective
measures
mesure efficace
34
14
mesures
efficaces
эффективный
мера
10
7
mutual
confidence
32
8
mutual
confidence
confiance
mutuel
49
11
confiance
mutuelle
взаимный
доверие
57
12
распространению
оружия,
распространение
оружия,
распространением
оружия,
распространения
оружия
интересы
безопасности,
интересам
безопасности,
интересов
безопасности
вопросов
безопасности,
вопросу
безопасности,
вопросам
безопасности,
вопросы
безопасности,
вопросах
безопасности
военные
силы,
военных
сил,
военную силу
военные
силы,
военных
сил,
военную силу
политическая
независимость,
политической
независимости,
политическую
независимость
эффективные меры,
эффективных мер
взаимного доверия,
взаимному доверию,
83
взаимное
доверие,
взаимном доверии
financial
systems,
financial system
système
financier
mutual
confidence
confiance
réciproque
11
joint action, joint
actions
31
13
economic crisis
31
regional conflict
30
financial system
32
11
mutual
confidence
32
8
joint action
31
international
actor
système
financier,
systèmes
financiers
финансовый
система
27
11
32
13
9
2
confiance
réciproques
взаимный
доверие
57
12
action conjoint
23
8
action conjointe
совместный
действие
40
17
international
actors
acteur
international
33
14
acteurs
internationaux
международны
й структура
24
13
12
economic crisis
crise
économique
19
9
crise
économique
экономический
кризис
8
5
11
regional conflicts
conflit régional
41
12
conflits
régionaux
региональный
конфликт
34
11
финансовых систем,
финансовой системы,
финансовой
системой,
финансовых
системах
взаимного доверия,
взаимному доверию,
взаимное
доверие,
взаимном доверии
совместного
действия,
совместных
действий,
совместные
действия,
совместными
действиями,
совместным
действиям
международными
структурами,
международным
структурам,
международные
структуры,
международных
структур
экономический
кризис,
экономическим
кризисом,
экономического
кризиса
региональных
конфликтов,
региональными
конфликтами,
региональные
84
конфликты
defence
planning
terrorist threat
peaceful
settlement
peaceful
settlement
30
29
29
29
16
defence planning
planification de
défense
8
terrorist threat,
terrorist threats
menace
terroriste
6
peaceful
settlements,
peaceful
settlement
règlement
pacifique
6
peaceful
settlements,
peaceful
settlement
règlement
pacifique
question
sécurité
de
intérêt
sécurité
de
security issue
29
17
security issues,
security issue
security issue
29
17
security issues,
security issue
оборонный
планирование
36
10
7
menace
terroriste,
menaces
terroristes
террористическ
ий угроза
22
6
17
règlement
pacifique,
règlements
pacifiques
мирный
урегулирование
39
10
17
règlement
pacifique,
règlements
pacifiques
мирный
разрешение
42
10
de
25
16
questions
sécurité,
question
sécurité
вопрос
безопасность
48
23
21
10
intérêts
sécurité
de
вопрос
безопасность
48
23
33
24
74
74
14
planification
défense
de
de
оборонное
планирование,
оборонного
планирования
террористической
угрозы,
террористической
угрозе,
террористические
угрозы,
террористических
угроз
мирное
урегулирование,
мирного
урегулирования,
мирном
урегулировании
мирном разрешении,
мирному
разрешению,
мирного разрешения,
мирное разрешение,
мирным
разрешением
вопросов
безопасности,
вопросу
безопасности,
вопросам
безопасности,
вопросы
безопасности,
вопросах
безопасности
вопросов
безопасности,
вопросу
безопасности,
85
voluntary
contribution
28
8
voluntary
contributions
contribution
volontaire
31
9
command
structure
28
8
command
structure
structure
de
commandemen
t
81
command
structure
28
8
command
structure
structure
de
commandemen
t
general
recommendatio
n
26
5
general
recommendation
s
energy
infrastructure
26
8
energy
infrastructure
26
8
core element
freedom
movement
of
energy
infrastructures,
energy
infrastructure
energy
infrastructures,
energy
infrastructure
25
6
core element
24
6
freedom
movement
of
вопросам
безопасности,
вопросы
безопасности,
вопросах
безопасности
добровольных
вкладов,
добровольные
вклады
структуры
командования,
структура
командования
структура
управления,
структуры
управления,
структуре
управления
общие
рекомендации,
общими
рекомендациями,
общих
рекомендациях
contributions
volontaires
добровольный
вклад
18
5
23
structure
de
commandement
структура
командование
8
3
81
23
structure
de
commandement
структура
управление
5
3
recommandati
on général
10
3
recommandation
s générales
общий
рекомендация
14
5
infrastructure
énergétique
28
6
infrastructures
énergétiques
энергетический
инфраструктур
а
38
7
энергетической
инфраструктуры
infrastructure
énergétique
28
6
infrastructures
énergétiques
инфраструктур
а энергетика
5
1
инфраструктуру
энергетики
центральный
элемент
11
3
свобода
передвижение
41
9
élément central
34
9
éléments
centraux,
élément central
liberté
circulation
10
3
liberté
circulation
de
de
центральными
элементами,
центральный
элемент
свобода
передвижения,
свободу
86
international
relation
european
security
23
23
international
relations
relation
international
9
european
security
sécurité
européen
intérêt
stratégique
11
strategic interest
23
8
strategic
interests,
strategic interest
transnational
crime
23
4
transnational
crime
criminalité
transnational
10
international
stability
stabilité
international
international
stability
international
stability
international
stability
23
23
23
10
international
stability
stabilité
international
10
international
stability
sécurité
international
relations
internationales
международны
й отношение
21
11
7
sécurité
européenne,
sécurité
européens
европейский
безопасность
36
12
17
7
intérêts
stratégiques,
intérêt
stratégique
стратегически
й интерес
16
7
∞
4
criminalité
transnationale
транснационал
ьный
преступность
20
3
11
stabilité
internationales,
stabilité
internationale
международны
й стабильность
24
10
24
16
24
24
111
11
11
stabilité
internationales,
stabilité
internationale
международны
й безопасность
61
25
47
sécurité
internationales,
sécurité
internationale,
международны
й безопасность
61
25
передвижения,
свободы
передвижения,
свободе
передвижения
международных
отношениях,
международных
отношений,
международные
отношения
европейской
безопасности,
европейскую
безопасность
стратегические
интересы,
стратегических
интересов,
стратегический
интерес
транснациональная
преступность,
транснациональной
преступности
международной
стабильности
международная
безопасность,
международную
безопасность,
международной
безопасности,
международной
безопасностью
международная
безопасность,
международную
безопасность,
87
sécurité
international
international
obligation
22
equal right
22
7
international
obligations
obligation
international
7
equal
rights,
equal right
droit égal
international
levels,
international
level
niveau
international
17
7
obligations
internationales,
obligations
internationaux
8
3
droits égaux
равный право
11
5
53
22
niveau
international,
niveaux
international
международны
й уровень
61
25
международны
й
обязательство
31
13
international
level
22
11
financial
resource
22
8
financial
resources
ressource
financier
22
9
ressources
financières
финансовый
ресурс
41
14
additional
resource
22
7
additional
resources
ressource
supplémentair
e
14
5
ressources
supplémentaires
дополнительны
й ресурс
18
7
regional
organization
22
8
regional
organizations
organisation
régional
34
12
organisations
régionales
региональный
организация
41
14
humanitarian
assistance
22
7
humanitarian
assistance
aide
humanitaire
23
7
aide humanitaire
гуманитарный
помощь
34
9
международной
безопасности,
международной
безопасностью
международных
обязательств,
международные
обязательства,
международными
обязательствами
равного
права,
равных прав, равное
право, равные права
международном
уровне,
международного
уровня
финансовыми
ресурсами,
финансовых
ресурсов,
финансовые ресурсы
дополнительных
ресурсов,
дополнительные
ресурсы
региональной
организации,
региональными
организациями,
региональные
организации,
региональных
организаций,
региональной
организацией
гуманитарной
помощи,
гуманитарную
помощь,
гуманитарная
88
помощь
energy need
eradication
poverty
of
capability
development
22
7
energy needs
22
5
eradication
poverty
22
of
élimination de
pauvreté
86
17
élimination
pauvreté
11
développement
de
capacité,
développement
de capacités
engagements
internationaux,
engagement
international
17
engagement
international
7
5
centre
financier
5
2
22
7
financial centre
21
5
financial centres
21
5
transfer
technology,
transfer
technologies
20
9
social
social
6
développement
de capacité
international
obligations
of
22
capability
development,
capability
developments
international
obligation
transfer
technology
besoin
énergétique
9
of
of
transfert
de
technologie
38
8
développement
9
4
besoins
énergétiques
энергетический
потребность
de
centres
financiers
transferts
de
technologies,
transferts
de
technologie,
transfert
de
technologie,
transfert
de
technologies
développement
24
6
109
21
развитие
потенциал
25
14
международны
й
обязательство
31
13
финансовый
центр
11
5
искоренение
нищета
энергетических
потребностей,
энергетические
потребности
искоренения
нищеты,
искоренению
нищеты,
искоренение
нищеты,
искоренении
нищеты
развитии
потенциала,
развития
потенциала,
развитием
потенциала,
развитие
потенциала,
развитию
потенциала
международных
обязательств,
международные
обязательства,
международными
обязательствами
финансовых центров,
финансовые центры
передача
технология
37
7
передачи
технологии,
передачи
технологий, передаче
технологии,
передачу технологий
социальный
17
6
социального
89
development
development
social
social
развитие
common
understanding
20
6
common
understanding
compréhension
commun
5
2
compréhension
commune
общий
понимание
20
7
common
understanding
20
6
common
understanding
appréciation
commun
9
3
appréciation
commune
общий
понимание
20
7
20
4
resolution
disputes
17
4
règlement
différends
des
5
2
20
8
18
8
processus
réforme
de
процесс
реформа
18
9
региональный
безопасность
22
9
resolution
dispute
of
reform process
of
règlement
différend
du
reform
processes,
reform process
processus
réforme
de
12
7
sécurité
régionale,
sécurité
régionales
урегулирование
спор
regional security
19
11
regional security
sécurité
régional
regional security
19
11
regional security
stabilité
régional
8
4
stabilité
régionales
региональный
безопасность
22
9
regional security
19
11
regional security
stabilité
régional
8
4
stabilité
régionales
региональный
стабильность
10
4
programme
nucléaire
22
8
programmes
nucléaire,
programme
nucléaire
ядерный
программа
26
10
déclaration
politique
10
6
déclaration
politique
политический
декларация
14
6
nuclear
programme
18
6
nuclear
programme
political
declaration
18
5
political
declaration
развития,
социальному
развитию
общего понимания,
общему пониманию,
общее понимание
общего понимания,
общему пониманию,
общее понимание
урегулирование
споров
процесс
реформ,
процессу
реформ,
процессе
реформ,
процесс
реформы,
процесса
реформ,
процессах
реформ,
процесса реформы
региональной
безопасности,
региональную
безопасность
региональной
безопасности,
региональную
безопасность
региональную
стабильность,
региональной
стабильности
ядерная программа,
ядерной программы,
ядерной программой,
ядерных программ
политическая
декларация,
политическую
декларацию,
политической
декларацией,
политической
90
декларации
settlement
dispute
of
18
4
settlement
disputes
of
règlement
différend
du
settlement
dispute
of
resolution
conflict
of
resolution
conflict
of
resolution
conflict
of
17
4
règlement
différends
des
урегулирование
спор
18
4
settlement
disputes
of
règlement
différend
du
17
4
règlement
différends
des
18
4
resolution
conflicts
of
résolution
conflit
de
20
6
résolution
conflits
18
4
resolution
conflicts
of
règlement
conflit
du
21
6
18
4
resolution
conflicts
of
résolution
conflit
du
20
democratic
institution
17
6
democratic
institutions
institution
démocratique
direct threat
17
6
direct threat
menace direct
5
2
разрешение
спор
37
8
des
урегулирование
конфликт
69
16
règlement
conflits
des
урегулирование
конфликт
69
16
6
résolution
conflits
des
разрешение
конфликт
28
6
16
6
institutions
démocratiques
демократическ
ий институт
22
6
11
4
menace directe
прямой угроза
22
6
урегулирование
споров
разрешению споров,
разрешения споров,
разрешение споров,
разрешении споров
урегулированию
конфликтов,
урегулирование
конфликтов,
урегулировании
конфликтов,
урегулирования
конфликтов,
урегулирования
конфликта
урегулированию
конфликтов,
урегулирование
конфликтов,
урегулировании
конфликтов,
урегулирования
конфликтов,
урегулирования
конфликта
разрешение
конфликтов,
разрешения
конфликтов,
разрешении
конфликтов,
разрешением
конфликта
демократических
институтов,
демократические
институты
прямую угрозу
91
peaceful
resolution
17
4
peaceful
resolution
règlement
pacifique
74
17
règlement
pacifique,
règlements
pacifiques
future
generation
17
4
future
generations
génération
futur
13
3
générations
futures
будущий
поколение
18
4
règlement
pacifique
74
17
règlement
pacifique,
règlements
pacifiques
дружественный
урегулирование
16
3
différends
territoriaux
территориальн
ый спор
12
3
approche globale
широкий подход
12
6
12
4
21
4
27
7
6
7
∞
5
мирный
урегулирование
39
10
peaceful
resolution
17
4
peaceful
resolution
territorial
dispute
16
3
territorial
disputes
différend
territorial
5
1
broad approach
16
6
broad approach
approche
global
113
33
universal access
16
5
universal access
accès universel
8
2
accès universel
annual report
16
4
annual report
rapport annuel
17
4
rapport annuel
social protection
16
5
social protection
protection
social
24
6
protection
sociale
социальный
защита
military
authority
15
8
military
authorities
autorité
militaire
20
10
autorités
militaires
военный орган
foreseeable
future
15
4
foreseeable
future
avenir
prévisible
17
4
avenir prévisible
обозримый
будущее
8
2
diversité
culturelle
культурный
многообразие
8
2
8
2
diversité
culturelle
культурный
разнообразие
9
2
cultural
diversity
15
4
cultural diversity
diversité
culturel
cultural
diversity
15
4
cultural diversity
diversité
culturel
всеобщий
доступ
ежегодный
доклад
мирное
урегулирование,
мирного
урегулирования,
мирном
урегулировании
будущих поколений,
будущим
поколениям,
будущими
поколениями
дружественное
урегулирование,
дружественного
урегулирования
территориальные
споры,
территориальных
споров
широкого подхода,
широкому подходу,
широкий подход
всеобщего доступа,
всеобщий доступ
ежегодный доклад
социальная защита,
социальную защиту,
социальной защиты
военные
органы,
военных
органов,
военными органами
обозримом будущем
культурного
многообразия,
культурное
многообразие
культурного
разнообразия,
культурное
92
разнообразие
multi-ethnic
society
15
3
multi-ethnic
society
société
multiethnique
15
3
société
multiethnique
многонационал
ьный общество
5
2
global economy
15
5
global economy
économie
mondial
26
8
économie
mondiale
глобальный
экономика
5
2
15
5
deployment
forces
déploiement de
force|forces
6
4
déploiements de
forces,
déploiement de
forces
развертывание
сила
9
5
15
6
new
technologies
nouveau
technologie
∞
5
nouvelles
technologies
новый
технология
22
9
doctrine
militaire
12
4
doctrine
militaire,
doctrines
militaires
военный
доктрина
16
5
15
7
partenariat
mondial
глобальный
партнерство
13
6
9
4
secteurs
financiers,
secteur financier
финансовый
сектор
10
4
deployment
force
of
new technology
of
military doctrine
14
5
military
doctrine,
military
doctrines
global
partnership
14
7
global
partnership
partenariat
mondial
financial sector
14
5
financial sectors,
financial sector
secteur
financier
population civil
11
4
population civile,
populations
civiles
гражданский
население
20
5
∞
4
effets
préjudiciables
неблагоприятн
ый последствие
23
5
30
10
budgets
de
défense, budget
оборонный
бюджет
31
9
civilian
population
14
4
civilian
population,
civilian
populations
adverse impact
14
3
adverse impact,
adverse impacts
effet
préjudiciable
defence budget
14
7
defence budgets
budget
défense
de
многонационального
общества
глобальной
экономики,
глобальную
экономику
развертывания сил,
развертывание сил,
развертывании сил,
развертыванию силы
новых
технологий,
новых технологиях,
новыми
технологиями
военную доктрину,
военных
доктрин,
военным доктринам,
военной доктрины
глобальное
партнерство,
глобальному
партнерству,
глобального
партнерства
финансовым
секторам,
финансового
сектора,
финансовому
сектору
гражданского
населения,
гражданскому
населению
неблагоприятными
последствиями,
неблагоприятных
последствий
оборонных
бюджетов,
93
de défense
economic policy
fundamental
principle
fundamental
principle
14
13
13
6
economic
policies,
economic policy
politique
économique
4
fundamental
principles,
fundamental
principle
principe
fondamental
4
fundamental
principles,
fundamental
principle
principe
fondamental
opération
maritime
maritime
operation
13
7
maritime
operation,
maritime
operations
joint decision
12
5
joint decisions,
joint decision
décision
conjoint
élément
essentiel
19
41
41
politiques
économiques
экономический
политика
13
6
11
principes
fondamentaux,
principe
fondamental
основополагаю
щий принцип
24
6
11
principes
fondamentaux,
principe
fondamental
основной
принцип
19
7
морской
операция
11
4
6
4
12
4
14
3
25
6
право женщина
8
4
международны
й спор
6
4
5
13
7
opération
maritime,
opérations
maritimes
8
3
décision
conjointe
совместный
решение
24
9
élément
essentiel,
éléments
essentiels
существенный
элемент
essential
element
12
4
essential
element,
essential
elements
external debt
12
3
external debt
dette extérieur
13
3
dette extérieure
poor country
12
3
pays pauvre
21
5
right of woman
12
5
droit de femme
9
5
international
dispute
11
4
poor countries
right of women,
rights of women
international
dispute,
différend
international
9
3
pays pauvres
droits
des
femmes
différends
internationaux
внешний
задолженность
бедный страна
оборонные бюджеты,
оборонными
бюджетами
экономической
политике,
экономической
политики,
экономическая
политика
основополагающим
принципам,
основополагающих
принципов,
основополагающие
принципы
основным
принципам,
основные принципы,
основными
принципами,
основных принципов
морской операции,
морская операция
совместных
решений,
совместные решения
существенного
элемента,
существенным
элементом,
существенными
элементами
внешней
задолженности
бедных стран
прав женщин, права
женщин
международные
споры,
94
international
disputes
collective
security
11
6
natural resource
11
3
radioactive
material
11
2
political
guidance
11
4
multinational
project
11
friendly
settlement
11
collective
security
10
5
sécurité
collective
коллективный
безопасность
ressource
naturel
5
2
ressources
naturelles
matière
radioactif
10
2
political
guidance
directive
politique
11
3
multinational
projects
projet
multinational
2
friendly
settlement
règlement
amiable
règlement
pacifique
sécurité
alimentaire
natural resource,
natural
resources
radioactive
materials
friendly
settlement
11
2
friendly
settlement
food security
11
5
food security
friendly
settlement
11
2
friendly
settlement
sécurité
collectif
règlement
pacifique
12
5
природный
ресурс
8
2
matières
radioactives
радиоактивный
материал
9
2
4
directive
politique
политический
указание
57
16
16
4
projets
multinationaux
многонационал
ьный проект
20
4
∞
4
règlement
amiable
дружественный
урегулирование
16
3
74
17
règlement
pacifique,
règlements
pacifiques
дружественный
урегулирование
16
3
26
7
sécurité
alimentaire
продовольстве
нный
безопасность
21
5
17
règlement
pacifique,
règlements
pacifiques
74
мирный
урегулирование
39
10
международных
споров
коллективная
безопасность,
коллективной
безопасности
природных ресурсов
радиоактивных
материалов
политические
указания,
политических
указаний,
политических
указаниях,
политическими
указаниями,
политическим
указаниям
многонациональных
проектов
дружественное
урегулирование,
дружественного
урегулирования
дружественное
урегулирование,
дружественного
урегулирования
продовольственной
безопасности
мирное
урегулирование,
мирного
урегулирования,
мирном
урегулировании
95
political
guidance
11
4
political
guidance
orientation
politique
représentant
militaire
12
5
10
5
orientations
politiques
représentants
militaires,
représentant
militaire
législations
nationales,
législation
nationale
политический
указание
57
16
военный
представитель
9
5
национальный
законодательст
во
8
3
military
representative
10
5
military
representatives,
military
representative
national
legislation
10
5
national
legislation
législation
national
16
∞
political process
10
5
political process
processus
politique
5
4
processus
politique
политический
процесс
9
5
национальный
стратегия
29
11
national strategy
10
5
national
strategies
stratégie
national
34
15
stratégies
nationales,
stratégie
nationale,
stratégies
nationaux
political leader
10
4
political leaders
dirigeant
politique
11
4
dirigeants
politiques
политический
лидер
15
4
regional
organisation
10
4
regional
organisations
organisation
régional
34
12
organisations
régionales
региональный
организация
41
14
политические
указания,
политических
указаний,
политических
указаниях,
политическими
указаниями,
политическим
указаниям
военных
представителей,
военный
представитель
национального
законодательства,
национальном
законодательстве
политическом
процессе,
политического
процесса,
политический
процесс,
политическому
процессу
национальные
стратегии,
национальных
стратегиях,
национальных
стратегий,
национальными
стратегиями
политических
лидеров,
политические
лидеры
региональной
организации,
региональными
организациями,
96
региональные
организации,
региональных
организаций,
региональной
организацией
level of threat
world economy
adverse effect
10
5
level of threat
niveau
menace
10
3
world economy
économie
mondial
9
3
adverse effect,
adverse effects
effet
préjudiciable
organisation
international
de
international
organization
9
5
international
organizations
joint assessment
9
3
joint
assessments,
joint assessment
évaluation
conjoint
6
economic
development
développement
économique
5
international
conventions,
international
convention
convention
international
economic
development
international
convention
9
9
5
niveau
menace
26
8
économie
mondiale
глобальный
экономика
∞
4
effets
préjudiciables
11
8
5
2
неблагоприятн
ый последствие
23
5
organisations
internationales,
organisation
internationale
международны
й организация
100
36
évaluation
conjointe
совместный
оценка
19
6
13
développement
économiques,
développement
économique
экономический
развитие
10
5
6
convention
internationale,
conventions
internationales
международны
й конвенция
14
5
44
6
2
10
уровень угроза
5
124
30
de
уровня угрозы
глобальной
экономики,
глобальную
экономику
неблагоприятными
последствиями,
неблагоприятных
последствий
международными
организациями,
международных
организаций,
международной
организации,
международные
организации,
международная
организация
совместные оценки,
совместную оценку,
совместных оценок,
совместными
оценками
экономического
развития,
экономическом
развитии
международной
конвенции,
международным
конвенциям,
международную
конвенцию,
97
международная
конвенция
security
citizen
official
document
of
security
citizens
official
documents
9
3
8
2
civilian police
8
2
civilian police
regional stability
8
4
regional stability
8
4
cultural heritage
form
of
discrimination
8
8
2
4
of
sécurité
citoyen
document
officiel
du
sécurité
citoyens
documents
officiels
des
безопасность
гражданин
официальный
документ
6
3
14
3
police civil
5
2
police civile
гражданский
полиция
regional stability
stabilité
régional
8
4
stabilité
régionales
regional stability
stabilité
régional
8
4
cultural heritage
patrimoine
culturel
forms
of
discrimination
forme
de
discrimination
regional stability
8
4
regional stability
sécurité
régional
mutual respect
7
3
mutual respect
respect mutuel
macroeconomic
stability
7
2
macroeconomic
stability
financial
architecture
7
2
financial
architecture
stabilité
macroéconomi
que
architecture
financier
14
21
6
3
5
2
7
2
региональный
стабильность
10
4
stabilité
régionales
региональный
безопасность
22
9
3
patrimoine
culturels,
patrimoine
culturel
культурный
наследие
9
2
6
formes
de
discrimination,
forme
de
discrimination
12
7
7
3
7
2
7
3
sécurité
régionale,
sécurité
régionales
respect mutuel,
respect mutuels
stabilité
macroéconomiq
ue
architecture
financière
безопасности
граждан
официальные
документы
гражданскую
полицию,
гражданской
полиции
региональную
стабильность,
региональной
стабильности
региональной
безопасности,
региональную
безопасность
культурного
наследия,
культурное наследие
форм
дискриминации,
формам
дискриминации,
формы
дискриминации
региональной
безопасности,
региональную
безопасность
взаимного уважения,
взаимном уважении
форма
дискриминация
14
5
региональный
безопасность
22
9
11
3
8
2
макроэкономической
стабильности
7
2
финансовой
архитектуры
взаимный
уважение
макроэкономич
еский
стабильность
финансовый
архитектура
98
prevention
conflict
of
culture of peace
technology
transfer
7
2
prevention
conflicts
7
2
culture of peace
culture de paix
9
3
force
multinational
prospérité
économique
3
6
2
military
presence
6
3
military
presence
international
terrorism
6
2
military
planning
6
3
6
2
6
3
of
15
multinational
forces
economic
prosperity
6
of
57
transfert
de
technologie
2
victim
terrorism
protection
child
prévention de
conflit
technology
transfers,
technology
transfer
7
multinational
force
economic
prosperity
of
prévention
conflits
culture de paix
transferts
de
technologies,
transferts
de
technologie,
transfert
de
technologie,
transfert
de
technologies
forces
multinationales
prospérité
économique
38
8
8
4
5
2
présence
militaire
6
3
présence
militaire
international
terrorism
terrorisme
international
5
2
military planning
planification
militaire
5
3
victims
terrorism
protection
children
victime
terrorisme
protection
enfant
8
2
13
5
of
of
du
du
des
предотвращени
е конфликт
культура мир
передача
технология
62
16
7
3
предотвращения
конфликтов,
предотвращение
конфликтов,
предотвращению
конфликтов,
предотвращению
конфликта,
предотвращении
конфликтов
культура
мира,
культуры мира
передачи
технологии,
передачи
технологий, передаче
технологии,
передачу технологий
37
7
6
3
6
2
военный
присутствие
6
3
terrorisme
international
международны
й терроризм
6
2
planification
militaire
военный
планирование
22
9
жертва
терроризм
10
2
жертвам терроризма
защита дитя
11
5
защита
защиты
victimes
terrorisme
protection
enfants
du
des
многонационал
ьный сила
экономический
процветание
многонациональные
силы
экономическое
процветание
военное присутствие,
военного
присутствия
международном
терроризме,
международного
терроризма
военное
планирование,
военном
планировании,
военного
планирования
детей,
детей,
99
защите детей
development
financing
6
4
development
financing
financement du
développement
17
10
specific measure
6
3
specific
measures
mesure concret
21
élément
essentiel
financement du
développement
финансировани
е развитие
20
8
8
mesures
concrètes
конкретный
мера
12
7
24
9
élément
essentiel,
éléments
essentiels
существенный
элемент
12
4
27
4
7
3
ядерных материалов
5
2
политический статус
essential
component
5
2
essential
component
biological
diversity
5
1
biological
diversity
diversité
biologique
29
5
diversité
biologique
биологический
разнообразие
nuclear material
5
2
nuclear
materials
matière
nucléaire
8
3
matières
nucléaires
political status
5
2
political status
statut politique
5
2
statut politique
ядерный
материал
политический
статус
5
4
development of
capability,
development of
capabilities
control regime
5
2
control regimes,
control regime
régime
maîtrise
de
partnership
5
2
partnership
relation
de
development
capability
of
финансирование
развития,
финансирования
развития,
финансированию
развития,
финансированием
развития,
финансировании
развития
конкретные
меры,
конкретных мер
существенного
элемента,
существенным
элементом,
существенными
элементами
биологическом
разнообразии,
биологического
разнообразия
développement
de capacité
29
22
développement
des capacités
развитие
потенциал
25
14
17
5
régime
maîtrise
de
режим
контроль
22
6
8
4
relations
de
партнерский
115
25
развитии
потенциала,
развития
потенциала,
развитием
потенциала,
развитие
потенциала,
развитию
потенциала
режимы
контроля,
режима
контроля,
режим контроля
партнерских
100
relation
relations
partenariat
mass destruction
destruction
massif
mass
destruction
∞
22
decent work
∞
6
decent work
infectious
disease
∞
3
secondary
education
∞
3
∞
1
∞
2
∞
1
∞
1
∞
2
social
reintegration
countercyclical
measure
energy supplier
inviolability
border
rule
procedure
of
of
partenariat
отношение
destruction
massive
169
31
travail décent
∞
6
travail décent
infectious
diseases
maladie
infectieux
∞
3
maladies
infectieuses
массовый
уничтожение
достойный
работа
инфекционный
болезнь
secondary
education
enseignement
secondaire
∞
3
enseignement
secondaire
средний
образование
social
reintegration
countercyclical
measures
réinsertion
social
mesure
anticyclique
réseau
énergétique
inviolabilité du
frontière
règle
de
procédure
∞
1
∞
1
21
4
10
2
5
2
réinsertion
sociale
mesures
anticycliques
réseaux
énergétiques
inviolabilité des
frontières
règles
de
procédure
социальный
реинтеграция
антициклическ
ая мера
поставщик
энергия
нерушимость
граница
правило
процедура
energy suppliers
inviolability
borders
rules
procedure
of
of
conflict
resolution
∞
12
conflict
resolution
résolution
conflit
du
conflict
resolution
∞
12
conflict
resolution
règlement
conflit
du
отношений,
партнерские
отношения
массового
уничтожения
достойной работы,
достойную работу
инфекционные
болезни
среднего
образования,
среднему
образованию
социальной
реинтеграции
антициклических
мер
поставщиков
энергии
154
27
∞
6
∞
1
13
3
∞
1
∞
2
∞
1
∞
3
нерушимости границ
6
2
правила процедуры
20
6
résolution
conflits
des
урегулирование
конфликт
69
16
21
6
règlement
conflits
des
урегулирование
конфликт
69
16
урегулированию
конфликтов,
урегулирование
конфликтов,
урегулировании
конфликтов,
урегулирования
конфликтов,
урегулирования
конфликта
урегулированию
конфликтов,
урегулирование
конфликтов,
урегулировании
конфликтов,
урегулирования
конфликтов,
101
урегулирования
конфликта
poverty
eradication
∞
17
poverty
eradication
élimination de
pauvreté
86
17
élimination
pauvreté
de
искоренение
нищета
109
21
resource
mobilization
∞
2
resource
mobilization
mobilisation de
ressource
5
2
mobilisation
ressources
de
мобилизация
ресурс
12
3
stabilisation
operation
∞
3
stabilisation
operations
opération
de
stabilisation
7
3
opérations
stabilisation
de
операция
по
стабилизация
7
3
security concern
∞
4
security
concerns
intérêt
sécurité
de
21
10
intérêts
sécurité
de
вопрос
безопасность
48
23
entry into force
∞
1
entry into force
entrée
vigueur
en
62
16
entrée
vigueur
en
вступление
сила
43
16
conflict
resolution
∞
12
conflict
resolution
résolution
conflit
du
20
6
des
разрешение
конфликт
28
6
résolution
conflits
в
искоренения
нищеты,
искоренению
нищеты,
искоренение
нищеты,
искоренении
нищеты
мобилизации
ресурсов,
мобилизацию
ресурсов
операции
по
стабилизации,
операциям
по
стабилизации
вопросов
безопасности,
вопросу
безопасности,
вопросам
безопасности,
вопросы
безопасности,
вопросах
безопасности
вступления в силу,
вступлению в силу,
вступление в силу
разрешение
конфликтов,
разрешения
конфликтов,
разрешении
конфликтов,
разрешением
конфликта
102
security concern
security concern
∞
∞
4
security
concerns
intérêt
sécurité
de
4
security
concerns
question
sécurité
de
21
25
10
intérêts
sécurité
de
de
16
questions
sécurité,
question
sécurité
de
интерес
безопасность
22
11
вопрос
безопасность
48
23
интересы
безопасности,
интересам
безопасности,
интересов
безопасности
вопросов
безопасности,
вопросу
безопасности,
вопросам
безопасности,
вопросы
безопасности,
вопросах
безопасности
103
Приложение 3. Нерелевантные однословные переводные эквиваленты
(упорядочены по частоте английского эквивалента)
Английский
эквивалент
Французский
эквивалент
Частота
Частота
Русский эквивалент
Частота
capability
344
capacité
469
средство
336
capability
344
moyen
145
средство
336
council
242
conseil
23
консультация
124
council
242
avis
12
совет
265
person
214
personne
262
инвалид
178
person
214
jouissance
14
инвалид
178
peace
202
ordre
23
мир
274
peace
202
monde
80
мир
274
role
158
rôle
168
роль
181
summit
145
sommet
127
встреча
153
world
100
paix
263
мир
274
world
100
ordre
23
мир
274
regard
86
égard
106
связь
246
regard
86
liaison
19
связь
246
regard
86
lien
40
связь
246
universal
82
universel
57
всеобщий
35
membership
82
adhésion
88
членство
73
procedure
59
enquête
17
процедура
66
impact
58
effet
81
последствие
96
impact
58
conséquence
42
последствие
96
impact
58
implication
8
последствие
96
change
51
changement
46
климат
30
change
51
climat
6
климат
30
relationship
49
rapport
101
доклад
59
aspirant
45
candidat
59
кандидат
50
posture
42
posture
32
построение
achievement
34
objectif
183
цель
527
achievement
34
but
68
цель
527
future
33
avenir
36
будущее
58
exchange
33
partage
38
обмен
45
december
31
décembre
31
декабрь
29
aspiration
31
aspiration
31
устремление
19
climate
30
changement
46
изменение
68
century
30
siècle
32
век
30
staff
27
représentant
36
представитель
46
experience
27
expérience
45
наработка
6
efficiency
27
énergie
43
энергоэффективности
4
efficiency
27
énergie
43
энергетика
4
claim
23
indemnité
21
претензия
22
claim
23
négligence
5
претензия
22
human
22
homme
enjoyment
22
jouissance
42
137
человек
187
14
инвалид
178
104
enjoyment
22
personne
262
reconstruction
21
stabilisation
link
21
égard
106
связь
246
june
20
juin
20
июнь
20
expertise
20
compétence
33
знание
29
peacebuilding
20
consolidation
27
миростроительству
11
peacebuilding
20
consolidation
27
консолидация
13
april
19
avril
20
апрель
21
theatre
18
théâtre
18
театр
11
september
18
septembre
18
сентябрь
17
march
18
mars
18
март
18
fight
18
lutte
89
борьба
demand
16
exigence
15
корректива
6
increase
16
renforcement
111
повышение
112
increase
16
renforcement
111
укрепление
234
implication
13
incidence
39
последствие
96
liaison
12
égard
military
11
militaire
periphery
11
périphérie
11
периферия
logistic
11
logistique
15
обеспечение
15
106
6
инвалид
стабилизация
связь
военный
178
18
124
246
8
11
382
july
9
juillet
9
июль
9
proportion
9
proportion
6
часть
71
minority
9
national
disruption
9
perturbation
sympathy
9
auspice
135
меньшинство
8
11
кибернападения
10
sympathie
9
соболезнование
7
8
auspice
9
эгида
13
conjunction
8
concertation
9
договоренность
46
november
8
novembre
8
ноябрь
8
october
7
octobre
6
октябрь
5
chapter
7
chapitre
12
may
7
mai
7
май
7
distance
7
distance
9
удаление
7
chapter
7
chef
omission
6
négligence
exemption
6
restriction
hospitality
45
глава
39
глава
39
5
претензия
22
exemption
5
пошлина
8
6
restriction
9
движение
7
6
gratitude
9
благодарность
9
omission
6
indemnité
21
excellence
5
excellence
5
претензия
превосходство
22
6
105
Приложение 4. Нерелевантные переводные биграммы
(упорядочены по коэффициенту log-likelihood английского эквивалента)
Английский
эквивалент
(леммы)
Logl
Freq
Английский
эквивалент
(зафиксированные в корпусе
словосочетания)
Французский
эквивалент
(леммы)
Logl
Freq
Французский
эквивалент
(зафиксированные в корпусе
словосочетания)
Русский эквивалент
(леммы)
Logl
Freq
Русский эквивалент
(зафиксированные в
корпусе
словосочетания)
present
convention
230
62
present
convention
présent
convention
237
82
présente
convention
настоящий
конвенция
280
62
настоящей
конвенции,
настоящей
конвенцией,
настоящая
конвенция,
настоящую
конвенцию
euro-atlantic
security
148
46
euro-atlantic
security
sécurité euroatlantique
133
40
sécurité
euroatlantique
евроатлантическо
й безопасность
156
35
евроатлантической
безопасности
euro-atlantic
security
148
46
euro-atlantic
security
euroatlantique
stabilité
∞
1
euro-atlantique
stabilité
евроатлантическо
й безопасность
156
35
евроатлантической
безопасности
23
общую безопасность,
общей безопасности,
общая безопасность,
общей
безопасностью
common
security
95
36
common security
sécurité
commun
100
41
sécurité
commune,
sécurité
commun,
sécurité
communs,
sécurité
communes
stabilité
commun,
stabilité
communes
общий
безопасность
52
23
общую безопасность,
общей безопасности,
общая безопасность,
общей
безопасностью
intégration euroatlantique
евроатлантическо
й интеграция
67
12
евроатлантической
интеграции
common
security
95
36
common security
stabilité
commun
11
6
euro-atlantic
integration
78
18
euro-atlantic
integration
intégration
euro-
56
13
общий
безопасность
52
106
atlantique
common value
african country
75
68
23
common values
19
african countries
pays africain
contribution
significatif
rôle important
significant
contribution
64
20
significant
contribution,
significant
contributions
important role
59
21
important role,
important roles
international
effort
58
present article
57
valeur
commun
51
18
valeurs
communes
общий ценность
86
28
общим
ценностям,
общие
ценности,
общими ценностями,
общих
ценностей,
общих ценностях
17
pays africains
африканский
страна
79
19
африканские страны,
африканских стран,
африканским
странам,
африканских странах
42
12
contribution
significative,
contributions
significatives
значительный
вклад
85
24
значительный вклад,
значительным
вкладом
36
16
rôle important,
rôles importants
важный роль
67
25
важной роли, важную
роль, важная роль
65
26
international
effort,
international
efforts
effort
international
18
13
present article
présent article
∞
11
effort
international,
efforts
internationaux
международный
усилие
64
27
международными
усилиями,
международные
усилия,
международных
усилий,
международным
усилиям,
международных
усилиях
49
présent article
настоящий статья
∞
27
настоящей
статьи,
настоящей статьей,
настоящей статье
107
present article
response
operation
response
operation
57
51
51
significant
progress
49
european
democracy
48
political
consultation
impact of crisis
46
46
13
20
20
present article
response
operations
response
operations
présent
paragraphe
opération
réponse
opération
réponse
35
de
de
48
48
14
significant
progress
progrès
significatif
38
10
european
democracies
démocratie
européen
45
15
political
consultations,
political
consultation
consultation
politique
13
impacts of crisis,
impact of crisis
effet de crise
40
21
10
17
17
présent
paragraphe
opérations
réponse
opérations
réponse
настоящий статья
de
de
сила реагирование
операция
реагирование
по
∞
36
29
27
настоящей
статьи,
настоящей статьей,
настоящей статье
16
силы реагирования,
сил
реагирования,
силами
реагирования, силах
реагирования
12
операции
реагированию,
операций
реагированию,
операциях
реагированию
10
progrès
significatifs
значительный
прогресс
46
13
10
démocraties
européennes
европейский
демократия
∞
5
15
consultations
politiques,
consultation
politique
политический
консультация
6
effets de crise,
effet de crise
последствие
кризис
48
49
по
по
по
значительный
прогресс,
значительного
прогресса
европейских
демократий
15
политических
консультаций,
политические
консультации
14
последствия кризиса,
последствиям
кризиса, последствий
кризиса,
последствиями
кризиса
108
impact of crisis
military
capability
military
capability
military
capability
security
interest
46
45
45
45
41
13
impacts of crisis,
impact of crisis
conséquence
de crise
23
military
capabilities,
military
capability
capacité
militaire
37
23
military
capabilities,
military
capability
capacité
militaire
37
23
military
capabilities,
military
capability
moyen
militaire
15
security interests
sécurité
intérêt
5
6
5
2
conséquences de
crise
последствие
кризис
21
capacités
militaires
военный средство
21
capacités
militaires
военный сила
5
moyens
militaires
3
sécurité intérêt
военный средство
интерес
безопасность
14
последствия кризиса,
последствиям
кризиса, последствий
кризиса,
последствиями
кризиса
25
13
военные
средства,
военными
средствами, военных
средств
7
7
49
25
22
военные
военных
военную силу
силы,
сил,
13
военные
средства,
военными
средствами, военных
средств
11
интересы
безопасности,
интересам
безопасности,
интересов
безопасности
109
principle
of
indivisibility
european
defence
relevant
provision
multinational
cooperation
common
concern
38
32
32
32
31
11
principle
indivisibility,
principles
indivisibility
10
european
defence
9
11
10
of
of
principe
de
indivisibilité
défense
européen
relevant
provisions
disposition
pertinent
multinational
cooperation
coopération
multinational
common concern
intérêt
commun
41
25
23
22
71
11
9
principe
de
indivisibilité,
principes
de
indivisibilité
принцип
неделимости
défense
européennes,
défense
européenne
европейский
оборона
7
dispositions
pertinentes
соответствующий
положение
9
coopération
multinationale
многонациональн
ый сотрудничество
intérêt commun,
intérêts
communs
общий
озабоченность
25
51
26
27
17
17
13
принципа
неделимости,
принципе
неделимости,
принцип
неделимости,
принципов
неделимости,
принципы
неделимости
8
европейская
оборона,
европейской
обороны
11
соответствующие
положения,
соответствующим
положениям,
соответствующих
положений,
соответствующими
положениями,
соответствующих
положениях
6
многонационального
сотрудничества,
многонациональное
сотрудничество
7
общую
озабоченность,
общей
озабоченности
110
important
contribution
31
common
concern
31
important
contribution
31
13
important
contribution,
important
contributions
contribution
important
37
10
common concern
intérêt
commun
71
13
important
contribution,
important
contributions
important
contribution
structure de
commandeme
nt
81
23
6
command
structure
28
8
command
structure
subregional
organization
26
6
subregional
organizations
organisation
sousrégionales
∞
voluntary basis
25
6
voluntary basis
base
volontaire
14
24
26
constructive
role
25
8
constructive role
rôle
constructif
euro-atlantic
community
24
7
euro-atlantic
community
communauté
euroatlantique
common goal
23
7
common
goal,
common goals
objectif
commun
recent year
21
6
recent years
année dernier
15
contribution
importante,
contributions
importantes
важный вклад
54
19
важный
вклад,
важным вкладом
25
intérêt commun,
intérêts
communs
общий интерес
50
20
общих
интересов,
общий
интерес,
общие интересы
importante
contribution,
importantes
contributions
важный вклад
54
19
важный
вклад,
важным вкладом
структуре органов,
структуры органов,
структуру органов,
структура органов
3
structure
de
commandement
структура орган
20
12
3
organisations
sous-régionales
субрегиональных
организация
10
3
субрегиональных
организаций
4
base volontaire
добровольный
основа
21
6
добровольной основе
8
rôle constructif
конструктивный
роль
23
8
конструктивную
роль,
конструктивной
роли
7
communauté
euro-atlantique
евроатлантическог
о сообщество
14
3
евроатлантического
сообщества
28
8
objectifs
communs,
objectif commun
общий цель
36
15
общей целью, общая
цель, общую цель,
общих целей, общей
цели, общие цели,
общим целям
5
1
année dernière
последний год
20
6
последние
годы,
последний год
111
membership
aspiration
valuable
contribution
21
21
4
membership
aspirations,
membership
aspiration
aspiration
adhésion
7
valuable
contributions,
valuable
contribution
précieux
contribution
société
démocratique
à
2
aspirations
adhésion
5
précieuses
contributions,
précieuse
contribution
ценный вклад
14
4
société
démocratique,
sociétés
démocratiques
демократический
общество
21
6
35
10
7
∞
democratic
society
20
5
democratic
society,
democratic
societies
nuclear alliance
20
5
nuclear alliance
present
paragraph
20
5
present
paragraph
present
paragraph
20
5
present
paragraph
présent article
∞
49
unpredictable
world
19
4
unpredictable
world
monde
imprévisible
13
3
alliance
nucléaire
présent
paragraphe
à
5
2
стремлением
членству
22
6
ценный
вклад,
ценные вклады
16
5
демократического
общества,
демократическому
обществу
ядерный союз
11
5
ядерным союзом
настоящий пункт
22
5
настоящего пункта
présent article
настоящий статья
∞
27
monde
imprévisible
непредсказуемом
мир
∞
4
непредсказуемом
мире
alliance
nucléaire
présent
paragraphe
стремление
членство
к
настоящей
статьи,
настоящей статьей,
настоящей статье
planning
process
19
8
planning
processes,
planning process
processus de
planification
25
9
processus
de
planification
процесс
планирование
8
4
процесса
планирования,
процессы
планирования,
процессов
планирования,
процесс
планирования
strategic
importance
18
7
strategic
importance
importance
stratégique
13
6
importance
stratégique
стратегический
значение
5
3
стратегическое
значение
debt problem
18
5
debt problems,
debt problem
problème
dette
9
3
problème
dette
проблема
задолженность
9
3
проблем
задолженности
de
de
к
112
national
development
18
16
present
resolution
18
5
sector reform
effect
climate
17
of
common threat
common threat
15
15
15
6
4
7
7
national
development
national
de
développeme
nt
present
resolution
présent
résolution
sector
reform,
sector reforms
effects of climate
common threats,
common threat
common threats,
common threat
réforme
secteur
du
effet
du
changement
sécurité
commun
stabilité
commun
национальный
развитие
14
7
национального
развития,
национальному
развитию
19
4
настоящей
резолюции
8
3
реформы сектора
6
последствиям
изменения,
последствиями
изменения,
последствий
изменения
5
2
nationaux
de
développement
15
5
présente
résolution
настоящий
резолюция
6
réformes
du
secteur, réforme
du
secteur,
réforme
des
secteurs
реформа сектор
16
8
100
11
2
effets
des
changements
41
sécurité
commune,
sécurité
commun,
sécurité
communs,
sécurité
communes
6
stabilité
commun,
stabilité
communes
последствие
изменение
общий
безопасность
общий
безопасность
22
52
52
23
общую безопасность,
общей безопасности,
общая безопасность,
общей
безопасностью
23
общую безопасность,
общей безопасности,
общая безопасность,
общей
безопасностью
113
key element
15
5
key
elements,
key element
élément clé
7
3
éléments
clés,
élément clé
ключевой элемент
29
8
ключевые элементы,
ключевых элементов,
ключевым
элементом,
ключевого элемента
crucial role
14
4
crucial role
rôle crucial
26
7
rôle crucial
ключевой роль
27
10
ключевую
роль,
ключевой роли
14
5
provisions
paragraph,
provisions
paragraphs
положение пункт
10
3
положениями
пункта, положений
пунктов, положения
пункта
spirit
of
transparency
14
spirit
of
transparency
of
disposition du
paragraphe
25
7
dispositions du
paragraphe,
dispositions des
paragraphes
4
spirit
of
transparency
esprit
de
transparence
14
4
esprit
de
transparence
дух прозрачность
7
2
духе прозрачности
14
4
spirit
of
transparency
esprit
de
transparence
14
4
esprit
de
transparence
дух
транспарентности
6
2
духе
транспарентности
own choice
14
4
own choice, own
choices
propre choix
∞
2
propres choix
собственный
выбор
6
2
собственный выбор
crucial role
14
4
crucial role
rôle clé
14
5
rôle clé
ключевой роль
27
10
future
membership
13
4
future
membership
adhésion futur
24
6
adhésion future
будущий членство
16
4
active
participation
13
4
active
participation
participation
actif
9
3
participation
active
активный участие
37
11
активное
участие,
активного участия,
активном участии
provision
paragraph
of
of
ключевую
роль,
ключевой роли
будущему членству
relevant
resolution
13
4
relevant
resolutions
résolution
pertinent
68
16
résolutions
pertinentes
соответствующий
резолюция
43
12
соответствующих
резолюций,
соответствующих
резолюциях,
соответствующие
резолюции
key role
13
6
key role
rôle crucial
26
7
rôle crucial
ключевой роль
27
10
ключевую
роль,
ключевой роли
114
key role
13
military mean
principle
justice
of
defence sector
key role
rôle clé
7
military means
moyen
militaire
12
12
12
6
14
5
rôle clé
5
moyens
militaires
13
4
principes
justice
16
7
secteur
de
défense, secteurs
de défense
6
4
principles
justice
of
principe
justice
de
7
defence sector,
defence sectors
secteur
défense
de
37
21
ключевой роль
военный средство
de
27
25
10
ключевую
роль,
ключевой роли
13
военные
средства,
военными
средствами, военных
средств
принцип
справедливость
∞
4
принципами
справедливости,
принципах
справедливости
сектор оборона
5
2
сектора
обороны,
секторе обороны
военные
средства,
военными
средствами, военных
средств
military mean
12
7
military means
capacité
militaire
essential role
11
5
essential
role,
essential roles
rôle essentiel
14
7
rôle essentiel
существенный
роль
10
5
существенную роль
central role
11
4
central role
rôle central
15
5
rôle central
центральный роль
14
5
центральную роль
necessary
measure
11
5
necessary
measures
mesure
nécessaire
28
13
mesures
nécessaires
необходимый мера
11
6
необходимых
мер,
необходимые меры
active role
11
5
active role
rôle actif
14
6
rôle actif
активный роль
10
5
активную
роль,
активной роли
réforme
nécessaire
18
7
réformes
nécessaires
необходимый
реформа
10
4
необходимых
реформ,
необходимые
реформы
8
3
efforts
de
reconstruction
усилие
по
реконструкция
∞
1
усилиям
реконструкции
28
13
mesures
nécessaires
необходимый шаг
7
3
необходимые шаги
necessary
reform
11
5
necessary
reforms
reconstruction
effort
11
4
reconstruction
efforts
necessary
measure
11
5
necessary
measures
effort
de
reconstructio
n
mesure
nécessaire
capacités
militaires
военный средство
25
13
по
115
own security
strategic
environment
principle
democracy
mutual
transparency
key factor
8
own security
propre
sécurité
10
5
strategic
environment
environnemen
t stratégique
10
4
principles
democracy
principe
de
démocratie
3
mutual
transparency
11
of
10
10
3
key factors
of
transparence
réciproque
facteur clé
6
собственной
безопасности,
собственную
безопасность,
собственной
безопасностью
16
6
стратегической
обстановки,
стратегической
обстановке
принцип
демократия
10
4
принципах
демократии
взаимный
транспарентность
∞
1
взаимная
транспарентность
4
ключевых факторов,
ключевые факторы,
ключевыми
факторами,
ключевым фактором
15
5
ключевыми
областями,
ключевых областях,
ключевые области
6
5
общих
проблем,
общие проблемы
∞
1
взаимная
транспарентность
5
propre sécurité
собственный
безопасность
14
6
environnement
stratégique
стратегический
обстановка
12
4
principes
démocratie
3
transparence
réciproque,
transparence
réciproques
15
14
5
2
de
facteurs clés
ключевой фактор
key area
10
4
key areas
domaine clé
7
3
domaines clés
ключевой область
common
challenge
9
5
common
challenges
défi commun
9
6
défis communs
общий проблема
2
reciprocal
transparency
transparence
réciproque
3
transparence
réciproque,
transparence
réciproques
взаимный
транспарентность
reciprocal
transparency
9
14
15
12
116
effective
mechanism
area
of
cooperation
9
9
4
effective
mechanisms
mécanisme
efficace
5
areas
cooperation
of
domaine
de
coopération
réception de
communicatio
n
3
mécanismes
efficaces
7
domaines
de
coopération,
domaine
de
coopération
область
сотрудничество
7
2
réception
de
communication
получение
сообщение
∞
27
cas par cas
случай к случай
développement
économies
экономический
развитие
prochain
sommet
очередной встреча
développement
démocratique
демократический
развитие
8
9
receipt
of
communication
9
3
receipt
of
communication
case basis
9
2
case basis
cas par cas
développeme
nt économie
∞
1
84
22
economic
development
9
6
economic
development
next summit
9
2
next summit
prochain
sommet
4
democratic
development
développeme
nt
démocratique
democratic
development
8
7
3
эффективный
механизм
9
эффективного
механизма,
эффективные
механизмы,
эффективный
механизм,
эффективных
механизмов
7
областям
сотрудничества,
областей
сотрудничества,
области
сотрудничества
9
3
получением
сообщения,
получения
сообщения
∞
1
случая к случаю
10
5
экономического
развития,
экономическом
развитии
55
12
22
10
11
4
очередной встрече,
очередной встречи,
очередной встречей
демократическое
развитие,
демократического
развития
117
16
5
ressources
suffisantes
достаточный
ресурс
11
4
достаточных
ресурсов,
достаточными
ресурсами,
достаточные ресурсы
8
3
coordination
efficace
эффективный
координация
7
3
эффективной
координации
2
confiance
réciproques
взаимный доверие
8
2
technologie
moderne,
technologies
modernes
современный
технология
dissuasion
stratégique
8
3
dissuasion
stratégique
стратегический
сдерживание
base
de
réciprocité
8
3
base
réciprocité
objectif
de
développeme
nt
71
28
sufficient
resource
8
3
sufficient
resources
ressource
suffisant
efficient
coordination
8
2
efficient
coordination
coordination
efficace
2
reciprocal
confidence
confiance
réciproque
technologie
moderne
reciprocal
confidence
8
modern
technology
8
2
modern
technology
strategic
deterrence
8
3
strategic
deterrence
8
3
basis
reciprocity
8
4
achievement of
development
of
8
4
provisions
conventions,
provisions
convention
8
2
victims
violation
of
8
4
proliferation
activities
basis
reciprocity
of
achievement of
development
provision
convention
of
victim
violation
of
proliferation
activity
of
of
9
de
objectifs
de
développement
disposition de
convention
6
3
dispositions
convention
de
victime
violation
8
2
victimes
violation
de
8
4
activités
de
prolifération
de
activité
de
prolifération
основа взаимность
цель развитие
57
12
взаимного доверия,
взаимному доверию,
взаимное
доверие,
взаимном доверии
6
2
современных
технологий,
современная
технология
13
4
стратегического
сдерживания
9
3
основе взаимности
73
39
целях
развития,
целей развития, цели
развития
положение
конвенция
7
3
положения
конвенции,
положений
конвенции,
положениями
конвенции
жертва нарушение
9
2
жертвами нарушения
деятельность
по
распространение
10
3
деятельностью
по
распространению
118
new mission
8
reciprocal
confidence
8
4
new missions
nouveau
mission
2
reciprocal
confidence
confiance
mutuel
contribution
essentiel
5
6
5
nouvelles
missions,
nouvelle mission
новый миссия
5
3
новые миссии, новых
миссиях,
новой
миссии
confiance
mutuelle
взаимный доверие
57
12
взаимного доверия,
взаимному доверию,
взаимное
доверие,
взаимном доверии
3
contribution
essentielle,
contributions
essentielles
существенный
вклад
29
10
существенным
вкладом,
существенный вклад
8
4
effort collectif
коллективный
усилие
11
5
коллективных
усилий
∞
3
relations
amicales
дружественный
отношение
12
3
дружественных
отношений
5
2
конкретные проекты
49
11
essential
contribution
7
4
essential
contribution,
essential
contributions
collective effort
7
4
collective effort
effort collectif
friendly
relation
7
2
friendly relations
relation
amical
concrete
project
7
2
concrete projects
projet concret
8
2
projets concrets
конкретный
проект
last year
7
2
last year
année dernier
5
1
année dernière
последний год
20
6
последние
годы,
последний год
7
3
cultural life
spirit
reciprocity
vie culturel
esprit
de
réciprocité
6
2
культурный жизнь
17
4
культурной жизни
7
2
vie culturelle
esprit
de
réciprocité
8
2
духе взаимности
cultural life
spirit
reciprocity
of
effect of crisis
process
transition
of
key importance
7
2
of
7
3
effects of crisis
7
2
process
transition
7
3
key importance
of
дух взаимность
effet de crise
21
6
effets de crise,
effet de crise
последствие
кризис
49
14
последствия кризиса,
последствиям
кризиса, последствий
кризиса,
последствиями
кризиса
processus
transition
21
5
processus
transition
переходный
процесс
22
5
переходного
процесса,
переходный процесс
11
3
importance
cruciale
ключевой
значение
10
4
ключевое значение
importance
crucial
de
de
119
minimum level
effect of crisis
7
7
2
3
niveau
minimum
minimum level
conséquence
de crise
effects of crisis
26
5
7
2
niveau
minimum,
niveaux
minimums
conséquences de
crise
минимальный
уровень
последствие
кризис
19
5
минимальном
уровне,
минимального
уровня
14
последствия кризиса,
последствиям
кризиса, последствий
кризиса,
последствиями
кризиса
50
11
европейским
союзникам,
европейские
союзники,
европейских
союзников,
европейскими
союзниками
49
european ally
6
2
european allies
allié européen
14
1
alliés européens
европейский
союзник
complex
challenge
6
2
complex
challenges
défi complexe
13
4
défis complexes
сложный проблема
5
2
сложных проблем
necessary step
6
3
necessary steps
mesure
nécessaire
28
13
mesures
nécessaires
необходимый шаг
7
3
необходимые шаги
6
3
применение
положений,
применению
положений,
применения
положений
21
10
application
provision
of
country
region
of
6
3
application
provisions
of
6
3
countries
region
of
application du
disposition
10
6
pays de région
42
18
application des
dispositions
применение
положение
pays de région
страна регион
стран
региона,
страны
региона,
странами региона
120
people of world
6
3
peoples of world
peuple
monde
du
proliferation
risk
6
3
proliferation
risks
risque
de
prolifération
transition
process
6
2
transition
process
processus
transition
necessary step
6
3
necessary steps
mesure
nécessaire
3
own procedures
propre
procédure
étroit
consultation
own procedure
6
de
6
2
16
7
21
5
processus
transition
переходный
процесс
22
5
переходного
процесса,
переходный процесс
28
13
mesures
nécessaires
необходимый мера
11
6
необходимых
мер,
необходимые меры
3
propres
procédures
собственный
процедура
3
собственными
процедурами,
собственным
процедурам
∞
1
étroite
consultation
тесный
консультация
6
2
тесных
консультациях,
тесных
консультаций
97
27
forces
conventionnelles
обычный сила
56
18
mécanismes
existants
существующий
механизм
respect universel
всеобщий
уважение
6
6
3
conventional
capabilities
force|forces
conventionnel
mécanisme
existant
36
10
respect
universel
26
7
5
2
universal respect
народов
мира,
народы
мира,
народами мира
угроза
распространение
conventional
capability
universal
respect
5
risques
de
prolifération
2
2
10
3
6
5
народ мир
7
close
consultation
existing
mechanisms
du
угрозе
распространения,
угроз
распространения,
угрозы
распространения
close
consultation
existing
mechanism
peuples
monde
de
9
обычных
сил,
обычные
силы,
обычными силами
22
8
существующих
механизмов,
существующие
механизмы
7
2
всеобщему
уважению, всеобщего
уважения
121
5
décisions
politiques,
décision
politique
политический
решение
14
8
политических
решений,
политического
решения,
политическое
решение,
политическому
решению
5
2
force crédible
надежный сила
7
3
надежных
сил,
надежные
силы,
надежными силами
21
5
revue de posture
обзор построение
8
3
обзора построения,
обзор
построения,
обзоре построения
21
8
mesures
concrètes
конкретный мера
12
7
конкретные
меры,
конкретных мер
4
political
decisions,
political decision
décision
politique
6
5
2
credible force
force crédible
posture review
5
2
posture review
revue
posture
concrete step
5
2
concrete steps
mesure
concret
political
decision
5
credible force
de
political
decision
5
4
political
decisions,
political decision
solution
politique
5
4
solution
politique
политический
решение
14
8
политических
решений,
политического
решения,
политическое
решение,
политическому
решению
credible
capability
5
2
credible
capability
force crédible
5
2
force crédible
надежный сила
7
3
надежных
сил,
надежные
силы,
надежными силами
various
commitment
5
3
various
commitments
différent
engagement
5
3
différents
engagements
различный
обязательство
5
3
различных
обязательств
122
threat
environment
5
2
threat
environment
environnemen
t de sécurité
strategic
distance
∞
6
strategic
distance
important
milestone
∞
2
inter-state
communication
∞
1
security
concern
method
work
of
campaign
violence
of
environnement
de sécurité
обстановка
безопасность
23
10
6
distance
stratégique
стратегический
удаление
∞
5
стратегическом
удалении
13
4
étape importante
важный веха
7
2
важную веху
∞
1
communications
interétatiques
межгосударственн
ые сообщение
∞
1
межгосударственные
сообщения
141
50
distance
stratégique
∞
important
milestone
étape
important
inter-state
communications
communicatio
n
interétatique
∞
4
security
concerns
sécurité
intérêt
∞
1
methods of work
méthode
travail
∞
2
campaign
violence
campagne de
violence
of
de
обстановку
безопасности,
обстановке
безопасности,
обстановка
безопасности,
обстановки
безопасности
вопросов
безопасности,
вопросу
безопасности,
вопросам
безопасности,
вопросы
безопасности,
вопросах
безопасности
5
3
sécurité intérêt
вопрос
безопасность
48
23
15
5
méthodes
travail
de
метод работа
10
4
методы
работы,
методах
работы,
методов работы
5
1
campagne
violence
de
кампания насилие
∞
1
кампанию насилия
123
security
concern
∞
4
security
concerns
préoccupation
de sécurité
7
3
préoccupations
de sécurité
вопрос
безопасность
48
23
вопросов
безопасности,
вопросу
безопасности,
вопросам
безопасности,
вопросы
безопасности,
вопросах
безопасности
security
organisation
∞
3
security
organisation
organisation
pour sécurité
17
9
organisation
pour sécurité
безопасность
организация
10
11
безопасности
организации
12
организации
безопасности,
организация
безопасности,
организацией
безопасности,
организацию
безопасности
security
organisation
damaging
effect
∞
∞
3
2
security
organisation
damaging effects
organisation
pour sécurité
effet
préjudiciable
17
∞
9
4
organisation
pour sécurité
effets
préjudiciables
организация
безопасность
по
неблагоприятный
последствие
36
23
5
по
по
по
по
неблагоприятными
последствиями,
неблагоприятных
последствий
124
Отзывы:
Авторизуйтесь, чтобы оставить отзыв