ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ
«БЕЛГОРОДСКИЙ ГОСУДАРСТВЕННЫЙ НАЦИОНАЛЬНЫЙ
ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ»
( Н И У
« Б е л Г У » )
ИНСТИТУТ МЕЖКУЛЬТУРНОЙ КОММУНИКАЦИИ И
МЕЖДУНАРОДНЫХ ОТНОШЕНИЙ
КАФЕДРА АНГЛИЙСКОЙ ФИЛОЛОГИИ И МЕЖКУЛЬТУРНОЙ
КОММУНИКАЦИИ
СПЕЦИФИКА ИСПОЛЬЗОВАНИЯ ЛИНГВИСТИЧЕСКОГО
КОРПУСА ДЛЯ ИЗУЧЕНИЯ ПОЛИСЕМИИ СЛОВА
Выпускная квалификационная работа
обучающегося по направлению подготовки
45.03.03. Фундаментальная и прикладная лингвистика
очной формы обучения,
группы 04001417
Тищенко Анны Андреевны
Научный руководитель
к.ф.н, доцент
Белкина И.В.
БЕЛГОРОД 2018
2
ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ..............................................................................................................3
ГЛАВА 1. ОСНОВНЫЕ ТЕОРЕТИЧЕСКИЕ ПРОБЛЕМЫ
ИССЛЕДОВАНИЯ ЛИНГВИСТИЧЕСКИХ КОРПУСОВ..................................6
1.1
Основные положения корпусной лингвистики..........................................6
1.2
Традиционные и корпусные исследования.................................................8
1.3
История создания лингвистических корпусов.........................................10
1.4
Концептуальная классификация корпусов...............................................13
ВЫВОДЫ ПО ГЛАВЕ 1.......................................................................................19
ГЛАВА 2. ЯЗЫКОВОЙ КОРПУС КАК БАЗА ДЛЯ ИССЛЕДОВАНИЯ
МНОГОЗНАЧНЫХ СЛОВ...................................................................................21
2.1 Методы автоматического разрешения многозначности..............................21
2.2 Применение корпусных данных при анализе многозначных слов. Роль
контекста при выборе семантического варианта в многозначном слове.........27
2.3 Концептуальное моделирование процесса разрешения полисемии с
использованием корпуса.......................................................................................39
ВЫВОДЫ ПО ГЛАВЕ 2.......................................................................................47
ЗАКЛЮЧЕНИЕ......................................................................................................49
СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ...................................................51
СПИСОК ИСТОЧНИКОВ ФАКТИЧЕСКОГО МАТЕРИАЛА.........................53
3
ВВЕДЕНИЕ
Данная выпускная квалификационная работа посвящена изучению
специфики
использования
лингвистического
корпуса
для
изучения
полисемии слова. Повсеместная компьютеризация позволяет без труда
создавать большие языковые базы данных для изучения того или иного
языка.
Мы живем в эпоху повсеместного становления информационного
общества. Процессы информатизации значительно меняют и облегчают нашу
жизнь. Наиболее важным ресурсом в современном обществе становится
информация. Сохранение, преумножение и рациональное использование
этого ресурса стало иметь огромное значение для общества. Всеми этими
возможностями
обладает
лингвистический
корпус.
Кроме
того,
лингвистический корпус – это отличный источник поиска контекстуального
употребления слов.
Актуальность данной работы обусловлена необходимостью изучения
лексической многозначности слов в рамках одного из ведущих направлений
языкознания – корпусной лингвистики. С развитием компьютерной
лингвистики лексическая многозначность слова становится одной из главных
проблем для систем автоматической обработки текстов. В данной работе
затрагиваются актуальные вопросы выявления и описания лексической
многозначности.
Лексическая
многозначность
–
неотъемлемая
часть
естественного языка. Слова и словосочетания могут нести различную
смысловую нагрузку в зависимости от контекста, в котором они
использовались.
Цель
работы
состоит
в
выявлении
специфики
использования
лингвистического корпуса для изучения полисемии слова.
Поставленная цель диктует следующие задачи исследования:
4
1. Показать преимущества использования корпусов текстов для
решения теоретических и прикладных задач в лингвистике.
2. Проанализировать
особенности
реализации
автоматического
разрешения многозначности.
3. Продемонстрировать
изучении
результаты
многозначных
применения
частотных
слов
корпуса
в
при
современном
английском языке.
Объектом исследования является Британский национальный корпус
(British National Corpus) и Корпус современного американского английского
(Corpus of Contemporary American English).
Предметом исследования является семантические характеристики
многозначного слова в современном английском языке.
Материалом исследования послужили примеры многозначных слов,
почерпнутые из электронных текстов корпусов British National Corpus и
Corpus of Contemporary American English.
Методологической
основой
исследования
послужили
научные
положения, составляющие суть таких парадигм знания, как:
- компьютерная лингвистика, представленная трудами А.Н. Баранова,
В.П Захаровой, В.В. Рыкова и других ученых;
- лексическая семантика, разрабатываемая трудами Т.И. Вендиной, У.
Чейфом и другими.
Методы исследования. В процессе работы использовались следующие
методы:
- метод анализа словарных дефиниций;
- метод контекстуального анализа;
- метод концептуального моделирования;
- метод корпусного анализа.
Апробация работы. Основные положения и результаты данного
исследования
конференциях:
представлены
в
докладах
на
следующих
научных
5
«Проблемы, перспективы и направления инновационного развития
науки», 24 ноября 2017 г., г. Омск, Российская Федерация.
«Интеграционный процессы в науке в современных условиях», 20
марта 2018 г., г. Новосибирск, Российская Федерация.
Студенческая научная конференция в секции «Концептуализация
мира в языке. Компьютерная лингвистика», 18 апреля 2018 г., г.
Белгород в рамках Недели Науки ИМКиМО.
Структура работы. Данная работа состоит из Введения, двух глав,
Заключения, Списка используемой литературы и Списка источников
фактического материала.
Во Введении обосновывается актуальность данного исследования,
формулируются его цель, задачи, определяются методы исследования.
В первой главе представлена информация об основных положениях
корпусной
лингвистики,
традиционных
и
корпусных
исследованиях,
излагается история создания лингвистических корпусов, а также приводится
концептуальная классификация корпусов.
Во второй главе представлен анализ некоторых полисемантичных слов,
значения которых были изучены с помощью Корпуса современного
американского английского (Corpus of Contemporary American English,
COCA) и Британского национального корпуса (British National Corpus, BNC).
В Заключении в обобщенной форме излагаются основные результаты
исследования.
6
Глава 1. Основные теоретические проблемы исследования
лингвистических корпусов
1.1 Основные положения корпусной лингвистики
В настоящее время с помощью корпусов текстов можно с достаточно
большой точностью анализировать многочисленные факты реализации и
функционирования языковых единиц. Теоретически, английское слово
“corpus” корпус можно расшифровать, как “capable of representing potentially
unlimited selections of texts”, что означает – «способный представлять
потенциально неограниченный выбор текстов» (Dash, 2005: 35).
Корпусная лингвистика – многоаспектная область. Это область с
широким спектром, охватывающая все варианты языка в различных областях
языкового взаимодействия, общения и понимания.
Корпусная лингвистика – это подход, который направлен на изучение
языка и всех его свойств путем анализа больших наборов текстовых
образцов. Этот подход используется в ряде областей исследований на
протяжении веков: от описательного изучения языка до языкового
образования и лексикографии. В широком смысле это исчерпывающий
анализ любого значительного количества аутентичных, устных и/или
письменных образцов текста. В целом, он охватывает большой объем
машиночитаемых данных о фактическом использовании языка, который
включает в себя сборники литературных и нелитературных образцов текста,
чтобы отразить как синхронные, так и диахронные аспекты языка. Корпусная
лингвистика подходит к изучению языка в корпусах. Корпус представляет
собой большой, принципиальный набор естественных примеров языка,
хранящихся в электронном виде (Марчук, 2000).
В
контексте
систематического
исследования
языка
наиболее
актуальными являются возможности именно лингвистического корпуса. В
данной связи актуализируется целый ряд значимых научных проблем:
7
определение пределов допустимого доминирования корпусных данных в
сфере
теоретического
обустройства
науки
о
языке;
необходимость
формализации, репрезентации комплексной семантики языка и речи; учет и
использование новой коммуникативной реальности и другие.
Уникальность корпусной лингвистики заключается в использовании
современных компьютерных технологий в сборе языковых данных и
методов, используемых в информационном поиске.
Основная философия корпусной лингвистики имеет два направления:
a) у нас есть когнитивная установка, чтобы знать, как люди используют
язык в своей повседневной коммуникационной деятельности;
b) создать интеллектуальные системы, которые могут эффективно
взаимодействовать с людьми.
С этой мотивацией был разработан языковой корпус, который может
быть использован для проектирования интеллектуальных систем (например,
система машинного перевода, система обработки языка, система понимания
речи, текстовый анализ и т.д.). Все отрасли лингвистики и языковые
технологии могут извлечь выгоду из анализа корпусов. Таким образом,
описание и анализ лингвистических свойств, собранных из корпуса
приобретает первостепенное значение во всех областях человеческого знания
и применения (www.cyberleninka.ru).
Можно сделать вывод о том, что корпусная лингвистика включает в себя
два аспекта: во-первых, создание и разметка (аннотирование) корпусов
текстов и разработка средств поиска по ним и, во-вторых, собственно
лингвистический аспект – экспериментальные исследования на базе
корпусов.
Подытоживая, отметим, что корпусная лингвистика сделала возможным:
1. Уточнить результаты и выводы проведённых ранее исследований
речи.
2. Произвести новые, более широкие и системные (по охвату
эмпирического речевого материала) лингвистические исследования.
8
Важность подобной проблематики заключается в специфике развития
современной
лингвистики,
которую
сегодня
уже
вполне
можно
дифференцировать на докомпьютерную и компьютерную (интуитивную и
эмпирическую, информационную и семантическую и так далее). В настоящее
время уже нет сомнений в самостоятельности корпусной лингвистики в
структуре
языкознания.
Имеется
достаточно
оснований
считать
компьютерную парадигматику вспомогательной для корпусной методологии.
1.2 Традиционные и корпусные исследования
Многие русскоязычные источники свидетельствуют, что первая идея о
уса
п
р
ко
том, что достоверные лингвистические данные могут быть получены только
left
ж
зм
ево
н
ts
lan
p
из значительного массива текстов, была высказана Р. Г. Пиотровским в 60-х
у
н
р
сто
и
утр
вн
й
ачеи
зн
ted
an
w
ю
азви
н
годах XX века. Но осмысленные исследования в области корпусов
й
ьы
л
о
и
ац
н
е
ящ
асто
н
glish
en
проводились еще в 40-е годы американским лингвистом Л. Блумфильдом и
асть
вл
l
atio
n
ачеи
зн
другими учеными-лингвистами.
сю
о
ьн
аел
тщ
В 50-60-е годы возобладала концепция Н. Хомского, основателя
тексы
ве
о
н
й
о
тем
си
генеративной лингвистики, и она называлась хомскианская лингвистика
й
евы
чн
и
р
ко
касетя
ю
ачеи
зн
(англ. chomskyan linguistics). Данная концепция заключалась в том, что
к
о
стр
вать
о
ед
сл
и
гзач
о
н
м
необходимо изучать лишь языковое знание или «язык» по Соссюру
й
ьы
л
о
и
ац
н
х
ги
о
н
м
и
ен
ял
вы
(competence),
а
не
твй
и
гн
ко
языковое
ая
усн
п
р
ко
употребление
или
речь
по
й
ачеи
зн
Соссюру
а
д
хо
ер
п
в
то
н
ем
эл
(performance). Так как число высказываний естественного языка бесконечно,
ьзуетя
л
о
сп
и
ч
и
ал
н
еах
м
и
р
п
то и исследовать их бессмысленно. А с другой стороны, количество
сю
о
ьн
еятл
д
свечи
д
о
вы
языковых правил, которые и составляют языковое знание, конечно.
звест
и
о
р
п
я
л
тр
н
ко
h
to
Следовательно, их можно и нужно исследовать. Таким образом, произошел
х
ы
н
вед
и
р
п
ical
typ
й
ы
стян
о
п
ы
д
го
уход от эмпирики в сторону рационализма (Баранов, 1998). Тем не менее,
г
тако
eric
am
я
н
д
сего
некоторые ученые продолжали использовать корпусные методики и в период
г
о
ан
д
тес
н
ко
й
о
н
ад
кл
и
р
п
господства генеративной лингвистики.
а
всегд
ачеи
зн
г
чо
екси
л
9
В последнее время, одна из основных причин возрастания интереса к
й
вы
о
н
taio
sn
rep
и
сто
ьн
л
акси
м
о
ет
ж
о
м
корпусным исследованиям – повсеместная компьютеризация. Появление
е
ы
н
о
ц
и
ад
тр
ird
b
ка
о
п
компьютеров сделало возможной обработку огромных массивов текстов.
ус
п
р
ко
вется
казы
о
й
еи
н
м
со
Известные корпусные лингвисты Т. Мак-Эннери и Э. Уилсон считали, что
er
w
o
p
е
о
ан
д
необходимо
использовать
ть
яи
вы
и
й
ьы
л
о
и
ац
н
эмпирику,
и
интроспекцию,
я
и
ен
ал
уд
то
м
сы
ятн
о
вер
есть,
использование интуиции носителей языка, и искусственные данные, и
ет
ж
о
м
а
л
си
st
u
m
естественные. Но из корпуса текстов невозможно извлечь все возможные
ся
го
щ
ею
м
и
е
ы
чн
и
азл
р
р
о
б
вы
е
вн
о
ур
лингвистические выводы, то есть, можно сказать, что корпус текстов не
еы
м
и
р
п
й
ы
ан
д
свечи
является самодостаточным (Баранов, 2001).
й
ы
тр
и
н
о
м
е
ящ
асто
н
х
ы
ен
вл
и
ж
о
У. Чейф считает, что корпусный лингвист должен не только описывать
ary
n
icto
d
сй
ан
р
кто
ви
ью
п
м
ко
в
тер
явления языка, но и стараться объяснить их (Чейф, 2009). В настоящее время,
м
и
щ
ую
ед
сл
й
и
яш
н
д
сего
я
и
ан
зд
со
й
о
тем
си
ь
еи
встр
в центре внимания корпусной лингвистики оказалась языковая личность, то
st
co
р
о
б
вы
тк
о
азб
р
ы
ьн
ал
и
ец
сп
есть, ее речевая деятельность, массовая коммуникация и проблема ее
ау
тер
и
л
и
н
ем
вр
я
ем
вр
описания.
В. Рыков выделил основные отличия корпусной лингвистики от
й
о
учн
р
e
ld
fo
n
u
il
td
традиционной:
й
о
ьтр
кул
у
р
ан
ж
•Основное внимание уделяется изучению речи, а не изучению языка.
еах
м
и
р
п
я
ги
л
о
техн
я
и
ен
ал
уд
•Корпусная лингвистика в своих исследованиях опирается только на
ird
b
e
rid
ет
ж
о
м
данные корпуса текста, а не идет от теории к ее объяснению и
х
ы
тр
еко
н
х
ы
тр
ко
д
о
и
ер
п
о
ьн
еал
р
подтверждению фактами речи.
з
и
л
ан
•Корпусная
тя
хо
лингвистика
предпочитает
квантитативные
а
туд
(количественные) методы.
й
ы
н
и
аш
м
r
o
m
u
h
•Видит себя частью традиций, которые базируются на эмпирических
ci
glan
х
ы
чн
и
азл
р
е
тр
ко
методах, а не на рационалистических.
еа
м
и
р
п
•В корпусной лингвистике текст рассматривается как некоторая
ен
тавл
со
е
ы
чн
стаи
я
себ
физическая сущность.
связи
у
м
это
•Корпусная
лингвистика
занимается
arle
p
составлением
грамматики
конкретных языков, а не языковых универсалий.
етс
явл
ти
ед
всл
вь
о
б
ю
л
•Основное внимание уделяется форме и тексты рассматриваются в
тав
со
ус
п
р
ко
глобальной перспективе.
я
еи
авн
ср
е
сл
чи
е
ы
усн
п
р
ко
10
•Корпусная лингвистика фокусирует свое внимание на как можно более
ted
o
an
т
ваю
чи
есп
б
о
еы
м
и
р
п
широком взгляде на текст, неограниченном ни какими догмами, а в своих
b
stu
и
р
катего
та
чи
о
ед
р
п
в
ео
м
и
р
п
выводах опирается на наблюдение речевой деятельности, проявленной в виде
tifl
eau
b
ую
н
м
гр
о
ves
o
m
текстов.
д
во
ер
п
е
вн
о
ур
•Часто пользуется вероятностными методами и статистикой для
уя
зр
и
л
ан
st
u
m
й
ы
ен
м
и
р
п
первичной обработки речевого материала.
й
ен
стр
о
п
•Предпочитает
индуктивные
le
p
o
методы
st
co
обработки
й
ы
ур
хм
эмпирического
словесного материала и считает их сутью научного метода.
ь
и
ечал
встр
еи
ан
хр
со
х
зачы
н
д
о
•В корпусной лингвистике проводится работа с лингвистическими
й
во
и
ж
n
jargo
т
ен
о
м
данными в том виде, в каком они встречались в контексте (www.rykovn
erctio
p
зучен
и
я
себ
cl.narod.ru).
1.3 История создания лингвистических корпусов
ка
б
ю
гут
о
м
tifl
eau
b
Люди начали составлять и изучать корпусы ещё до появления корпусной
ятс
л
ед
р
п
о
er
w
o
p
т
и
ж
ер
д
со
лингвистики, начиная с XVIII века. Примерами могут служить исследования
й
н
д
о
er
w
o
p
ечвая
р
м
и
щ
ую
ед
сл
м
щ
ваю
сы
и
п
о
Библии (Cruden и многие другие), составление словарей (Johnson, Oxford
я
ем
вр
м
ы
н
важ
я
ачеи
зн
аквы
н
и
д
о
English Dictionary, Webster Dictionary), преподавание языков (частотный
х
вем
азы
н
в
о
сл
м
н
д
о
корпус Thorndike'а, 1921), дескриптивная грамматика (Fries, 1940, Quirk,
х
ы
н
вед
и
р
п
тав
со
ьу
скл
о
п
звест
и
о
р
п
качеств
1968). Так, корпус Квирка (Survey of English Usage) включал в себя один
fice
o
гая
р
о
д
в
зм
ги
л
ео
н
и
н
ем
вр
и
н
явл
ъ
ед
р
п
n
jargo
миллион словоупотреблений и изначально представлял собой один миллион
еи
тм
о
ти
ен
сб
о
se
lo
карточек размером 6 на 4 дюйма, 17 строк текста на каждой. Этот корпус
тс
ю
явл
е
тр
ко
м
и
щ
ую
ед
сл
м
таки
стал последним не электронным. Его составление заняло 25 лет, и он был
ки
ам
р
le
b
tain
su
е
вн
о
ур
закончен к 1989 году, но технология ушла далеко вперёд. Возникла
я
ги
л
эко
необходимость
(lab314.brsu.by).
х
ы
ен
вл
и
ж
о
ы
азц
р
б
о
срочно
таея
счи
переводить
корпус
м
уско
р
в
цифровую
и
сто
le
p
o
ен
м
форму
11
В
1960-е
годы
тексы
лингвисты
впервые
р
о
б
вы
собрали
егко
л
корпусы
ся
й
и
щ
атю
ш
компьютеризированных текстов. Первый компьютеризированный корпус –
ith
w
х
вы
сн
о
Брауновский корпус (The Brown Corpus). Полное название корпуса – The
ьй
туал
еп
ц
н
ко
е
о
зан
вы
b
stu
en
p
o
Brown Standard Corpus of American English. Он был разработан в
н
й
ваы
р
ти
о
ус
п
р
ко
усе
п
р
ко
Брауновском университете (Brown University) в США в 1963 году. Он
г
н
д
схо
и
st
co
g
lin
revo
х
ы
ан
д
tec
ro
p
включает в себя 500 текстов из американских газет, журналов, книг, которые
ith
w
уке
стр
чает
ю
вкл
е
ы
тр
ко
были опубликованы в США в 1961 году. Каждый текст в Брауновском
я
ставл
ед
р
п
тес
н
ко
g
rin
корпусе имеет длину 2000 слов, а все собрание текстов составляет 1 млн.
ch
su
г
тако
и
д
ю
л
ы
ер
сф
ted
o
an
слов. Авторами данного лингвистического корпуса являются У. Френсис (W.
ы
ер
сф
й
вы
о
н
м
и
щ
ую
ед
сл
agred
Francis) и Г. Кучера (H. Kucera), которые включили в него огромное
я
л
ви
о
стан
а
зуб
я
ван
екти
о
р
п
количество материала первичной статистической обработки, такого как
чека
ус
п
р
ко
о
ен
м
и
частотный и алфавитно-частотный словарь и различные статистические
й
вы
р
ти
о
ан
вй
ко
язы
ld
co
распределения.
Целью создания Брауновского корпуса является обеспечение системного
ве
сн
о
le
b
tain
su
ем
ящ
вр
го
и
л
ы
б
ьн
ал
и
ец
сп
ы
изучения отдельных жанров письменного английского языка и сравнение
вать
о
ед
сл
и
е
вн
о
ур
у
этм
о
п
м
сы
ятн
о
вер
жанров (Захаров, 2011). Появление этого корпуса вызвало большой интерес у
s
u
rp
o
еи
тм
о
eric
am
тр
еко
н
х
вем
азы
н
лингвистов и множество оживленных дискуссий. Они коснулись, в первую
сь
вш
ати
р
б
о
вм
асо
н
и
ф
ачеи
зн
очередь, принципов отбора текстов и состава решаемых на таком корпусе
тсуви
ео
ес
ц
о
р
п
ь
туал
еп
ц
н
о
arle
p
задач. С одной стороны, Брауновский корпус строился на основе
le
b
tain
su
и
м
ы
ен
ущ
асп
р
е
о
зан
вы
tes
u
in
m
ас
д
р
н
ко
статистических данных, а с другой, статистика применялась в сочетании с
ья
стар
n
irecto
d
вую
и
н
ьтер
ал
ролевыми решениями авторов корпуса, которые были основаны лишь на
х
и
ящ
сто
часто
ьш
л
о
б
е
е
д
ви
профессиональной интуиции. Для достижения максимальной объективности
газеты
этого
р
о
б
вы
непростого
ть
и
ел
д
вы
процесса
я
ан
д
атн
р
б
о
было
необходимо
ark
p
построение
наиболее
формализованных, прозрачных для проверки и контроля процедур (Рыков,
le
b
tain
su
h
to
ау
тер
и
л
2002).
я
и
н
л
ед
р
п
о
х
ы
чн
и
азл
р
Спустя некоторое время европейские исследователи составили корпус
е
н
ви
л
о
п
р
о
б
вы
й
ы
ур
хм
текстов следуя тем же принципам. В него входили 15 жанров (регистров),
il
td
ет
уд
б
fice
o
ы
ьн
ал
и
ец
сп
500 текстов по 2000 слов. Таким образом, он включал в себя 1 млн. слов
й
вски
о
аун
р
б
усах
п
р
ко
етс
явл
т
ю
ачи
н
s
u
rp
o
британского варианта английского языка, и его назвали корпусом Ланкастеря
ставл
ед
р
п
д
во
ер
п
е
и
ан
р
б
со
12
Осло-Берген (The Lancaster-Oslo-Bergen Corpus), по названию британского и
я
кац
тф
ен
д
и
в
то
н
ем
эл
re
d
n
u
h
я
чен
ю
закл
двух норвежских университетов.
ачеи
зн
itz
n
em
ch
Сбалансированные корпусы типа Брауновского очень важны для
усв
п
р
ко
ет
м
и
я
н
и
ед
ъ
б
о
исследователей, занимающиеся лингвистикой и которые хотят использовать
а
п
ти
я
ачи
н
е
ы
тр
ко
корпус в целях лингвистического описания и анализа.
ан
зд
со
ечь
р
ья
ал
ц
н
и
р
п
Таким образом, самые ранние большие корпуса – это корпусы
чски
д
во
ер
п
k
in
th
ьзуетя
л
о
сп
и
письменной речи американского и британского вариантов английского
г
д
р
ксф
о
и
н
явл
ъ
ед
р
п
тя
хо
й
ачеи
зн
языка. Оба корпуса остаются полезными и сейчас и на них основываются
д
о
вы
кте
хар
er
th
o
исследования английского языка многих лингвистов.
е
ящ
асто
н
уса
п
р
ко
я
н
д
сего
По прошествии нескольких десятилетий, компьютеры стали намного
звест
и
о
р
п
мощнее
и
облегчили
н
ж
о
м
процесс
я
и
н
л
ед
р
п
о
создания
а
ц
н
и
ед
е
тсуви
о
корпусов.
Таким
м
это
образом,
современные корпуса могут содержать уже миллиарды слов.
н
о
л
и
м
е
н
ви
л
о
п
й
н
хд
б
о
К 1990 году было зафиксировано более 600 компьютерных корпусов и в
м
это
х
твы
и
гн
ко
е
ьзван
л
о
сп
и
r
o
m
u
h
г
н
куо
последующие годы количество и многообразие создаваемых корпусов шло
d
san
u
o
th
very
ird
b
по нарастающей.
чека
Среди современных корпусов английского языка наиболее известны
й
ы
о
ар
ун
д
еж
м
м
и
щ
ую
ед
сл
le
b
tain
su
Британский национальный корпус (British National Corpus – BNC),
чек
стаи
еал
р
ьн
г
о
х
ы
ен
вл
и
ж
о
й
уго
р
д
ем
и
б
о
азн
р
Международный корпус английского языка (International Corpus of English –
х
зачы
н
д
о
сть
о
н
важ
le
b
tain
su
ICE), лингвистический Банк английского языка (Bank of English), Корпус
g
lackin
й
ы
тр
ко
ас
д
р
н
ко
р
о
б
вы
современного американского английского (Corpus of Contemporary American
и
н
д
о
а
ц
н
и
ед
stae
English – COCA) и другие.
в
о
сл
етч
и
н
К
первой
й
азо
р
ф
половине
1990-х
годов
al
rign
o
ки
ам
р
корпусная
лингвистика
ет
ж
о
м
уже
окончательно сформировалась как отдельное направление науки о языке.
b
stu
ю
азчеи
н
е
ящ
асто
н
«Корпусная лингвистика достигла зрелости» – так Я. Свартвик озаглавил в
ую
ктен
хар
ы
ер
сф
во
аси
м
1992 году предисловие к материалам первого Нобелевского симпозиума по
ct
exp
о
л
ан
ую
н
и
корпусной лингвистике (Svartvik, 1992).
е
аж
д
о
р
п
ха
о
эп
ет
ж
о
м
13
1.4 Концептуальная классификация корпусов
ech
sp
я
ачеи
зн
Поскольку электронный корпус – это новое понятие, ученым еще
t
n
m
p
evlo
d
e
rid
м
сы
ятн
о
вер
предстоит достичь общего консенсуса в отношении того, что считается
е
яти
н
о
п
тексы
ая
усн
п
р
ко
le
p
o
корпусом, и как его следует классифицировать. Некоторые ученые
м
ы
н
л
ед
р
п
о
й
о
ан
д
ья
ал
ц
н
и
р
п
предлагают разумный способ классификации корпусов с четко разделенными
етн
б
о
и
р
п
категориями.
й
во
ер
п
ая
р
вто
Лингвистические
н
ед
сл
о
п
критерии
er
th
могут
быть
н
ж
о
м
внешними
и
внутренними. Внешние критерии в значительной степени отображаются на
г
л
хо
си
п
s
ad
ro
le
b
tain
su
корпусах из типологии текстов, связанной с участниками, социальной
о
л
ы
б
й
чо
екси
л
и
н
д
о
t
gh
u
ro
d
к
ти
свар
обстановкой, коммуникативной функцией языка и др. Внутренние критерии
ая
усн
п
р
ко
чски
д
во
ер
п
текса
касаются повторения языковых паттернов внутри фрагмента языка.
у
р
ан
ж
ую
н
и
ац
м
р
о
ф
вую
и
н
ьтер
ал
Учитывая все эти пункты, корпусы можно классифицировать следующим
ь
л
н
о
и
ац
р
яти
н
о
п
я
уем
зр
и
л
ан
вая
ты
учи
образом: жанр текста, характер данных, тип текста, назначение конструкции
й
и
щ
б
о
s
u
rp
co
ья
ал
ц
н
и
р
п
и характер применения.
ачеи
зн
х
ы
тр
ко
По жанру текста среди корпусов различают письменные, речевые и
ath
p
sym
le
p
o
le
p
o
вь
о
б
ю
л
разговорные корпусы. Письменный корпус (Written Corpus) (например, TDIL
в
ко
ы
р
ея
д
и
азх
гл
х
ы
связан
ка
б
ю
Corpus) в силу своего жанра содержит только языковые данные, собранные
й
о
н
ад
кл
и
р
п
я
л
ви
о
стан
d
n
u
fo
е
и
ьш
л
о
б
из различных письменных, печатных, опубликованных и электронных
k
an
b
ь
л
н
о
и
ац
р
о
л
ы
б
источников. Речевой корпус (Speech Corpus) (например, Wellington Corpus of
ic
h
w
тях
ен
сб
о
ет
ж
о
м
вется
чи
закн
д
во
ер
п
Spoken New Zealand English) содержит все формальные и неформальные
gh
u
ro
н
ед
сл
о
п
ет
ж
о
м
обсуждения, дебаты, беседы, экспромт-анализ, диалоги, монологи, различные
у
р
ан
ж
м
это
ы
ьн
ал
и
ец
сп
типы разговора и т. д. В таких текстах нет сферы участия средств массовой
b
stu
й
ы
чн
аво
р
сп
е
н
щ
о
м
вь
о
б
ю
л
информации. Разговорный корпус (Spoken Corpus) (например, London-Lund
й
и
яш
н
д
сего
я
ем
вр
е
ы
тр
и
н
о
м
я
ан
д
ус
п
р
ко
Corpus of Spoken English) – это техническое расширение речевого корпуса,
аквы
н
и
д
о
н
ум
зад
азх
гл
содержит тексты разговорного языка. В таком корпусе речь представлена в
е
ы
усн
п
р
ко
ic
h
w
х
вем
азы
н
вг
асо
м
письменной форме без изменений кроме транскрипции.
кает
и
зн
во
gren
en
b
По характеру данных корпусы бывают общие, специальные, корпусы
вй
ко
язы
я
и
н
л
ед
р
п
о
n
jargo
подъязыка, примерные корпусы, литературные и мониторные.
чает
ю
вкл
s
ard
w
to
il
w
14
Общий корпус (General Corpus) (например, British National Corpus)
етс
явл
о
ьн
л
акси
м
й
ван
о
ед
сл
и
о
ен
м
и
у
р
ан
ж
включает общие тексты, принадлежащие к различным дисциплинам, жанрам,
е
такж
ts
lan
p
м
н
д
о
вая
ты
учи
предметным областям и регистрам. Количество типов текста и количество
я
р
сто
и
n
erctio
p
и
ен
ял
вы
слов и предложений в нем ограничено. Данный корпус имеет возможность
lgia
eco
я
зучен
и
х
ы
тр
ко
чн
и
р
п
ью
щ
м
о
п
пополняться с течением времени, посредством добавления новых данных с
т
ю
ачи
н
х
и
щ
уд
б
х
вы
и
ж
г
со
кн
и
ер
ам
наличием новых текстов. Общий корпус богат своим разнообразием и
е
ы
чн
и
азл
р
ет
ж
о
м
вы
чи
й
усто
широко используется.
усв
п
р
ко
о
н
уд
тр
Специальный корпус (Special Corpus) (например, база данных CHILDES)
г
н
д
схо
и
й
ы
ур
хм
le
p
o
k
in
th
разработан из текстов, отобранных в общий корпус для конкретного языка
ьзуетя
л
о
сп
и
я
н
и
ед
ъ
б
о
х
ы
тр
ко
уется
и
м
р
о
ф
stae
или диалекта, но с акцентом на исследуемую тему. Специальный корпус не
ах
д
о
вы
ха
о
эп
й
вски
о
аун
р
б
сбалансирован (кроме как в пределах его цели) и, если используется для
я
ем
вр
г
это
м
ачеи
зн
других целей, то может давать искаженный вид языковых сегментов. Его
еы
м
и
р
п
е
аучы
н
arle
p
и
ан
п
м
ко
главное преимущество заключается в том, что тексты подобраны таким
усы
п
р
ко
образом,
что
ас
д
р
н
ко
искомые
й
вски
о
аун
р
б
явления
ch
fren
встречаются
ы
азц
р
б
о
в
нем
чаще,
чем
ства
д
о
в
сбалансированном корпусе.
Корпус подъязыка (Sublanguage Corpus) состоит только из одного текста
р
о
б
вы
а
тем
си
й
во
и
ж
м
ы
н
л
ед
р
п
о
чем
и
р
п
на конкретном языке. Однородность структуры данного корпуса и
в
о
сл
е
л
о
б
специализированная
ем
ящ
вр
го
лексика
ь
стави
ед
р
п
позволяет
продемонстрировать
связи
хорошие
й
усн
п
р
ко
свойства при малом количестве данных.
ско
й
и
гл
ан
и
м
ы
тр
ко
аи
зн
со
Примерный корпус (Sample Corpus) (например, Zurich Corpus of English
ise
o
n
ы
азц
р
б
о
й
ачеы
зн
б
о
г
узко
Newspapers) – это одна из категорий специального корпуса, который создан
х
ы
н
вед
и
р
п
м
таки
я
ван
и
м
р
о
ф
из образцов, содержащих конечный набор текстов, подобранных с особой
ь
л
н
о
и
ац
р
п
р
ко
ей
вар
о
сл
h
telgrap
sateli
тщательностью и детально изученных. После того, как образец корпуса
е
ящ
асто
н
усе
п
р
ко
м
и
щ
ую
ед
сл
разрабатывается, он не изменяется каким-либо образом, потому что любое
ем
ящ
вр
го
ся
ю
аж
р
тб
о
азу
ср
изменение будет нарушать его структуру. Образцы малы по отношению к
х
вем
азы
н
ю
и
тен
о
асм
р
вй
ко
язы
t
gh
u
ro
d
текстам, поэтому они не квалифицируются как тексты.
чки
то
я
и
ен
ал
уд
Специальная категория примерного корпуса – литературный корпус
стй
о
р
п
к
часто
его
н
й
н
хд
б
о
(Literary Corpus), который имеет множество видов. Критерии классификации,
х
ы
н
о
и
аукц
й
н
хд
б
о
с
кн
и
ер
ам
рассматриваемые для генерации такого корпуса, включают в себя автора,
асть
вл
х
вы
и
ж
и
вм
ко
язы
сутью
я
взц
акти
жанр (например, оды, рассказы, выдумки и т.д.), период (например, XV века,
gren
а
р
п
о
аквы
н
и
д
о
ая
усн
п
р
ко
15
XVIII века и др.), группа (например, поэты-романтики, романисты
о
ьн
л
акси
м
гзачсть
о
н
м
и
н
явл
ъ
ед
р
п
викторианской эпохи и др.), тема (например, революционные сочинения,
ся
м
щ
ю
р
и
л
уб
д
ско
й
и
гл
ан
ears
w
семейные повествования, индустриализации и т. д.) и другие вопросы как
есто
м
х
ы
азн
р
чат
ю
вкл
параметры.
Мониторный (динамический) корпус (Monitor Corpus) (например, Bank
и
д
ю
л
е
ящ
асто
н
х
ги
о
н
м
xvi
е
р
о
б
вы
of English) представляет собой растущий, не ограниченный набор текстов с
сть
м
н
эко
сьм
и
п
й
о
ен
х
ы
н
звд
и
о
р
п
возможностью постоянного увеличения объема данных, отражающих
ic
h
w
le
b
tain
su
сутью
изменения в языке. Основой такого корпуса является ссылка на тексты,
е
сан
и
п
о
й
уго
р
д
ьш
л
о
б
е
t
n
m
p
evlo
d
произнесенные или написанные в течение одного года. Из мониторного
н
ж
о
м
ве
сн
о
корпуса
и
щ
ую
ед
сл
ет
м
и
можно
е
вн
о
ур
находить
новые
г
н
д
о
слова,
отслеживать
ваы
сн
о
вариации
ет
ж
о
м
в
использовании, наблюдать изменения в значении и получать широкий спектр
n
satifco
х
ы
тр
еко
н
г
тако
а
н
ки
л
то
лексической информации. Со временем баланс компонентов мониторного
х
вы
сн
о
атн
р
б
о
g
n
lo
корпуса меняется, поскольку появляются новые источники данных.
ян
и
вл
уется
и
м
р
о
ф
ical
typ
По типу текста можно выделить одноязычный, двуязычный и
й
вн
екти
ъ
б
о
е
и
указн
н
о
л
и
м
многоязычный корпус.
е
ы
тр
ко
taio
sn
rep
Одноязычный корпус (Monolingual Corpus) (например, Isi Bengali Corpus
le
b
tain
su
г
чко
ти
ан
сем
city
аквы
н
и
д
о
) содержит репрезентативные тексты одного языка, представляющие его
й
о
ен
сьм
и
п
в
о
сл
чат
ю
вкл
использование в определенный период времени. Он
ет
д
и
содержит как
й
вы
р
ти
о
ан
e
rich
письменные, так и устные текстовые образцы.
м
и
щ
ую
ед
сл
тес
н
ко
Двуязычный корпус (Bilingual Corpus) (например, TDIL Bengali-Oriya
ь
и
ечал
встр
ь
еи
встр
з
и
л
ан
ears
w
Corpus) формируется при взаимодействии двух родственных или не
ь
туал
еп
ц
н
о
о
л
ы
см
у
м
это
родственных языков, помещенных в одни рамки. Если эти языки генетически
м
и
н
д
о
ы
гр
и
lexica
или типологически связаны, они становятся параллельным корпусом, где
n
so
ча
сей
er
th
тексты выровнены по некоторым предопределенным параметрам. Размер,
ет
м
и
er
w
o
p
е
ж
то
содержание и поле могут варьироваться от корпуса к корпусу, что не
к
ан
б
ей
и
кц
ун
ф
н
ж
о
м
я
ван
о
ед
сл
и
гут
о
м
допускается в случае параллельного корпуса.
я
зучен
и
Многоязычный корпус (Multilingual Corpus) (например, Crater Corpus)
ачеи
зн
м
это
етс
явл
ус
п
р
ко
е
и
ан
р
содержит репрезентативное собрание текстов из более чем двух языков. Как
е
ы
ан
д
а
р
п
о
ет
уд
б
правило, здесь, как и в двуязычном корпусе, используются аналогичные
ах
ц
ти
п
й
чо
екси
л
ves
o
m
16
текстовые категории и идентичные процедуры отбора, хотя тексты
с
кн
и
ер
ам
су
тер
н
и
ти
ен
сб
о
е
ящ
асто
н
принадлежат к разным языкам.
м
н
д
о
х
ы
н
звд
и
о
р
п
По назначению конструкции можно выделить неаннотированный
st
o
alm
ус
п
р
ко
й
ьы
л
о
и
ац
н
(неразмеченный) и аннотированный (размеченный) корпус.
ith
w
Неаннотированный
й
о
ен
сьм
и
п
или
е
ы
чн
и
азл
р
(например,
TDIL
Corpus)
м
и
течн
ан
р
е
и
неразмеченный
представляет
(Un-annotated
собой
простой
я
кац
тф
ен
д
и
Corpus)
м
это
текст
без
дополнительной языковой или неязыковой информации. Он широко
rp
co
я
ачеи
зн
н
о
л
и
м
используется в изучении языка, но полезность корпуса значительно
кте
хар
асть
вл
h
to
увеличивается за счет аннотации.
и
есл
е
ги
о
н
м
Аннотированный или размеченный корпус (Annotated Corpus) (например
ья
тал
ен
м
ьу
етл
д
сви
й
вы
ти
л
о
б
г
это
, British National Corpus) содержит теги и коды, вставленные извне
и
н
явл
ъ
ед
р
п
ус
п
р
ко
х
вем
азы
н
дизайнерами для записи дополнительной информации (аналитические знаки,
ао
гл
чает
ю
вкл
se
lo
я
взц
акти
у
д
еж
м
части речи, грамматическая информация о категории и т. д.) в текст. В
м
н
д
о
s
u
rp
co
твую
б
о
сп
отличие от неразмеченного корпуса, аннотированный корпус более подходит
г
о
ьн
еал
р
сьм
и
п
г
о
ен
п
р
ко
для предоставления актуальной информации, полезной для языковой
х
твы
и
гн
ко
ith
w
s
u
rp
co
технологии, включая морфологическую обработку, разбор предложений,
й
во
ати
р
ген
le
b
tain
su
е
ы
чн
и
азл
р
поиск информации, смысловую многозначность, машинный перевод и др.
гзач
о
н
м
сьм
и
п
й
о
ен
ая
усн
п
р
ко
н
ум
зад
По характеру применения выделяют переводческий, выровненный,
т
ен
о
м
параллельный,
справочный,
ят
и
р
сп
во
ка
язы
сравнительный
и
оппортунистический
ь
стави
ед
р
п
й
ево
н
и
м
ю
ал
(приспособленный) корпус.
st
o
alm
Переводческие корпуса(
Corpus) обычно
Translation
вать
о
ед
сл
и
т
яю
ан
хр
со
состоят
е
сан
и
п
о
из
оригинальных текстов исходного языка и их переводов. Эти корпуса, как
ы
д
го
м
ы
тр
еко
н
е
ы
тр
ко
правило, сохраняют значение и функцию слов и словосочетаний в разных
й
ьы
л
о
и
ац
н
х
ы
н
вед
и
р
п
я
л
ви
о
стан
языках и, как следствие, обеспечивают идеальную основу для сравнения
й
уски
р
г
то
ь
туал
еп
ц
н
о
в
ео
м
и
р
п
тел
си
о
н
реализации конкретных значений в двух разных языках при одинаковых
ве
сн
о
g
lin
revo
о
ствен
б
условиях. Более того, они позволяют обнаружить все кросс-лингвистические
g
lin
revo
а
гр
и
ах
д
о
вы
варианты, т. е. альтернативную визуализацию отдельных значений и понятий
е
уги
р
д
я
взц
акти
уса
п
р
ко
й
аьн
б
о
гл
. Таким образом, переводческие корпуса более плодотворны для анализа
р
о
б
вы
ch
su
п
р
ко
межязыковых данных, так и для формулирования правил, необходимых для
е
ящ
асто
н
сть
м
н
эко
перевода (Aijmer, 1991).
ird
b
г
о
ьн
еал
р
ts
m
viro
en
17
Выровненный корпус (Aligned Corpus) (например, The Canadian Hansard
о
еьн
л
ар
п
я
ставл
ед
р
п
ую
ац
м
р
о
ф
н
и
g
lackin
Corpus) вид двуязычного корпуса, где тексты на одном языке и их переводы
а
п
ти
х
ы
чн
и
азл
р
te
o
n
на другой язык соответствуют и следуют предложение за предложением,
м
во
ер
п
п
р
ко
й
щ
ваю
ты
учи
фраза за фразой или даже слово за словом.
х
ы
ан
д
le
b
tain
su
ть
ы
б
Параллельный
корпус
ritsh
b
Corpus)
(Parallel
еур
вн
о
(например,
тк
о
азб
р
Chemnitz
German-English Corpus) содержит тексты и их переводы. Текст на одном
гзач
о
н
м
ritsh
b
языке
и
г
тр
ко
его
перевод
стй
о
р
п
выравниваются.
тес
н
ко
Иногда
создаются
т
и
ж
ер
д
со
м
ы
ан
д
se
lo
взаимные
параллельные корпуса, в которых используются корпуса, содержащие
я
ьн
ал
и
ец
сп
и
течн
я
ачеи
зн
аутентичные тексты и переводы на каждый из языков.
й
о
тем
си
gh
u
ro
ар
о
п
Справочный корпус (Reference Corpus) (например, Bank of English)
гзач
о
н
м
й
ы
о
хр
н
си
й
и
щ
б
о
й
ы
ан
д
создан для того, чтобы предоставлять исчерпывающую информацию о языке.
ечи
р
Он
х
таки
достаточно
й
о
тем
си
велик,
е
л
о
б
так
ус
п
р
ко
как
представляет
все
соответствующие
ь
еи
встр
разновидности языка. Он может быть использован для написания грамматик,
k
lo
часто
ак
н
д
о
словарей, тезаурусов и других материалов. Он составлен на основе
n
irecto
d
en
b
соответствующих
в
о
сл
ая
усн
п
р
ко
параметров,
м
и
щ
ую
ед
сл
согласованных
лингвистическим
зуа
о
п
м
си
сообществом. Такой корпус включает устный и письменный, формальный и
й
ы
ан
д
неформальный
re
o
m
х
и
щ
ую
ед
сл
язык,
e
rath
гзачсть
о
н
м
представляющий
различные
о
ьн
л
акси
м
социальные
и
ситуационные регистры.
я
кац
сф
вер
и
д
о
ел
д
Сравнительный корпус (Comparable Corpus) (например, Corpus of
в
тексо
al
rign
o
ken
o
sp
European Union) представляет собой сборник «аналогичных» текстов на
ян
и
вл
еья
тр
я
кац
тф
ен
д
и
ical
typ
более чем одном языке. Он содержит тексты на разных языках, где тексты не
й
щ
ваю
ты
учи
ства
д
о
sateli
одинаковы по содержанию, жанру или регистру и используется для
й
во
ер
п
х
ы
ен
вл
и
ж
о
sateli
сравнения различных языков. Сравнительный корпус незаменим для
е
р
о
б
вы
й
р
вто
уса
п
р
ко
сравнения на разных языках и формирования двуязычных и многоязычных
ы
гр
и
м
и
течн
гзач
о
н
м
ird
b
e
ld
fo
n
u
лексиконов и словарей.
Оппортунистический (приспособленный) корпус (Opportunistic Corpus)
е
о
зан
вы
ечи
р
щ
ваю
ки
чер
д
о
п
о
ьн
еал
р
представляет собой виртуальный корпус, где выбор фактического корпуса
fice
o
и
н
вед
о
р
п
e
rath
(из оппортунистического корпуса) соответствует потребностям конкретного
st
co
проекта.
Мониторный
т
и
ж
ер
д
со
ей
и
кц
ун
ф
оппортунистический корпус.
ted
o
an
корпус
аясь
р
и
п
о
обычно
рассматривается
с
кн
и
ер
ам
как
18
Ученые выделяют и другие виды корпусов, такие как закрытый корпус
я
и
ен
ащ
р
б
о
ю
еи
вл
р
ап
н
ет
м
и
й
ы
тр
и
н
о
м
г
чесо
акти
ф
(Closed Corpus), синхронный корпус (Synchronic Corpus), исторический
й
ы
тр
и
н
о
м
чн
и
р
п
н
со
л
уи
корпус (Historical Corpus), диалектный корпус (Dialect Corpus), идиолектный
м
н
д
о
и
ан
п
м
ко
корпус (Idiolect Corpus) и другие.
у
п
ти
ть
яи
вы
в
о
сл
ью
п
м
ко
в
тер
b
stu
19
Выводы по Главе 1
ую
н
и
ы
азц
р
б
о
Корпусная лингвистика включает в себя два аспекта: во-первых,
а
р
п
о
вй
ко
язы
ы
ер
сф
создание и разметка (аннотирование) корпусов текстов и разработка средств
вн
о
кср
и
заф
х
и
щ
уд
б
н
ум
зад
поиска по ним и, во-вторых, собственно лингвистический аспект –
ю
ачеи
зн
le
b
tain
su
й
ваи
сн
о
экспериментальные исследования на базе корпусов.
ьн
л
и
р
катего
т
и
ж
ер
д
со
е
ы
тр
ко
Подытоживая данные, отметим, что корпусная лингвистика сделала
r
u
yo
ья
ал
ц
н
и
р
п
я
ачеи
зн
возможным:
1. Уточнить результаты и выводы проведённых ранее исследований речи
й
о
н
важ
ачеи
зн
е
ази
р
гб
о
н
м
ечи
р
.
2. Произвести новые, более широкие и системные (по охвату
ан
зд
со
а
д
хо
ер
п
й
о
учн
р
эмпирического речевого материала) лингвистические исследования.
st
o
alm
ь
туал
еп
ц
н
о
egativ
n
Важность подобной проблематики заключается в специфике развития
й
ван
о
ед
сл
и
современной
м
ачеи
зн
лингвистики,
le
viab
ес
ц
о
р
п
я
ставл
ед
р
п
которую
сегодня
уже
вполне
ве
о
н
можно
дифференцировать на докомпьютерную и компьютерную (интуитивную и
ья
тал
ен
м
х
ги
о
н
м
м
ы
учен
эмпирическую, информационную и семантическую и так далее). В настоящее
усы
п
р
ко
ва
о
сл
время уже нет сомнений в самостоятельности корпусной лингвистики в
stae
ся
го
щ
ею
м
и
структуре
языкознания.
гзачсть
о
н
м
Имеется
х
и
сво
достаточно
т
м
ед
р
п
оснований
х
ы
чн
и
азл
р
считать
компьютерную парадигматику вспомогательной для корпусной методологии.
й
узки
вк
о
чел
n
w
flo
В последнее время, одна из основных причин возрастания интереса к
ачеи
зн
sateli
ак
н
д
о
е
вн
о
ур
корпусным исследованиям – повсеместная компьютеризация. Появление
ы
д
го
е
сл
чи
вк
о
чел
компьютеров сделало возможной обработку огромных массивов текстов.
ery
m
Первым
я
и
ан
зд
со
и
щ
ую
ед
сл
компьютеризированным
сть
о
н
важ
й
чо
екси
л
корпусом
является
ет
ж
о
м
Брауновский
корпус, разработанный в Брауновском университете в США в 1963 году.
ito
n
u
am
сю
о
ьн
аел
тщ
ак
н
д
о
Цель его создания – системное изучение отдельных жанров письменного
en
b
е
р
о
б
вы
аи
зн
со
ьы
л
о
и
ац
н
й
й
еи
н
м
со
английского языка, а также сравнение различных жанров.
и
ц
асо
вм
о
сл
с
и
зап
Самые ранние большие корпусы – это корпусы письменной речи
ве
сн
о
кает
и
зн
во
gh
u
ro
американского и британского вариантов английского языка. Оба корпуса
ed
align
и
есл
о
ен
м
и
е
ы
тр
и
н
о
м
20
остаются полезными и сейчас и на них основываются исследования
ско
й
и
гл
ан
е
р
и
м
английского языка многих лингвистов.
re
th
ь
л
н
о
и
ац
р
lgia
eco
Среди современных корпусов английского языка наиболее известны
о
ствен
б
е
и
ьш
л
о
б
е
такж
Британский национальный корпус (British National Corpus – BNC),
д
о
вы
ваы
сн
о
в
о
сл
ird
b
Международный корпус английского языка (International Corpus of English –
lte
agricu
гут
о
м
е
ы
тр
ко
ICE), лингвистический Банк английского языка (Bank of English), Корпус
азх
гл
ет
уд
б
ears
w
е
и
указн
ся
м
щ
ю
р
и
л
уб
д
современного американского английского (Corpus of Contemporary American
ят
и
р
сп
во
й
чо
екси
л
зучен
и
к
часто
English – COCA) и другие.
е
и
ан
р
б
со
ей
н
о
р
вы
Учитывая особенности каждого корпуса, их можно классифицировать
g
lackin
ей
и
кц
ун
ф
е
ы
тр
ко
следующим образом: по жанру текста, характеру данных, типу текста,
b
stu
й
вски
о
аун
р
б
кает
и
зн
во
назначению конструкции и характеру применения.
й
ы
стян
о
п
я
и
н
азеш
р
в
о
сл
По жанру текста среди корпусов различают письменные (Written Corpus
я
ан
д
в
о
сл
ве
сн
о
е
д
ви
), речевые (Speech Corpus) и разговорные корпусы (Spoken Corpus).
ы
л
и
атер
м
е
аучы
н
е
сан
и
п
о
По характеру данных корпусы бывают общие (General Corpus),
х
вы
и
ж
ус
п
р
ко
е
о
зан
вы
ус
п
р
ко
ray
p
tem
n
co
специальные (Special Corpus), корпусы подъязыка (Sublanguage Corpus),
н
о
л
и
м
м
ьтао
езул
р
х
ы
тр
ко
примерные корпусы (Sample Corpus), литературные и мониторные (Monitor
г
тр
ко
см
о
н
ер
п
о
ктен
хар
ы
н
ствер
о
д
Corpus).
По типу текста можно выделить одноязычный (Monolingual Corpus),
я
ван
о
ед
сл
и
er
w
o
p
н
ж
о
м
й
ачеи
зн
з
и
л
ан
двуязычный (Bilingual Corpus) и многоязычный корпус (Multilingual Corpus).
ус
п
р
ко
По
я
и
ен
ащ
р
б
о
назначению
ен
м
конструкции
выделяют
crate
неаннотированный
я
и
н
азеш
р
ую
ац
м
р
о
ф
н
и
(неразмеченный) (Un-annotated Corpus) и аннотированный (размеченный)
и
м
ы
тр
ко
казл
о
п
я
ьн
ал
и
ец
сп
корпус (Annotated Corpus).
г
узко
По характеру применения корпус бывает переводческий (Translation
ен
тавл
со
сть
о
н
важ
s
u
rp
o
Corpus), выровненный (Aligned Corpus), параллельный (Parallel Corpus),
е
сан
и
п
о
ен
м
и
р
п
й
и
н
л
еб
тр
о
уп
справочный (Reference Corpus), сравнительный (Comparable Corpus) и
х
твы
и
гн
ко
м
ачеи
зн
ath
p
sym
й
вы
ти
л
о
б
еи
тм
о
оппортунистический (приспособленный) корпус (Opportunistic Corpus).
стг
о
р
еп
н
ка
б
ю
сть
н
ж
зм
во
21
Глава 2. Языковой корпус как база для исследования
о
ен
м
и
ь
и
чн
уто
з
и
л
ан
многозначных слов
2.1 Методы автоматического разрешения многозначности
е
ы
тр
и
н
о
м
в
тексо
я
ем
вр
Научные исследования по разрешению лексической многозначности
e
sin
u
b
ird
b
ая
усн
п
р
ко
находятся в поле зрения прикладной и компьютерной лингвистики
n
irecto
d
тес
н
ко
сю
о
ьн
аел
тщ
достаточно давно и имеют многолетнюю историю. С течением лет
х
ги
о
н
м
сть
м
н
эко
вм
о
сл
количество предложенных решений и их эффективность неуклонно росли до
усы
п
р
ко
о
л
ы
см
е
ы
ан
д
тех пор, пока не достигли определённого уровня сравнительно-эффективных
м
это
показателей
точности
ет
ж
о
м
для
определённого
м
таки
спектра
н
о
л
и
м
слов
и
типов
riten
w
t
ab
d
n
u
ro
многозначностей. Полного решения проблема пока не получила, поскольку
ус
п
р
ко
ем
и
астн
зр
во
ay
d
n
o
m
на пути успешного решения стоит много вопросов, напрямую связанных с
еах
м
и
р
п
м
б
о
сп
t
gn
aro
ьзую
л
о
сп
и
тя
языковыми особенностями человеческой речи.
с
и
зап
н
звед
и
о
р
п
й
ьы
л
о
и
ац
н
Исходя из определения корпуса текстов, можно предположить, что
ся
его
щ
ю
азви
р
е
и
ьш
л
о
б
e
ld
fo
n
u
содержащаяся в нем языковая информация представляет собой богатый
е
яд
взгл
е
ы
тр
ко
ка
о
п
материал для исследований в разных областях лингвистики.
м
таки
е
л
о
б
ьзуетя
л
о
сп
и
Еще в 1986 году М. Леск предложил использовать электронную версию
ath
p
sym
ьм
л
о
и
ац
н
ус
п
р
ко
словаря Oxford Advanced Learner’s Dictionary of Current English для
е
часто
т
и
ж
ер
д
со
ча
сей
в
о
сл
я
р
сто
и
автоматического определения значения слова в заданном словосочетании.
xfrd
o
щ
еж
л
ад
н
и
р
п
вскм
о
аун
р
б
Например, с помощью этой программы можно определить, что в сочетании
о
ел
д
о
д
ви
а
туд
т
ен
о
м
pine cone слово pine с наибольшей вероятностью используется в значении
ечвая
р
evrtb
a
crate
т
еж
л
ад
н
и
р
п
s
ard
w
to
«сосна» (а не «ананас», «тосковать», «лимонка» и так далее), а слово cone – в
е
тр
ко
ваь
и
еж
тсл
о
ем
и
б
о
азн
р
значении «шишка» (а не «конус», «пучок», «рожок» и так далее). Это связано
ьы
ачл
н
во
ер
п
е
яти
н
о
п
м
таки
ав
гл
с тем, что в словарных толкованиях этих лексем больше всего пересечений
х
ы
чн
и
азл
р
ен
аж
р
вы
ve
lo
(например, pine “kind of evergreen trees…” и cone “fruit of certain evergreen
й
ы
угл
см
я
ван
и
м
р
о
ф
г
узко
ак
н
д
о
й
уго
р
д
тесу
н
ко
trees”) (Lesk, 1986).
d
san
u
o
th
м
н
д
о
Другое важное направление, сформировавшееся немного позднее, –
st
co
и
щ
ую
ед
сл
ва
о
сл
использование корпусов текстов. В корпусах разрешение лексической
тя
хо
к
ан
б
я
себ
многозначности осуществляется с опорой на сочетаемость компонентов.
й
уго
р
д
ary
n
icto
d
ird
b
22
Большие объемы современных корпусов позволяют выполнять статистически
а
зуб
тес
н
ко
етк
азм
р
значимые наблюдения о совместной встречаемости слов в разных значениях.
с
кн
и
ер
ам
вн
о
кср
и
заф
е
тр
ко
st
u
m
Наилучшие результаты дают аннотированные корпуса, в которых у слов
ы
ан
р
тб
о
касетя
ачеи
зн
размечены значения. Примером такого корпуса является Британский
м
это
м
ы
ан
д
ечь
р
д
о
вы
stae
национальный корпус (British National Corpus).
n
catio
u
ed
ь
л
н
о
и
ац
р
ы
л
и
атер
м
Чтобы понять масштаб задач, стоящих перед системой разрешения
а
л
ы
б
стауэке
лексико-семантической
я
ан
д
неоднозначности,
ы
ер
сф
надо
n
erso
p
иметь ввиду, что
тр
еко
н
х
ы
н
звд
и
о
р
п
на
сегодняшний день в мире насчитывается очень небольшое число корпусов с
и
м
ы
ен
ущ
асп
р
й
ы
о
ар
ун
д
еж
м
чека
семантической разметкой. Различия в разметке и в системах автоматического
и
м
ы
н
еб
ш
л
во
ах
д
о
вы
разрешения
ваы
сн
о
неоднозначности
м
это
(WSD
–
н
ед
сл
о
п
word-sense
е
сан
и
п
о
disambiguation)
определяются, прежде всего, тем, каковы потребности пользователей
х
таки
п
ер
м
и
а
всегд
ет
уд
б
st
co
конечного продукта и каким способом (и с какими затратами) разработчики
е
м
и
р
п
н
л
еб
тр
о
уп
ечвая
р
собираются добиться нужного результата. От этого зависят:
я
л
тр
н
ко
м
ы
тр
еко
н
е
ы
тр
ко
1) «глубина» различения многозначности;
d
n
u
fo
2) выбор словаря или лексической классификации, к которому привязана
gren
м
это
й
ы
о
хр
н
си
е
ы
тр
ко
м
и
н
д
о
семантическая аннотация;
3) ручной или автоматический способ разрешения неоднозначности.
е
вн
о
ур
е
р
о
б
вы
Например,
если
сть
о
н
важ
конечным
er
w
результатом
м
таки
является
еья
тр
правильная
морфологическая разметка текста (POS-tagging), которую затем можно будет
д
о
вы
st
o
alm
использовать
glish
en
в
ус
п
р
ко
системе
в
тексо
машинного
й
еи
н
м
со
перевода,
я
еи
ан
хр
то
задачи
системы
автоматического разрешения неоднозначности ограничиваются снятием
етс
явл
чскм
ети
н
о
ф
t
ab
d
n
u
ro
частеречной омонимии и вовсе не требуют обращения к семантической
и
сто
звест
и
о
р
п
в
о
сл
многозначности внутри одной части речи.
е
сан
и
п
о
er
w
o
p
В
и
л
ы
б
последнее
а
екси
л
время
й
ы
д
каж
перспективными
оказываются
ve
lo
разработки,
совмещающее в себе использование корпусов текстов и словарей (Roth,
е
ьзван
л
о
сп
и
г
н
д
о
о
ствен
б
n
w
ro
b
вх
ко
язы
2008). Тем не менее проблема автоматического разрешения неоднозначности
г
о
ьн
еал
р
х
еты
р
н
ко
н
ж
о
м
не потеряла актуальность, и это может заметить любой пользователь
ве
о
н
er
th
o
касетя
поисковых систем. К основным трудностям, с которыми сталкиваются
вскм
о
аун
р
б
е
уги
р
д
разработчики относятся:
я
н
д
сего
ю
азчеи
н
23
•отсутствие единообразного описания значений и недостаточная
le
p
o
н
м
ги
о
ы
д
го
системность существующих лексикографических источников;
e
rid
•принципиальная
ic
h
w
недискретность
я
кац
сф
вер
и
д
полисемии
и
неоднородность
ся
й
и
щ
атю
ш
ах
д
о
вы
решений, принимаемых разными лексикографами;
ечн
т
и
•частое несогласие носителей языка при выделении значений слов и
й
о
н
важ
узьям
р
д
интерпретации
и
н
еш
р
конкретных
я
ги
л
эко
употреблений,
затрудняющее
я
кац
тф
ен
д
и
чн
о
ср
работу
над
созданием аннотированных корпусов текстов.
b
stu
ктеу
хар
е
вчто
ы
л
асп
р
Как разнообразны бы ни были методы автоматического разрешения
о
л
ан
г
то
е
вн
о
ур
многозначности, их объединяет одно: опора на контекст. «Контекст – это
й
ы
н
евл
уш
д
о
ken
o
sp
ав
гл
единственное средство идентификации значения многозначного слова. Таким
й
о
тем
си
й
твы
и
гн
ко
в
о
сл
образом, вся деятельность по разрешению многозначности опирается на
г
чесо
акти
ф
а
ц
н
и
ед
тексы
контекст анализируемого слова, в котором и содержится информация,
о
н
уд
тр
egativ
n
le
b
tain
su
используемая для определения его значения» (Ide, 1998: 18).
ки
ам
р
siv
lo
exp
етв
сущ
Исследований такого рода меньше, чем работ в области автоматического
ical
typ
tal
m
viro
en
ао
гл
определения значения в контексте. Можно привести характерную цитату из
ж
зм
ево
н
т
м
ед
р
п
я
и
н
л
ед
р
п
о
я
ан
д
ray
p
tem
n
co
монографии О. Куонг: “Believe it or not, there is literally almost no study in the
и
н
часто
ая
усн
п
р
ко
ct
exp
о
л
ы
см
vast volume of psychology literature which tells us how humans disambiguate
азх
гл
х
вы
и
ж
ьы
тел
и
авн
ср
й
word senses. Rather, indirect evidence is found within the broader topic of human
я
и
ен
ал
уд
н
ж
о
м
tifl
eau
b
г
о
ьн
еал
р
я
чен
ю
закл
к
ти
свар
lexical processing, which mainly deals with the organization of words and the
а
л
си
ь
ел
д
о
м
realy
свечи
ьш
л
о
б
й
representation of meanings in the mental lexicon, and the mechanisms of lexical
й
чы
азм
ер
н
agred
я
и
ен
ал
уд
access, especially for words with multiple meanings” (Kwong, 2012: 53)
crate
тя
ьзую
л
о
сп
и
и
л
ы
б
a
co
(«Трудно поверить, но в литературе по психологии не существует
е
р
о
б
вы
я
ачеи
зн
g
rin
практически ни одного исследования, которое бы показало, как человек
т
и
ж
ер
д
со
определяет
значение
ую
н
и
многозначного
тк
о
азб
р
й
ваи
сн
о
слова.
я
р
сто
и
Есть
лишь
а
екси
л
косвенные
свидетельства в более широкой сфере лексической обработки текстов
г
о
ан
д
н
звед
и
о
р
п
т
о
аб
р
х
твы
и
гн
ко
е
и
ьш
л
о
б
человеком, в основном связанные с организацией слов и представлением
е
м
и
р
п
й
ы
н
и
аш
м
тел
и
ж
значений в ментальном лексиконе и механизмами лексического доступа, в
яти
н
о
п
ю
азви
н
кте
хар
том числе для многозначных слов»).
t
gn
aro
Выявление, например, неологизмов в условиях существования текстов в
еи
тм
о
е
н
щ
о
м
г
узко
электронной форме технически достаточно легко осуществимо, регулярно
ав
ж
ер
д
чает
ю
вкл
еьн
л
ар
п
о
вн
о
кср
и
заф
я
р
сто
и
24
выпускаются словари новых слов, разрабатываются словари неологизмов на
о
л
ы
б
р
о
б
вы
taio
sn
rep
ю
азви
н
основе корпусов, создаются программы по ежедневному мониторингу
д
о
вы
н
ж
о
м
е
и
ан
р
социальных сетей на предмет выявления неологизмов по ключевым запросам
в
о
сл
тексы
чека
(например, “coined the term jargon for”, “new word”, “slang (expression or
ird
b
г
о
чн
вуязы
д
й
ы
угл
см
й
о
н
важ
ем
ящ
вр
го
чает
ю
вкл
phrase) for” и так далее) (Cook, 2012). Процесс выделения у слов новых
н
ж
о
м
ь
еи
встр
етв
сущ
s
u
rp
o
г
тр
ко
значений, оказывается значительно сложнее. Тем не менее, в европейской
ы
ан
р
тб
о
сть
м
н
эко
х
и
ящ
сто
лексикографии и в этой области ожидаются существенные продвижения: в
качеств
ать
зд
со
й
ы
н
и
аш
м
некоторых работах описывается успешное автоматическое выделение новых
d
an
h
еи
тм
о
т
ю
ачи
н
тя
хо
значений путем сравнения корпусов текстов разных лет и статистического
й
чко
ти
ан
сем
кте
хар
гзач
о
н
м
анализа контекстов. Такие употребления начинают появляться и на русском
ва
о
сл
е
л
о
б
аи
н
и
м
ы
езн
л
о
п
ую
чн
то
ю
и
тен
о
асм
р
языке, например, в выражениях со словом vest. На русский язык слово vest в
гут
о
м
вет
ц
g
rin
ic
h
w
этом значении, следует переводить словом «пояс», то есть выражения suicide
й
ы
ан
д
сть
о
н
важ
ая
усн
п
р
ко
ы
тр
еко
н
s
u
rp
o
vest и explosive vest целесообразно переводить «пояс шахида» (Lau, 2012).
й
вы
р
ти
о
ан
азх
гл
стью
н
ж
зм
во
ен
м
и
р
п
В настоящее время наиболее известными среди корпусов английского
й
етн
вм
со
я
кац
тф
ен
д
и
le
b
tain
su
я
ачеи
зн
е
ы
усн
п
р
ко
языка являются Британский национальный корпус (British National Corpus).
я
ван
о
ед
сл
и
e
sin
u
b
я
уем
зр
и
л
ан
se
lo
Первоначально он был создан издательством Оксфордского университета в
r
o
m
u
h
й
уго
р
д
й
ваи
сн
о
1980-х-начале 1990-х годов и содержит 100 миллионов слов из широкого
ут
ед
сл
le
viab
е
ы
тр
ко
спектра жанров (например, устная речь, художественная литература,
й
ы
угл
см
й
етн
вм
со
riten
w
кает
и
зн
во
se
lo
журналы, газеты и другое). Британский национальный корпус (British
еах
м
и
р
п
й
ы
о
хр
н
си
en
p
o
National Corpus) связан со многими другими корпусами английского языка.
ь
ел
д
о
м
й
вн
екти
ъ
б
о
х
ы
тр
ко
и
ен
тавл
со
Корпус охватывает британский английский конца XX в. и задуман как
аясь
р
и
п
о
я
ван
р
и
ел
д
о
м
city
образец типичного разговорного и письменного британского английского
ве
сн
о
g
n
o
kw
ей
н
о
р
вы
языка того времени.
g
rin
ве
ко
язы
я
ац
м
р
о
ф
н
и
Создание корпусов текстов большого объема резко расширило
аясь
р
и
п
о
re
d
n
u
h
часто
возможности наблюдения и изучения речи как устной, так и письменной.
ят
и
р
сп
во
я
и
ен
ащ
р
б
о
le
b
tain
su
Многие традиционные проблемы языкознания в настоящее время решаются
т
и
ж
ер
д
со
е
ы
ан
д
rp
co
н
ед
сл
о
п
t
n
m
p
evlo
d
по-новому, причем их решение достигается гораздо легче, а полученные
узьям
р
д
кает
и
зн
во
т
ю
ачи
н
результаты обладают высокой степенью объективности, так как основаны на
й
о
н
важ
n
so
g
lackin
изучении языкового материала в его реальном контексте.
е
ящ
асто
н
чает
ю
вкл
зк
и
л
б
25
Одним из очевидных преимуществ использования корпуса текстов в
г
тако
м
это
лингвистических
исследованиях
ен
тавл
со
является
стачн
о
д
й
чо
екси
л
удобство
ьзуетя
л
о
сп
и
и
простота
его
использования, которые достигаются за счет структурности корпуса, т. е.
re
th
еа
м
и
р
п
ус
п
р
ко
й
ы
д
каж
разделения на главы, абзацы, предложения и словоформы, а также его
етн
б
о
и
р
п
e
arp
sh
n
satifco
размеченности (tagging, annotation), которая заключается в том, что тексты и
er
w
o
p
отдельные
етг
р
н
ко
компоненты
чски
д
во
ер
п
в
зм
ги
л
ео
н
получают
сю
о
ьн
аел
тщ
лингвистические
(описывающие
е
и
ьш
л
о
б
морфологические, синтаксические, семантические, просодические и прочие
и
ан
п
м
ко
т
н
и
вар
t
gn
aro
характеристики элементов текста) и экстралингвистические (автор, название,
яти
н
о
п
ей
и
кц
ун
ф
ваь
и
еж
тсл
о
год и место издания, жанр, тематика и т. д.) характеристики. Такого рода
ы
б
о
азн
р
ен
м
и
р
п
b
stu
метаданные во многом определяют возможности корпуса, так как
х
вы
и
ж
м
ы
н
важ
ьш
л
о
б
й
пользователей корпуса, как правило, интересует не содержание конкретных
е
ы
ан
д
ваь
и
еж
тсл
о
у
этм
о
п
текстов, а их метатекстовая информация и примеры употребления тех или
ечвы
р
й
ачеи
зн
te
o
n
иных языковых элементов и конструкций (Захаров, 2005: 6).
г
о
чн
вуязы
д
d
an
h
е
ы
чн
и
азл
р
Другой важной характеристикой корпуса текстов является большой
у
н
р
сто
ей
вар
о
сл
ть
н
б
о
сп
г
н
д
схо
и
st
co
объем языкового материала (в настоящее время не меньше 100 млн
ch
fren
г
н
д
схо
и
счет
словоупотреблений), который обеспечивает реальные статистические данные
й
ы
тр
и
н
о
м
d
an
h
еп
яти
о
н
(данные о частоте употребления словоформ, лексем, грамматических
ts
m
viro
en
м
о
чн
вуязы
д
se
lo
категорий), на основе которых можно вывести новые закономерности в языке
le
b
tain
su
й
ы
н
б
о
сп
glish
en
стг
о
р
еп
н
или проверить ту или иную гипотезу. Более того, только языковая база
сь
вш
ати
р
б
о
е
аж
д
r
u
yo
г
н
д
о
е
н
щ
о
м
корпуса дает возможность изучения языковых единиц средней и низкой
й
чо
екси
л
е
ящ
асто
н
усы
п
р
ко
х
зачы
н
д
о
частотности.
Отметим, что опираясь на данные лингвистического корпуса, основное
о
л
ы
см
ark
d
е
часто
й
вы
ти
л
о
б
я
ьзван
л
о
сп
и
внимание уделяется работе с языковыми данными (словоупотреблениями) в
ith
w
тексы
г
о
ан
д
их реальном контексте и язык описывается в том виде, как он проявляет себя
вать
о
ед
сл
и
сть
о
н
важ
о
связан
в речи, представленной в специально подобранном корпусе текстов.
я
и
ен
ал
уд
ьн
ал
и
ец
сп
ы
е
ы
чн
и
азл
р
ую
ац
м
р
о
ф
н
и
Первоначальные лингвистические исследования, проводившиеся с
р
б
яо
и
ен
ащ
ачеи
зн
помощью корпусов, сводились к подсчету частотности различных языковых
а
туд
кй
о
р
и
ш
ват
ки
чер
д
о
п
ld
u
o
w
элементов. В настоящее время статистические данные корпуса используются
re
d
n
u
h
й
евы
чн
и
р
ко
аем
р
и
б
вы
в решении сложных лингвистических задач, например на материале корпуса
н
ж
о
м
ея
д
и
ary
n
icto
d
вм
о
сл
ть
н
б
о
сп
26
статистическими методами можно определить какие слова встречаются
х
вы
и
ж
х
и
сво
м
и
сво
вместе регулярно и могут быть отнесены к устойчивым словосочетаниям.
и
н
часто
ет
явл
о
р
п
ery
m
ся
его
щ
ю
азви
р
Есть ряд областей, где языковой корпус используется непосредственно.
ra
victo
гая
р
о
д
te
o
n
Так, например, языковой корпус используется в языковом описании,
ья
тал
ен
м
н
ж
о
м
и
сто
исследовании синтаксиса, фонетики и фонологии, интонации, морфологии,
re
d
n
u
h
ао
гл
ью
щ
м
о
п
лексикологии, семантики, лексикографии, а также в дискурсе, прагматике,
gren
ск
й
п
о
евр
а
н
ки
л
то
языковом планировании, социолингвистике, психолингвистике, семиотике и
аясь
р
и
п
о
вать
о
ед
сл
и
т
еж
л
ад
н
и
р
п
когнитивной и вычислительной лингвистике.
е
ы
тр
ко
ей
н
о
р
вы
На самом деле, вряд ли найдется область лингвистики, где корпус не
гзач
о
н
м
туац
си
й
ы
ур
хм
ать
зд
со
нашел бы своей полезности. Это стало возможным благодаря большим
е
ы
ан
д
уса
п
р
ко
х
вем
азы
н
возможностям, которые предоставляет компьютер для сбора, хранения и
я
ставл
ед
р
п
з
и
л
ан
вы
р
ти
о
ан
й
и
ен
тавл
со
н
ж
о
м
обработки природных языковых баз данных. Наличие компьютеров и
м
щ
ваю
сы
и
п
о
я
ьн
ал
и
ец
сп
ird
b
машиносчитываемых корпусов позволило не только быстро и легко получить
яти
н
о
п
связи
я
еи
авн
ср
данные, но и представить их в формате, подходящем для анализа (Захаров,
е
р
о
б
вы
ьу
етл
д
сви
ь
и
чн
уто
касетя
2005: 5).
Таким образом, языковой материал, представленный в корпусе, служит
г
узко
er
w
o
p
й
ы
ен
м
и
р
п
экспериментальной базой для доказательства лингвистических теорий,
х
ы
ан
д
ray
p
tem
n
co
ан
зд
со
особенно в тех случаях, когда корректные лингвистические сравнения
г
чесо
акти
ф
gh
u
ro
етс
явл
возможно успешно провести только на большом объеме речевого материала.
х
ы
тр
ко
Также
м
ы
н
л
ед
р
п
о
й
узки
гзач
о
н
м
следует
отметить,
лингвистических
корпусов,
м
сы
ятн
о
вер
что
так
ватьн
о
ед
сл
языковые
вг
асо
м
ускаетя
п
о
д
называемых
яаучи
в
ты
ая
усн
п
р
ко
данные
большинства
х
вы
сн
о
мониторных
корпусов,
постоянно обновляются и расширяются. Это позволяет, с одной стороны,
г
о
чн
вуязы
д
h
to
tifl
eau
b
е
ы
тр
и
н
о
м
оценить современное состояние того или иного языка, а с другой –
ет
ж
о
м
ьтао
езул
р
м
le
b
tain
su
проследить изменение частот и контекстов в различные периоды времени и
вую
и
н
ьтер
ал
г
то
d
n
u
fo
е
ы
тр
и
н
о
м
изучить динамику процессов изменения лексического состава языка.
и
л
ы
б
я
л
тр
н
ко
х
ы
тр
ко
й
ы
д
каж
27
2.2 Применение корпусных данных при анализе многозначных слов.
м
чы
ги
о
л
ан
g
n
u
yo
е
такж
Роль контекста при выборе семантического варианта в многозначном
еья
тр
у
п
ти
тв
и
гн
ко
k
lo
слове
Самым важным преимуществом корпуса текстов является то, что
е
тб
асш
м
ird
b
й
ы
стян
о
п
языковые данные разного типа находятся в корпусе в своей естественной
и
ан
п
м
ко
м
ьтао
езул
р
г
чо
екси
л
м
ы
ан
д
е
ы
ан
р
б
со
контекстной форме. Корпус текстов позволяет по любому слову построить
й
еи
н
м
со
есть
в
о
сл
crate
конкорданс – список всех употреблений данного слова в контексте со
s
u
rp
o
й
и
щ
б
о
таея
счи
ссылками на источник. Составление конкорданса дает возможность изучить
е
аж
д
вх
ко
язы
ы
гр
и
st
co
и
м
ы
н
еб
ш
л
во
реальные примеры употребления тех или иных языковых элементов и
ваы
сн
о
е
ящ
асто
н
й
о
н
и
позволяет выявить особенности сочетаемости (коллокации) языковых единиц
еы
м
и
р
п
уя
зр
и
л
ан
кй
о
р
и
ш
ую
ац
м
р
о
ф
н
и
. В то время как традиционные грамматики и словари дают информацию о
я
ац
м
р
о
ф
н
и
te
o
n
s
u
rp
o
том, что слово должно значить, только корпус текстов, содержащий в себе
х
ы
н
о
и
аукц
е
р
и
м
аз
б
е
и
ьш
л
о
б
звест
и
о
р
п
примеры реального употребления языковых единиц, может дать ответ на
ую
ац
м
р
о
ф
н
и
е
ы
чн
стаи
твй
и
гн
ко
гзач
о
н
м
вопрос о том, что слово значит на самом деле.
ы
ан
р
б
д
о
п
е
д
ви
х
ы
н
вед
и
р
п
Классическое определение полисемии дает Т.И. Вендина. Исследователь
й
о
учн
р
гзач
о
н
м
р
о
б
вы
определяет полисемию как наличие у одного слова нескольких связанных
и
сто
е
р
о
аб
н
чн
о
ср
между собой значений. Данное определение полисемии в лингвистике и
early
м
ы
н
л
ед
р
п
о
м
таки
s
u
rp
co
ьм
л
о
и
ац
н
является классическим. Многозначность слова возникает в процессе
в
о
п
ти
асть
вл
вы
чи
й
усто
исторического развития языка, когда слово вследствие семантических
е
ы
тр
ко
h
telgrap
riten
w
ка
б
ю
переносов, наряду с обозначением одного предмета или явления объективной
м
ы
учен
ую
ац
м
р
о
ф
н
и
е
ящ
асто
н
действительности, начинает использоваться для обозначения другого,
е
ы
ан
д
н
ж
о
м
х
ы
связан
сходного с ним по некоторым признакам или свойствам. Потенциально
н
со
л
уи
стауэке
ей
и
кц
ун
ф
любое слово языка может приобрести новое значение, когда в этом возникает
м
таки
н
о
л
и
м
ьу
етл
д
сви
ы
гр
и
вй
ко
язы
потребность, поэтому многозначных слов в языке, как правило, больше, чем
м
таки
вй
ко
язы
тес
н
ко
ен
тавл
со
однозначных (Вендина, 2001: 136).
ав
гл
st
u
m
Так, языковой корпус служит уникальной базой данных для любого
е
м
и
р
п
г
тако
о
ен
м
и
ьу
скл
о
п
лингвистического исследования, в том числе для изучения полисемантичных
ci
glan
и
сво
м
д
еж
р
п
28
слов,
что
можно
продемонстрировать
я
ван
екти
о
р
п
на
а
всегд
примере
исследования
ая
р
вто
многозначного прилагательного sustainable.
т
н
и
вар
Данное
е
аж
д
о
р
п
прилагательное
обладает
абстрактной
й
ы
ен
м
и
р
п
семантикой
и
неоднозначностью, а следовательно его трудно адекватно перевести на
газеты
ечь
р
г
д
р
ксф
о
русский язык. Но с другой стороны, слово sustainable обладает высокой
тк
о
азб
р
г
н
д
о
г
о
ен
сьм
и
п
й
щ
ваю
ты
учи
ки
ам
р
частотой употребления в современных англоязычных текстах. По данным
ct
exp
re
d
n
u
h
Оксфордского
этимологического
ю
и
тен
о
асм
р
ве
сн
о
словаря,
прилагательное
чек
стаи
sustainable,
г
н
куо
образованное от глагола sustain, имеет французское происхождение и
т
и
ж
ер
д
со
н
со
л
уи
g
n
o
kw
первоначально имело значение «устойчивый, постоянный (able to continue or
тел
си
о
н
о
ел
д
ея
д
и
е
ящ
асто
н
last for a long time)» (www.etymonline.com).
realy
re
d
n
u
h
вй
ко
язы
В качестве базы языковых данных обратимся к Корпусу современного
сть
м
н
эко
к
ан
б
й
ачеи
зн
американского английского (The Corpus of Contemporary American English).
ется
д
ай
н
ы
тр
еко
н
вм
ко
язы
й
н
хд
б
о
а
тем
си
Проанализировав статистические данные из этого корпуса, можно сделать
к
ан
б
й
усн
п
р
ко
ес
ц
о
р
п
вывод, что употребление прилагательного sustainable наиболее характерно
усв
п
р
ко
ет
ж
о
м
для
научного
и
публицистического
и
н
д
о
стилей.
ус
п
р
ко
й
ачеи
зн
Что
учае
сл
касается
частоты
употребления данного слова, то она, начиная с 1990 года, значительно
еи
вл
р
ап
н
е
яд
взгл
s
u
rp
co
c
n
evid
возросла.
Составление конкорданса по данной лексической единице позволило
я
ем
вр
ет
явл
о
р
п
в
тексо
определить особенности сочетаемости прилагательного sustainable и выявить
й
и
щ
б
о
м
ы
н
л
ед
р
п
о
а
екси
л
t
gn
aro
ы
н
етад
м
основные сферы его употребления, которые включают в себя следующие
м
и
н
д
о
области:
экология
й
ы
д
каж
ted
an
w
(sustainable
environment),
еья
тр
й
узки
деятельность
ith
w
человека
(sustainable farming), человеческие сообщества (sustainable community),
ую
ац
м
р
о
ф
н
и
е
ы
тр
и
н
о
м
ей
и
кц
ун
ф
t
gh
u
ro
d
потребление природных ресурсов (sustainable energy) и образ жизни
я
зучен
и
я
ац
м
р
о
ф
н
и
в
то
н
ем
эл
(sustainable lifestyle) (corpus.byu.edu/coca/).
й
ево
н
и
м
ю
ал
ся
его
щ
ю
азви
р
Выявление
кает
и
зн
во
и
тщательное
изучение
синонимов
er
w
o
p
прилагательного
м
б
о
сп
sustainable позволило разделить их на две группы. К первой группе относятся
и
течн
ти
ед
всл
е
вн
о
ур
е
р
о
аб
н
слова, объединенные значением «экологически безопасный» (ecological,
ус
п
р
ко
en
b
er
th
green, natural, organic), а вторая группа включила в себя слова с общим
е
н
щ
о
м
о
ьн
л
акси
м
ьш
л
о
б
й
тес
н
ко
ted
o
an
значением «жизнеспособный, приемлемый, оправданный» (viable, workable,
н
о
л
и
м
ю
азчеи
н
й
ачеы
зн
б
о
defensible, bearable, supportable, maintainable). Опираясь на семантику
м
и
н
д
о
ет
ж
о
м
еи
вл
р
ап
н
29
синонимов,
можно
fice
o
дать
следующее
ую
ктен
хар
определение
ve
lo
прилагательному
ves
o
m
sustainable: рациональный, оправданный, способный существовать не нанося
и
ен
явл
о
п
ird
b
м
ы
ан
д
ущерба окружающей среде, обеспечивающий учет будущих потребностей.
ую
н
и
Причем
iety
n
ью
ел
ц
значение
е
тр
ко
city
«рациональный»,
заключенное
в
и
еш
вн
прилагательном
sustainable, понимается как целесообразный с точки зрения безопасности для
sco
u
rp
н
ум
зад
е
л
о
б
аи
н
окружающей среды. Таким образом, самым близким по значению русским
уса
п
р
ко
ей
н
о
р
вы
й
усн
п
р
ко
в
ео
м
и
р
п
з
и
л
ан
переводом данного прилагательного будет «экологически рациональный,
г
о
ен
сьм
и
п
о
н
уд
тр
м
и
сво
обоснованный».
а
л
си
Что касается диверсификации синонимов, так, в отличие от sustainable,
м
ы
ан
д
ва
о
сл
sateli
прилагательные green, organic и ecological в сочетании с существительными,
t
ab
d
n
u
ro
ем
и
б
о
азн
р
ую
ктен
хар
обозначающими продукты, сырье, материалы (green / organic food, green /
ы
ан
р
тб
о
та
чи
о
ед
р
п
о
стал
м
и
течн
х
ы
тр
еко
н
organic / ecological material, green / organic product, green / ecological goods) и
й
вы
о
н
ую
н
м
гр
о
ва
о
сл
left
существительными, описывающими деятельность человека, (green business /
чски
д
во
ер
п
ак
н
д
о
se
lo
marketing, green housing, organic agriculture / gardening, ecological engineering /
ь
туал
еп
ц
н
о
чат
ю
вкл
я
чен
ю
закл
я
кац
тф
ен
д
и
и
еш
вн
technology / farming) выражают значение «безопасный для здоровья человека
ю
и
тен
о
асм
р
усв
п
р
ко
ted
o
an
а
туд
», в то время как прилагательное sustainable в комбинациях с теми же
вм
сн
о
еи
вл
р
ап
н
существительными (sustainable farming, agriculture) подчеркивает значение
ath
p
sym
свечи
se
lo
у
р
о
б
вы
«безопасный для экологии»:
1. The original stated purpose of organic agriculture was not just to protect the
й
аьн
б
о
гл
le
viab
city
х
ы
связан
асть
вл
quality of foods, but also to safeguard farm environments and communities...
г
аучо
н
е
ящ
асто
н
й
ы
о
ар
ун
д
еж
м
(corpus.byu.edu/coca/).
с
кн
и
ер
ам
2. …sustainable agriculture… emphasizes a self-sustaining ecosystem in
ьзую
л
о
сп
и
тя
кй
о
р
и
ш
о
ствен
б
which conditions are right for plants to practically take care of themselves
г
тако
чек
и
сд
о
р
п
g
n
u
yo
(corpus.byu.edu/coca/).
ан
зд
со
р
о
ей
зц
и
ган
Однако в таких словосочетаниях, как sustainable / organic / green /
й
щ
ваю
ты
учи
его
н
ем
и
астн
зр
во
ecological lifestyle, green / ecological living значения синонимичных
аем
р
и
б
вы
ь
и
ечал
встр
атн
р
б
о
т
о
аб
р
прилагательных чрезвычайно близки и могут быть определены как
re
d
n
u
h
т
и
ж
ер
д
со
я
ан
д
«сбалансированный», «гармоничный», «обеспечивающий учет будущих
в
ео
м
и
р
п
стг
о
р
еп
н
iety
n
потребностей», «не наносящий вреда окружающей среде и здоровью
г
чко
ти
ан
сем
человека»;
н
ж
о
м
газеты
30
3. …they get serious about their green home, energy independence and the
е
ьш
л
о
б
s
ecau
b
чает
ю
вкл
щ
ваю
ки
чер
д
о
п
й
н
д
о
personal satisfaction of their sustainable lifestyle (corpus.byu.edu/coca/).
ы
д
го
lte
agricu
аквы
н
и
д
о
4. I would get away from any kind of pollutant environment, carcinogenic and
ая
усн
п
р
ко
ты
н
и
вар
ут
ед
сл
о
ел
д
go towards a very healthy organic lifestyle (corpus.byu.edu/coca/).
х
вы
сн
о
тес
н
ко
х
вы
сн
о
Как было отмечено ранее, прилагательное sustainable несет в себе
й
р
вто
й
щ
ваю
ты
учи
g
rin
значение «жизнеспособный, устойчивый к неблагоприятным условиям»,
е
н
щ
о
м
ао
гл
ую
н
и
«приемлемый». Однако, в отличие от синонимов viable и workable, семантика
й
и
яш
н
д
сего
ти
ен
сб
о
я
ставл
ед
р
п
st
u
m
ь
ел
д
о
м
прилагательного sustainable не ограничена данным значением и всегда несет
ery
m
t
ab
d
n
u
ro
re
o
m
в себе дополнительное значение «благоприятный», «безопасный для
ую
ац
м
р
о
ф
н
и
й
ы
д
каж
fice
o
окружающей среды». Например, понятия sustainable business, sustainable
в
тексо
le
p
o
зк
и
л
б
ay
d
n
o
m
industry трактуются как «деятельность», «производство безопасное для
er
w
o
p
n
jargo
er
th
экологии», «экологически чистые, рационально использующиеся природные
я
ги
л
эко
гзач
о
н
м
ьтао
езул
р
м
ресурсы, учитывающие потребности будущих поколений»:
й
и
щ
б
о
егко
л
х
еты
р
н
ко
5. …in the early 90s, when, really, newspapers still were thriving and there
е
л
о
б
усы
п
р
ко
е
ы
чн
и
азл
р
was a viable business there and a lot of jobs (corpus.byu.edu/coca/).
le
b
tain
su
х
таки
n
catio
u
ed
6. America will help Afghanistan to develop a stable, free government, an
счет
азх
гл
тк
о
азб
р
зучен
и
тк
о
азб
р
educational system, and a viable economy (corpus.byu.edu/coca/).
le
b
tain
su
ая
усн
п
р
ко
и
ц
асо
7. A sustainable industry uses natural resources wisely and distributes costs
t
ab
d
n
u
ro
вать
о
ед
сл
и
х
вы
сн
о
е
ы
тр
и
н
о
м
and benefits equitably (corpus.byu.edu/coca/).
о
уж
н
ка
б
ю
8. Sustainable industry is a business method that seeks to reduce negative
в
о
сл
аквы
н
и
д
о
и
ед
ср
ical
typ
impacts on the environment (corpus.byu.edu/coca/).
г
н
д
схо
и
тв
и
гн
ко
Значения, выраженные словосочетаниями sustainable business, sustainable
тексы
е
ы
тр
ко
e
sin
u
b
industry, являются составной частью понятия sustainable economy, которое
й
ы
ван
о
кср
и
ф
е
ы
тр
ко
н
звед
и
о
р
п
n
jargo
понимается как новый вид экономики, ориентированной на сохранение
м
таки
g
n
lo
я
л
ви
о
стан
окружающей среды, использование возобновимых источников энергии и
ет
ж
о
м
аем
р
и
б
вы
аквы
н
и
д
о
уменьшение негативного влияния человека на экологию:
ть
яи
вы
твую
б
о
сп
ьу
етл
д
сви
9. A transition must be made to a sustainable economy, with renewable
т
ваю
чи
есп
б
о
е
тр
ко
ус
п
р
ко
energy sources and a stable population; but to do so, the perception of our
о
еьн
л
ар
п
е
о
зан
вы
в
о
сл
relationship to the Earth and to each other must change (www.natcorp.ox.ac.uk).
ав
гл
а
л
ы
б
er
th
ве
сн
о
х
ы
ьн
ел
тд
о
Новый тип экономической деятельности может быть сформирован лишь при
а
л
си
en
b
т
и
ж
ер
д
со
31
условии перехода к новому типу общества, который выражен в понятии
о
ьн
л
акси
м
er
w
o
p
й
ен
стр
о
п
т
ен
о
м
sustainable society.
ы
б
о
азн
р
ес
ц
о
р
п
10. As a result, the development of an ecologically literate and sustainable
ен
л
ы
см
о
g
n
o
kw
ical
typ
society has emerged in the environmental education (corpus.byu.edu/coca/).
ts
m
viro
en
я
и
ен
ал
уд
ery
m
Идея гармонично развивающегося общества, заключенная в данном
м
таки
ет
м
и
realy
понятии, выражена на разных уровнях:
х
ы
чн
и
азл
р
• на уровне деятельности человека( sustainable agriculture, sustainable
ая
усн
п
р
ко
t
n
m
p
evlo
d
te
o
n
forestry);
е
ы
ан
д
ы
н
ствер
о
д
• на уровне потребления, использования природных ресурсов (sustainable
уя
зр
и
л
ан
й
щ
ваю
ты
учи
u
serio
energy, water, land, wood use);
д
о
вы
н
ж
о
м
lgia
eco
• на уровне индивидуального образа жизни (sustainable lifestyle,
й
уго
р
д
ан
зд
со
ства
д
о
sustainable living).
ваь
и
еж
тсл
о
Новая концепция общества получает широкое освещение не только в
ad
ro
ь
ел
д
о
м
я
и
ен
ащ
р
б
о
научных журналах и отдельных публикациях на тему экологии, но и в
re
d
n
u
h
а
гр
и
tifl
eau
b
различных популярных изданиях, ориентированных на массового читателя,
ве
сн
о
е
ы
чн
и
азл
р
что,
касетя
несомненно,
я
ьзван
л
о
сп
и
свидетельствует
о
том,
что
идея
й
чо
екси
л
гармонично
g
rin
развивающегося общества (sustainable society) активно продвигается и в
ет
уд
б
ус
п
р
ко
хк
ы
р
то
сознании читателя формируется идея нового образа жизни (sustainable
я
н
д
сего
чек
стаи
ен
м
г
аучо
н
гзач
о
н
м
lifestyle), ключевой составляющей для которого является гармоничное
ая
усн
п
р
ко
часто
у
этм
о
п
сосуществование с окружающей средой.
е
н
ви
л
о
п
Таким образом, по данным Корпуса современного американского
сй
ан
р
кто
ви
аи
д
ето
м
й
ваи
сн
о
й
чо
екси
л
t
ab
d
n
u
ro
английского, можно обнаружить, что реальное контекстное употребление
ч
и
ал
н
ьы
ачл
н
во
ер
п
и
р
катего
прилагательного sustainable свидетельствует о поляризации его значения и
tes
u
in
m
р
о
б
вы
е
м
о
кр
выделении двух концептуальных компонентов: экологически безопасный и
сть
н
ж
зм
во
усы
п
р
ко
ха
о
эп
жизнеспособный. При этом в настоящее время более частотным становится
е
такж
употребление
ic
h
w
прилагательного
етс
явл
sustainable
уя
зр
и
л
ан
в
значении
й
уго
р
д
вется
чи
закн
«экологически
безопасный, учитывающий потребности будущих поколений». Этот феномен
и
течн
ьй
туал
еп
ц
н
ко
ечь
р
я
зучен
и
прежде всего связан с возрастанием значения экологических проблем для
м
и
вр
го
учаи
сл
тав
со
общества, вызванных факторами, связанными с деятельностью человека, не
ям
ван
о
ед
сл
и
ath
p
sym
ства
д
о
только на уровне стран, но и в масштабе целой планеты.
й
ы
тр
ко
er
th
o
k
lo
й
азо
р
ф
уке
стр
32
Как было упомянуто выше, контекст играет огромную роль при выборе
я
и
н
л
ед
р
п
о
усе
п
р
ко
b
stu
ак
н
д
о
нужного значения слова. Используя корпусные данные можно подсчитать,
st
co
сю
о
ьн
еятл
д
вет
ц
что 500 самых употребительных слов английского языка передают более
k
lo
ет
явл
о
р
п
м
таки
le
viab
тях
ен
сб
о
10000 значений, причем, чем употребительнее слово, тем больше значений
и
н
л
еб
тр
о
п
я
еи
ан
хр
ья
туал
еп
ц
н
ко
г
н
д
о
оно имеет. Выбор нужного значения подсказывается окружением слова, то
ка
б
ю
ith
w
itz
n
em
ch
есть контекстом.
е
м
и
р
п
ус
п
р
ко
Примером можно привести перевод различных словосочетаний с
e
sin
u
b
м
сы
ятн
о
вер
й
вы
р
ти
о
ан
существительным stub: a stub of pencil – огрызок карандаша (“He unfolded it
city
ь
еи
встр
д
о
и
ер
п
le
viab
carefully, took a stub of pencil from his ammunition pouch, and marked a cross
е
ы
тр
ко
сю
о
ьн
аел
тщ
й
уго
р
д
е
такж
ах
ц
ти
п
…”) (corpus.byu.edu), a stub of candle – огарок свечи (“...he said, handing me a
и
есл
ея
д
и
g
rin
saucer with a stub of candle on it”) (corpus.byu.edu), a stub of a tooth – обломок
я
себ
k
lo
в
ео
м
и
р
п
il
td
зуба (“Jack ran to mum, holding in a hand the stub of his tooth”) (corpus.byu.edu),
le
b
tain
su
se
lo
ве
сн
о
a stub of a check (ticket) – корешок чека (билета) (“Well, I found a check stub
усах
п
р
ко
е
ази
р
гб
о
н
м
й
о
тем
си
ad
ro
ь
ел
д
о
м
е
вн
о
ур
that would suggest differently”) (corpus.byu.edu).
х
ы
н
звд
и
о
р
п
й
щ
ваю
ты
учи
е
ы
ан
д
Из примеров видно, что все значения многозначного слова связаны
м
и
щ
ую
ед
сл
ech
sp
ть
яи
вы
одним центральным смыслом, группируются вокруг одного стержня.
вм
сн
о
il
w
вк
о
чел
я
ачеи
зн
ird
b
Центральный смысл (стержневой смысл) – это общий смысл, объединяющий
газеты
е
н
ви
л
о
п
n
w
ro
b
главное значение слова и большинство подчиненных. Центральный смысл в
х
ы
чн
и
азл
р
м
чы
ги
о
л
ан
t
ab
d
n
u
ro
с
кн
и
ер
ам
словарях не фиксируется. Определить его можно, проанализировав все
ьтао
езул
р
м
ical
typ
егко
л
значения многозначного слова и значения родственных ему слов. Так,
в
о
сл
ary
n
icto
d
ую
ац
м
р
о
ф
н
и
центральным смыслом существительного stub является понятие остаток,
й
ы
д
каж
етс
явл
ав
гл
часть чего-либо, оставшаяся после удаления большей или главной части.
ус
п
р
ко
asiz
h
p
em
ью
ел
ц
й
ы
н
азум
р
е
уги
р
д
Вокруг этого стержня группируются значения многозначного слова и
яд
и
ен
л
р
п
о
е
такж
щ
еж
л
ад
н
и
р
п
гзач
о
н
м
значения родственных слов.
er
w
чает
ю
вкл
Анализ другой лексемы – roundabout показал, что данное слово имеет
s
ad
ro
сь
вш
ати
р
б
о
следующие значения:
1)участок дороги с круговым движением;
very
я
ван
о
ед
сл
и
атн
р
б
о
2)юбка с фижмами;
т
еж
л
ад
н
и
р
п
ы
н
етад
м
3)карусель;
4)кресло с круглой спинкой;
чскм
ети
н
о
ф
х
и
сво
и
н
вед
о
р
п
33
5)овсяная лепёшка (www.lingvolive.com).
ray
p
tem
n
co
По
сь
вш
ати
р
б
о
данным
Большого
й
о
ан
д
оксфордского
словаря
х
ы
связан
слово
вая
ты
учи
roundabout
определяется как:
er
th
1. A road junction at which traffic moves in one direction round a central
стью
н
ж
зм
во
й
ван
о
ед
сл
и
la
regu
й
н
д
о
s
u
rp
co
island to reach one of the roads converging on it (en.oxforddictionaries.com).
аи
зн
со
2. A large revolving device in a playground, for children to ride on
вя
о
стан
й
о
ан
д
riten
w
е
ы
тр
и
н
о
м
ти
ед
всл
(en.oxforddictionaries.com).
3. A revolving machine with model horses or cars on which people ride for
ath
p
sym
ья
стар
ем
и
б
о
азн
р
и
н
ем
вр
х
ы
н
вед
и
р
п
и
ан
п
м
ко
amusement (en.oxforddictionaries.com).
4. A merry-go-round (en.oxforddictionaries.com).
ги
о
н
м
Хотя центральный смысл и не указан в словарной статье, но из примеров
й
уго
р
д
ть
н
б
о
сп
еа
м
и
р
п
ую
н
и
етс
явл
перевода видно, что стержнем данного слова является понятие «предмет,
м
и
н
д
о
ак
н
д
о
ы
б
о
азн
р
р
о
б
вы
имеющий очертание круга».
т
ю
ачи
н
ья
туал
еп
ц
н
ко
В Корпусе американского английского (Corpus of Contemporary
ью
щ
м
о
п
о
есл
кр
ic
h
w
American English) можно встретить следующие примеры со словом
я
взц
акти
я
зучен
и
й
о
тем
си
roundabout: “…who got his idea for a business in a kind of a roundabout way”;
й
о
тем
си
а
н
ки
л
то
я
ван
о
ед
сл
и
ва
о
сл
“He'd been associating with westerners so much he actually chafed at the
атн
р
б
о
ао
гл
м
ьтао
езул
р
roundabout discussion”; “On the screen is a virtual representation of a roundabout
t
gn
aro
в
о
сл
е
ы
чн
и
азл
р
часто
й
ьш
л
о
б
”; “But it is also a genre that, in its roundabout way”; “All cardholders pay in a
е
и
ан
р
й
р
вто
м
ы
н
важ
roundabout way for all of the fraud costs a card provider incurs”; “Yes, I suppose it
й
вем
азы
н
е
ы
тр
ко
ы
б
о
азн
р
is a bit of a roundabout way”. Анализируя изученные примеры, с данным
м
ы
ан
д
я
ан
д
ьу
скл
о
п
словом наиболее частотным словосочетанием является “roundabout way”,
kro
w
е
р
о
б
вы
и
н
ем
вр
которое используется в переносном значении «обходной путь».
u
rp
o
е
ж
то
ь
туал
еп
ц
н
о
lexica
У слова brown несколько значений, и все они подчиняются главному
аи
д
ето
м
very
е
ы
тр
ко
значению «коричневый» (“of a colour produced by mixing red, yellow, and blue,
уке
стр
e
sin
u
b
st
o
alm
s
u
rp
co
n
so
as of dark wood or rich soil”), но если мы говорим о цвете кожи, то выбираем
ad
ro
х
таки
ath
p
sym
вя
о
стан
значение «смуглый»; «загорелый» (“…with a pleasant, open face, brown skin,
ки
ам
р
ted
an
w
ус
п
р
ко
есть
ен
м
и
р
п
and lovely, expertly made-up gray-green eyes…”); о глазах «карий» (“She had
ears
w
ьн
уквал
б
о
су
тер
н
и
fice
o
his sharper jaw and dark brown eyes flecked with gold”); о виде человека
чает
ю
вкл
зк
и
л
б
еи
тм
о
ус
п
р
ко
о
ьн
еал
р
«хмурый, суровый» (“He`s rather brown today”) (corpus.byu.edu/coca/).
в
тер
ью
п
м
ко
к
о
стр
s
u
rp
o
о
н
уд
тр
34
Аналогичным образом можно рассмотреть многообразие значений
г
д
р
ксф
о
а
ц
н
и
ед
very
прилагательного loose. Оно описывает предмет, который не закреплен с
д
во
ер
п
сть
о
н
важ
х
таки
одного конца, и закреплен с другого (при этом иногда закреплен непрочно).
ы
тр
еко
н
s
u
rp
o
усы
п
р
ко
и
ан
п
м
ко
я
ан
д
ь
л
н
о
и
ац
р
В Британском национальном корпусе можно встретить такие примеры: “She
ус
п
р
ко
х
и
ящ
сто
fice
o
wears her hair loose” – Она ходит с распущенными волосами; “а loose button”
су
тер
н
и
таея
счи
еи
тм
о
s
u
rp
co
х
вы
сн
о
– пуговица, которая "болтается", “а loose nail” – гвоздь, который плохо
н
ж
о
м
h
to
щ
еж
л
ад
н
и
р
п
n
jargo
держится, “а loose tooth” – шатающийся зуб, “loose candies” – развесные
связи
ар
о
п
ы
азц
р
б
о
тав
со
чх
язы
о
гл
ан
конфеты, “loose flowers” – одиночные цветы (не в букете), “loose soil” –
е
яд
взгл
всего
я
р
сто
и
ark
d
рыхлая почва, “loose tongue” – болтливый язык; язык без костей, “loose
й
ы
тр
и
н
о
м
g
n
o
kw
е
ы
тр
ко
al
rign
o
тес
н
ко
translation” – вольный (приблизительный) перевод, “loose statement” –
и
н
л
еб
тр
о
п
ld
u
o
w
ci
glan
расплывчатое заявление и другие (corpus.byu.edu).
ятс
ен
зм
и
s
u
rp
co
х
твы
и
гн
ко
Из приведенных примеров видно, что многозначность обеспечивает, с
b
stu
одной стороны, экономность и обозримость языка, а с другой стороны, его
т
и
ж
ер
д
со
у
этм
о
п
вя
о
стан
и
м
ы
тр
ко
ьй
туал
еп
ц
н
ко
гибкость и способность обслуживать все потребности в обозначении
ется
д
ай
н
ы
д
го
й
и
щ
б
о
многообразия познанного человеком мира.
етс
явл
Так, обратившись к семантической структуре прилагательного cold,
ес
ц
о
р
п
т
ен
о
м
te
o
n
можно обнаружить целый ряд производных значений, каждое из которых
c
refn
ken
o
sp
е
такж
х
ы
азн
р
е
л
о
б
аи
н
семантически связано с ядерным значением “having a low temperature” – “The
ят
и
р
сп
во
ачеи
зн
d
n
u
fo
office always feels so cold first thing on Monday morning” (corpus.byu.edu/coca/).
agred
еах
м
и
р
п
city
й
о
н
важ
Реализацию производных значений можно проиллюстрировать следующими
n
w
flo
е
м
и
р
п
taio
sn
rep
вы
чи
й
усто
м
ы
н
л
ед
р
п
о
примерами:
1. Lacking normal human feelings such as sympathy, pity, humor etc.: He is a
е
аи
зн
всего
й
уски
р
ьш
л
о
б
е
и
very cold man, very aloof and arrogant (corpus.byu.edu/coca/).
о
ьн
л
акси
м
х
ы
азн
р
и
вм
ко
язы
2. Unfriendly: “Martin was really cold towards me at the party”
я
кац
сф
вер
и
д
я
л
ви
о
стан
л
ы
см
e
sin
u
b
s
u
rp
o
(corpus.byu.edu/coca/).
3.
Cold
colour:
ватьн
о
ед
сл
“The
moon
shone
аквы
н
и
д
о
и
аф
гр
н
о
м
with
a
cold,
е
вн
о
ур
clear
light”
(corpus.byu.edu/coca/).
стг
о
р
еп
н
х
ы
азн
р
Все лексико-семантические варианты данного слова отражают разные
й
о
ан
д
d
n
u
fo
грани его семантики, но при этом объединяются в единое целое на основе
я
ван
и
ул
м
р
о
ф
и
аф
гр
н
о
м
b
stu
г
чесо
акти
ф
35
семантических ассоциаций, что характерно для полисемантов с радиальным
я
ван
и
м
р
о
ф
в
о
сл
н
ед
сл
о
п
типом связи.
а
тем
си
Гораздо сложнее дело обстоит при наличии в слове нескольких
ен
тавл
со
номинативных
и
ен
тавл
со
ть
яи
вы
зучен
и
значений
ачеи
зн
с
большой
степенью
t
ab
d
n
u
ro
семантической
самостоятельности. Так, в структуре существительного state налицо два
ей
зц
и
ган
р
о
и
н
ел
д
вы
м
это
равноправных, параллельно представленных номинативных значения – state
е
ящ
асто
н
й
ы
н
б
о
сп
ы
тр
еко
н
1 («штат, страна») и state 2 («состояние»), между которыми не так просто
й
уго
р
д
е
ьш
л
о
б
ес
ц
о
р
п
ей
н
о
р
вы
ес
ц
о
р
п
установить семантические связи и, следовательно, однозначно ответить на
ус
п
р
ко
ted
o
an
м
чы
ги
о
л
ан
вопрос, являются ли данные значения лексико-семантическими вариантами
и
н
ел
д
вы
тексы
ся
м
щ
ю
р
и
л
уб
д
полисемантичного слова или же различными словами-омонимами. Данные
я
ачеи
зн
е
ж
то
и
н
ем
вр
значения представлены в следующих контекстах:
р
о
б
вы
1. The drought is worse in the central African states (corpus.byu.edu/coca/).
е
р
о
аб
н
й
о
н
важ
ы
н
етад
м
е
ы
тр
ко
й
о
ел
ц
2. They complained about the untidy state the house had been left in
arle
p
чек
стаи
в
о
сл
х
ы
чн
и
азл
р
(corpus.byu.edu/coca/).
Данные значения семантически весьма удалены друг от друга, и
й
щ
ею
м
и
t
n
m
p
evlo
d
у
м
это
возможность их объединения в рамках одного слова представляется далеко
чает
ю
вкл
st
u
m
з
и
л
ан
ки
ам
р
вется
чи
закн
не однозначной.
Отсутствие общепринятых критериев, в соответствии с которыми можно
te
o
n
г
чко
ти
ан
сем
гут
о
м
г
д
р
ксф
о
было бы установить, где заканчивается одно слово и начинается другое,
г
это
ы
ер
сф
й
чы
азм
ер
н
отражается в трактовке проблемы полисемии-омонимии в различных
й
о
н
и
le
viab
о
есл
кр
словарях. Например, Cambridge International Dictionary of English толкует
ь
стави
ед
р
п
в
о
сл
г
узко
практически все случаи лексической неоднозначности как омонимию, в то
s
u
rp
o
счет
ую
н
м
гр
о
время как Longman Dictionary of Contemporary English представляет их как
е
тр
ко
г
тр
ко
о
есл
кр
полисемию. В этой связи возникает необходимость выработки новых
е
ги
о
н
м
ую
ям
р
ап
н
подходов
al
rign
o
к
проблеме
я
кац
тф
ен
д
и
ть
ы
б
разграничения
различных
й
усн
п
р
ко
видов
о
н
ж
м
е
о
ан
д
лексической
неоднозначности.
ird
b
Информация, требующаяся для определения семантического варианта
ак
н
д
о
многозначного
асть
вл
слова,
т.е.
я
еи
авн
ср
необходимая
доля
й
ен
стр
о
п
an
m
u
h
контекста,
называется
я
себ
«указательным минимумом». Положение его может варьироваться, т.е.
le
b
tain
su
й
ы
о
ар
ун
д
еж
м
«указательным минимумом» может быть, как информация, заключенная в
я
кац
тф
ен
д
и
гзач
о
н
м
я
ачи
н
я
кац
тф
ен
д
и
36
одном словосочетании, так и сведения о целой эпохе, в контексте которой
й
уго
р
д
х
вы
о
н
в
о
сл
определяемое слово было употреблено.
stae
le
b
tain
su
я
ачеи
зн
Необходимо упомянуть, что понятие контекст делится на три основных
le
b
tain
su
м
ьтао
езул
р
а
р
п
о
типа – узкий, широкий и экстралингвистический. Узкий контекст (микро
я
ван
и
ул
м
р
о
ф
х
ы
азн
р
arle
p
контекст) – это контекст нескольких лингвистических единиц, таких как
вя
о
стан
г
это
ьы
л
о
и
ац
н
й
словосочетание или предложение.
г
н
д
схо
и
й
чко
ти
ан
сем
Например: “Note that when power is first applied to the circuit, there will be
ая
усн
п
р
ко
есть
ет
ж
о
м
st
u
m
ic
h
w
я
зучен
и
a slight delay before the amplifier begins to work” (corpus.byu.edu) – «Обратите
й
вски
о
аун
р
б
етн
б
о
и
р
п
х
ы
н
звд
и
о
р
п
е
ы
чн
и
азл
р
внимание, что при первом включении питания на схему, будет небольшая
an
m
u
h
м
и
течн
чает
ю
вкл
задержка, прежде чем усилитель начинает работать». Наблюдая слово power
r
u
yo
ства
д
о
и
ен
тавл
со
ет
ж
о
м
п
р
ко
в языковом окружении терминов, имеющих отношение к электронике (circuit,
ус
п
р
ко
ья
стар
а
туд
я
ги
л
о
техн
amplifier), можно сделать вывод о том, что здесь его аналогом в русском
еах
м
и
р
п
г
тако
ча
сей
языке станет слово питание.
ть
яи
вы
ав
гл
х
ы
чн
и
азл
р
Существуют и конструкции, в которых ядро категорически меняет свое
gren
d
an
h
ья
ал
ц
н
и
р
п
значение под влиянием факторов узкого контекста. Некоторые из таких
и
м
ы
ен
ущ
асп
р
тел
и
ж
и
сто
agred
ы
н
ствер
о
д
словосочетаний даже можно отнести к так называемым «ложным друзьям
er
w
o
p
s
u
rp
o
la
regu
переводчика», поскольку если при переводе допустить, что они употреблены
х
ы
тр
ко
е
ал
д
м
ачеи
зн
xfrd
o
в основном значении, все высказывание сразу же лишится какого-либо
сть
н
ж
зм
во
st
u
m
ечь
р
смысла. “Power of attorney” буквально переводится как «сила адвоката»;
l
atio
n
ти
ед
всл
е
уги
р
д
однако при переводе на основе узкого контекста мы получим значение
itz
n
em
ch
и
о
укн
стр
й
и
щ
б
о
р
о
б
вы
ан
зд
со
«доверенность». При условии, что оба слова имеют основное предметноs
u
rp
co
le
b
tain
su
м
это
логическое значение, словосочетание “power supply” переводится как
e
sin
u
b
riten
w
ч
и
ал
н
«энергетическая поставка/поставка энергии», но в случае сочетания данных
м
ы
учен
й
чо
екси
л
й
о
н
ад
кл
и
р
п
слов между собой, их эквивалентом станет словосочетание «источник
е
и
ан
р
б
со
ав
ж
ер
д
я
н
д
сего
st
co
питания».
Широкий контекст (макро контекст), в отличие от узкого, выходит за
ed
align
le
b
tain
su
звест
и
о
р
п
рамки предложения. Во внимание принимается целый абзац, глава или все
я
ван
о
ед
сл
и
ю
ачеи
зн
й
и
яш
н
д
сего
произведение
в
целом.
tes
u
in
m
вй
ко
язы
Следующая
цитата
е
чы
н
и
д
о
принадлежит
й
о
ьтр
кул
повести
и
ен
явл
о
п
Дж.Р.Р.Толкина «Хоббит или туда и обратно»: “He wanted it because it was a
м
н
д
о
аквы
н
и
д
о
м
н
д
о
ring of power, and if you slipped that ring on your finger, you were invisible”
м
сы
ятн
о
вер
ах
д
о
вы
s
u
rp
o
k
an
b
ritsh
b
чек
стаи
37
(madbook.org) («Это было кольцо Всевластья, и тот, кто надевал его на палец,
n
irecto
d
счет
il
w
становился невидимым»). Известно, что слово power многозначно. Однако
я
и
н
азеш
р
аз
б
е
сан
и
п
о
b
stu
обратившись к широкому контексту произведения, можно сразу понять, что в
к
часто
ян
и
вл
h
to
данном отрывке речь идет именно о власти. Поскольку далее по контексту
ет
ж
о
м
ать
зд
со
n
erso
p
ю
ачеи
зн
кает
и
зн
во
ть
яи
вы
произведения становится понятно, что такие кольца были выкованы
текса
city
д
о
вы
специально для великих владык Средиземья, а то кольцо, о котором идет
ь
ел
д
о
м
етн
б
о
и
р
п
ы
л
и
атер
м
т
еж
л
ад
н
и
р
п
ей
н
о
р
вы
речь в цитате даже правит и повелевает другими волшебными кольцами.
о
л
ы
см
т
ю
ачи
н
е
ьзван
л
о
сп
и
е
д
ви
Поэтому общепризнанным переводом Толкиновской фразы “ring of power”,
rp
co
у
м
это
й
ваи
сн
о
дублирующимся как во всех его книгах, так и в их экранизациях, будет
я
уем
зр
и
л
ан
я
ачеи
зн
гзач
о
н
м
«Кольцо Всевластья».
еья
тр
ус
п
р
ко
Нередко встречаются и случаи, когда выбор семантического варианта
м
о
чн
вуязы
д
ath
p
sym
й
ы
ан
д
оказывается невозможен даже в контексте всего произведения, в таких
и
ен
ял
вы
н
ед
сл
о
п
м
сы
ятн
о
вер
зуа
о
п
м
си
случаях необходимо выйти за его рамки и привлечь так называемый
l
atio
n
еи
ан
хр
со
экстралингвистический
сьм
и
п
г
о
ен
контекст.
siv
lo
exp
Экстралингвистический
ки
ам
р
контекст
затрагивает различные внеязыковые факторы — особенности эпохи,
ь
и
чн
уто
ья
ал
ц
н
и
р
п
я
взц
акти
taio
sn
rep
местоположения, обстоятельств, к которым относится высказывание. Как
е
и
ан
р
ве
сн
о
правило, экстралингвистический контекст бывает напрямую связан с
тя
хо
м
таки
в
о
сл
е
ы
усн
п
р
ко
историей и культурой определенного народа. Так для перевода следующей
s
ecau
b
й
вем
азы
н
я
ван
р
и
ел
д
о
м
цитаты требуется информация о фактах, связанных с политической
я
и
ен
ащ
р
б
о
ьу
скл
о
п
и
л
ы
б
обстановкой в Гане во второй половине XX века. “Ghana agreed to provide
и
н
ел
д
вы
в
о
сл
м
и
н
д
о
ус
п
р
ко
е
ьш
л
о
б
cheap power, but the Ghanaians never expected the smelter to take as much as 65
х
вы
сн
о
ed
align
g
n
lo
сти
н
щ
о
м
percent of the dam's power” – «Гана согласилась предоставлять дешевую
чек
стаи
й
ы
стян
о
п
тесу
н
ко
электроэнергию, но жители Ганы не ожидали, что завод возьмет аж 65
г
чо
екси
л
ве
о
н
ath
p
sym
процентов мощности дамбы». Здесь речь идет о плотине, построенной в Гане
lte
agricu
er
w
o
p
ьу
скл
о
п
г
то
d
san
u
o
th
еах
м
и
р
п
в 1965 году и о заводе американской алюминиевой компании Volta. Эта
и
м
ы
ен
ущ
асп
р
информация
е
ы
тр
ко
ь
ел
д
о
м
en
p
o
ьтер
ал
вую
и
н
помогает
нам
определить
правильный
м
ы
ан
д
перевод
существительного power как «электроэнергия».
вм
о
сл
и
л
ы
б
Стоит отметить, что часто контекстуальное значение может быть
ск
й
п
о
евр
яти
н
о
п
и
д
ю
л
а
всегд
использовано в структуре каких-либо тропов или фигур речи. К примеру,
г
л
хо
си
п
е
тсуви
о
х
ы
тр
ко
нередко можно встретить контекстуальное значение в метафоричных
realy
азб
glish
en
38
высказываниях, например, “the lyrical power of his prose” – «Лирическая сила
е
тр
ко
ве
сн
о
ую
н
и
й
и
щ
б
о
ith
w
его прозы.» В данном примере слово power имеет переносное значение,
я
взц
акти
и
есл
вм
сн
о
е
м
о
кр
подчеркивающее способность прозы влиять на читателей так же сильно, как
k
lo
р
о
б
вы
тес
н
ко
может сделать это сила физическая.
se
lo
и
л
ы
б
г
н
куо
Интересно и то, что, как правило, именно на полисемии основывается
я
ставл
ед
р
п
е
м
и
р
п
х
ы
н
звд
и
о
р
п
такой литературный прием, как каламбур (или игра слов). Практически
тя
хо
я
и
ан
зд
со
и
л
ы
б
тк
о
азб
р
х
ы
н
звд
и
о
р
п
любая многозначная конструкция пригодна для каламбура. Эффект игры
er
th
o
n
jargo
risen
слов заключается в контрасте между смыслом многозначных единиц.
ао
гл
й
н
д
о
ая
усн
п
р
ко
eltr
sm
Примером этому может служить цитата Джими Хендрикса: “When the power
в
тексо
х
и
сво
чает
ю
вкл
усы
п
р
ко
ечь
р
of love overcomes the love of power the world will know peace” – «Когда власть
й
р
вто
вх
ко
язы
любви
превзойдёт
любовь
к
ью
ел
ц
ь
и
ечал
встр
е
ы
чн
стаи
власти,
у
д
го
настанет
мир
на
усв
п
р
ко
земле»
ark
d
вм
сн
о
(www.aphorisme.ru). Стоит отметить, что перевод каламбуров на другие
left
e
sin
u
b
ьн
л
и
р
катего
языки практически не представляется возможным, поскольку полные
т
о
аб
р
ьн
ал
и
ец
сп
я
й
ы
н
б
о
сп
совпадения всей системы лексических значений определенного слова
ьво
ст
н
ж
зм
е
вн
о
ур
и
н
л
еб
тр
о
п
ю
и
тен
о
асм
р
встречаются в разных языках крайне редко.
м
и
н
д
о
м
ы
учен
в
зм
ги
л
ео
н
После перевода и анализа 40 предложений с существительным power,
ет
м
и
отобранных
в
г
н
д
схо
и
случайном
re
d
n
u
h
порядке
я
зучен
и
системой
м
о
чн
вуязы
д
сайта
er
th
Британского
Национального Корпуса, можно вывести следующую статистику частоты
стачн
о
д
я
еи
ан
хр
в
то
н
ем
эл
употребления лексико-семантических вариантов этого слова: власть – 51,4%;
вм
асо
н
и
ф
lgia
eco
и
ан
п
м
ко
вх
ко
язы
ы
н
етад
м
сила, мощь – 14,2%; держава – 8,5%; электрическое питание, энергия –
ise
o
n
а
ц
н
и
ед
ес
ц
о
р
п
гая
р
о
д
11,4%; полномочия – 2,8%; право, возможность – 11,4%. Следовательно, на
сть
м
н
эко
ic
h
w
re
d
n
u
h
сегодняшний день значение слова power на основе различных видов
ith
w
г
чко
ти
ан
сем
й
во
ати
р
ген
контекста чаще всего определяется как «власть».
зк
и
л
б
ы
н
етад
м
усы
п
р
ко
39
2.3 Концептуальное моделирование процесса разрешения полисемии с
у
р
о
б
вы
е
такж
м
б
о
сп
использованием корпуса
е
аж
д
о
р
п
т
еж
л
ад
н
и
р
п
Использование данных Британского национального корпуса, анализ
е
м
и
р
п
ld
u
o
w
свечи
случаев употребления как одного и того же, так и разных значений
ct
exp
st
ju
еах
м
и
р
п
многозначного слова в естественном и максимально широком контексте
щ
еж
л
ад
н
и
р
п
казл
о
п
су
тер
н
и
s
u
rp
o
позволило сделать некоторые предположения касательно особенностей
le
p
sam
учаи
сл
тес
н
ко
протекания когнитивных процессов.
текса
связи
Когнитивные контексты, ассоциированные с отдельными значениями
вскм
о
аун
р
б
многозначного
слова,
й
ачеы
зн
б
о
не
статичные
образования;
ves
o
m
о
ел
д
они
отражают
динамический характер познания в процессе восприятия реальности,
г
чесо
акти
ф
s
ecau
b
n
satifco
е
такж
у
н
р
сто
приобретение нового опыта и его оценки.
й
н
д
о
Когнитивный контекст отдельных значений многозначного слова может
й
тако
ая
усн
п
р
ко
д
о
вы
й
вы
р
ти
о
ан
ую
ац
м
р
о
ф
н
и
содержать культурно-специфический компонент. Соответственно, можно
le
b
tain
su
вести речь и о наличии индивидуально-личностного элемента когнитивного
тс
ю
явл
й
о
н
важ
а
л
си
ьзван
л
о
сп
и
е
е
о
зан
вы
контекста, так как невозможно не принимать во внимание субъективные
я
ан
д
факторы
уса
п
р
ко
прагматического
ачеи
зн
(социального)
характера
я
ьзван
л
о
сп
и
при
восприятии
когнитивного контекста, ассоциированного с определенным смыслом
er
w
o
p
ed
align
и
ан
ж
ер
д
со
многозначного
слова.
й
ы
тр
ко
Разные
г
тр
ко
носители
я
себ
языка
при
использовании
многозначного слова в одном и том же значении оперируют различным
ath
p
sym
н
ед
сл
о
п
ьш
л
о
б
е
объемом информации, которая фиксирована данным смыслом. В момент
е
такж
я
н
д
сего
х
ы
азн
р
н
ж
о
м
е
р
и
м
формирования когнитивного контекста употребления данного смысла
er
w
o
p
ск
й
п
о
евр
е
и
ан
р
б
со
каждый индивид обладает своим представлением о мире, порядке его
й
вы
о
н
и
о
укн
стр
й
о
н
и
е
аж
д
устройства, его ценностных аспектах, которые были заложены всем его
х
ы
чн
и
азл
р
й
ы
тр
ко
ан
зд
со
предыдущим опытом.
азу
ср
й
чы
азм
ер
н
Так,
многозначное
слово
er
w
o
p
может
присутствовать
в
ментальном
ьш
л
о
б
е
а
екси
л
лексиконе, комплексной ментальной репрезентации – наборе когнитивных
тел
и
ж
я
ван
о
ед
сл
и
у
р
о
б
вы
контекстов, ассоциированных со смыслами многозначного слова, фиксируя
t
gn
aro
e
rid
й
чы
азм
ер
н
при этом значительный объем концептуальной информации, относящейся к
й
н
д
о
д
еж
р
п
о
ен
м
и
40
самым разным областям. Модель распознавания значения многозначного
ватьн
о
ед
сл
е
ящ
асто
н
u
rp
o
ьу
скл
о
п
слова может быть представлена следующим образом:
н
ед
сл
о
п
eltr
sm
я
ван
и
м
р
о
ф
•предъявление слова, употребленного в одном из своих смыслов;
й
ьы
л
о
и
ац
н
lexica
зучен
и
•активизация набора когнитивных контекстов, ассоциированных со
ы
гр
и
e
rid
ird
b
словом;
•идентификация соответствующего когнитивного контекста (или его
s
u
rp
o
есть
ус
п
р
ко
элемента);
ray
p
tem
n
co
ян
и
вл
•идентификация соответствующего значения многозначного слова.
таея
счи
Необходимо заметить, что указанная последовательность когнитивных
с
кн
и
ер
ам
е
такж
g
n
o
kw
операций, связанных с формированием, переработкой, хранением и
у
д
го
ю
азви
н
ась
ял
ен
м
и
р
п
извлечением концептуальной информации, имеет гипотетический характер и
х
твы
и
гн
ко
и
н
д
о
ф
чей
является результатом применения метода концептуального моделирования.
eric
am
гут
о
м
я
ставл
ед
р
п
Можно привести примеры, которые подтверждают данную гипотезу.
яти
н
о
п
ая
усн
п
р
ко
ка
о
п
еа
м
и
р
п
звест
и
о
р
п
Такие примеры были отобраны из Британского национального корпуса.
я
ачеи
зн
ья
туал
еп
ц
н
ко
ark
p
ги
о
н
м
Именно возможности корпуса, фиксирующего фрагменты живой речи, а
n
so
ьы
ачл
н
во
ер
п
е
ы
чн
и
азл
р
также корпусной лингвистики, рассматривающей единицы текста в
eltr
sm
я
ставл
ед
р
п
tal
m
viro
en
глобальной перспективе позволяют приблизится к решению некоторых
е
ы
тр
ко
е
аж
д
о
р
п
в
о
сл
проблем лингвистики, таких, как многозначность. Более того, корпусная
g
lin
revo
ая
р
вто
ьм
л
о
и
ац
н
й
етн
вм
со
й
о
н
ад
кл
и
р
п
лингвистика фокусирует внимание на как можно более широком взгляде на
ет
м
и
х
ги
о
н
м
й
ы
д
каж
ус
п
р
ко
текст, не ограниченном никакими догмами и прибегает к вероятностным
и
м
ы
ен
ущ
асп
р
egativ
n
свечи
методам и обработке эмпирических данных (www.rykov-cl.narod.ru).
ускаетя
п
о
д
сть
н
ж
зм
во
сть
о
н
важ
Проанализировать различные пути разрешения многозначности можно
уется
и
м
р
о
ф
р
о
б
вы
вка
о
чел
на примере существительного bird. Данная лексическая единица имеет
tal
m
viro
en
м
н
д
о
ся
его
щ
ю
азви
р
несколько значений, зафиксированных в Большом оксфордском словаре:
е
л
о
б
er
w
o
p
вет
ц
1. A warm-blooded egg-laying vertebrate animal distinguished by the
х
ы
тр
ко
тр
еко
н
я
ван
о
ед
сл
и
possession of feathers, wings, a beak, and typically by being able to fly
le
b
tain
su
n
erctio
p
в
о
сл
t
n
m
p
evlo
d
м
ачеи
зн
(en.oxforddictionaries.com).
1.1 A bird that is hunted for sport or used for food (en.oxforddictionaries.com
м
н
д
о
).
en
p
o
й
тако
н
ж
о
м
41
1.2 An aircraft, spacecraft, or satellite (North American informal)
кте
хар
ан
зд
со
и
м
ы
н
еб
ш
л
во
(en.oxforddictionaries.com).
2.
A
person
и
вм
ко
язы
of
стауэке
a
specified
kind
or
character
(informal)
(British
informal)
ха
о
эп
(en.oxforddictionaries.com).
3.
A
young
вг
асо
м
woman
гзачсть
о
н
м
or
a
girlfriend
c
n
evid
(en.oxforddictionaries.com).
х
и
сво
т
еж
л
ад
н
и
р
п
4.
A
cry
or
noise
made
to
express
displeasure
еы
м
и
р
п
or
contempt
(en.oxforddictionaries.com).
b
stu
ith
w
5. Badminton equipment consisting of a ball of cork or rubber with a crown of
вка
о
чел
ьзван
л
о
сп
и
я
ау
тер
и
л
ки
ам
р
feathers (en.oxforddictionaries.com).
С помощью Британского национального корпуса можно рассмотреть
sateli
я
ван
и
м
р
о
ф
касетя
еи
тм
о
гзач
о
н
м
несколько примеров употребления данной лексической единицы в некоторых
и
р
катего
и
н
еш
р
b
stu
из указанных значений. Первая группа примеров включает в себя слово bird в
rce
u
so
я
кац
тф
ен
д
и
х
ги
о
н
м
азх
гл
его исходном значении:
ы
б
о
азн
р
er
th
o
1.a. Glancing up, I saw a beautiful yellow bird perched on a telegraph wire,
е
аж
д
еы
м
и
р
п
ая
усн
п
р
ко
ь
и
чн
уто
looking like a prize long-tailed canary (corpus.byu.edu).
сть
н
ж
зм
во
ья
туал
еп
ц
н
ко
х
ы
чн
и
азл
р
b. A bird shuffled along the perch (corpus.byu.edu).
st
co
м
это
early
c. A bird tweetered in the gray light through the blinds (corpus.byu.edu).
е
ы
тр
и
н
о
м
и
ан
п
м
ко
taio
sn
rep
d. It`s 10 minutes today: less than a cat puts in on a bird (corpus.byu.edu).
m
ad
b
to
in
re
o
m
й
о
н
важ
й
вем
азы
н
е
вн
о
ур
e. A bird had gained entry through one of the broken windows and flown
s
ard
w
to
чки
то
ят
и
р
сп
во
a
co
helplessly around until it collided with her (corpus.byu.edu).
еи
вл
р
ап
н
еи
вл
р
ап
н
taio
sn
rep
f. It must be great to be a bird – you know, just flying over people and
е
вн
о
ур
й
ваи
сн
о
ве
сн
о
т
ю
ачи
н
ки
ам
р
buildings and that (corpus.byu.edu).
и
аф
гр
н
о
м
g. I expect he was after a squirrel or a bird up there; he`s a regular hunter
я
чен
ю
закл
вй
ко
язы
м
о
чн
вуязы
д
и
л
ы
б
м
это
(corpus.byu.edu).
Данная
группа
early
примеров
демонстрирует
ян
и
вл
употребление
ritsh
b
рассматриваемого существительного в его исходном прототипическом
д
о
вы
значении. При этом следует упомянуть, что понятие «прототипичность»
яз
вй
ко
ы
т
ваю
чи
есп
б
о
в
то
н
ем
эл
д
во
ер
п
о
ьн
уквал
б
трактуется по-разному в когнитивной и корпусной лингвистике: в
stae
когнитивной лингвистике прототип – наилучший представитель некой
n
erso
p
о
ьн
еал
р
st
co
свечи
часто
42
категории, в то время как в корпусной лингвистике это самая частотная
ся
его
щ
ю
азви
р
гут
о
м
tes
u
in
m
единица (Gilguin, 2006: 159).
ки
ам
р
В примере 1a ментальная репрезентация содержит концептуальную
тя
хо
ts
m
viro
en
ва
о
сл
информацию,
которая
х
ы
тр
еко
н
ассоциативно
u
rp
o
и
категориально
связанна
ю
азви
н
с
анализируемой лексической единицей – указание на месторасположение по
еах
м
и
р
п
й
ы
тр
и
н
о
м
е
ы
тр
ко
направлению вверх от говорящего (glancing up, perched on a telegraph wire),
сй
ан
р
кто
ви
е
ы
усн
п
р
ко
вй
ко
язы
внешние характеристики (beautiful and yellow), отсылку у определенной
чат
ю
вкл
е
ы
тр
ко
гзач
о
н
м
концептуальной категории (long-tailed canary). В сознании человека
вм
ко
язы
й
ы
чн
аво
р
сп
тес
н
ко
ken
o
sp
а
л
ы
б
пробуждаются концептуальные контексты, которые свойственны только
й
уго
р
д
одному
значению
т
ю
ачи
н
данного
ча
сей
слова,
то
есть
ва
о
сл
исходному
е
яти
н
о
п
ем
и
б
о
азн
р
значению
полисемантического слова. Даже при наличии минимального объема
ас
д
р
н
ко
азу
ср
ачеи
зн
м
и
щ
ую
ед
сл
концептуальной информации – “glancing up, I saw a beautiful and yellow bird
ве
сн
о
h
to
и
щ
ую
ед
сл
…” – определение значения данного слова не представляет никакого труда.
хы
вко
яз
г
тр
ко
усв
п
р
ко
В примере 1b существительное bird также употреблено в своем
о
л
ы
см
аз
б
стауэке
исходном значении, как и в случае с 1а. Однако указание на характер
е
ы
чн
и
азл
р
м
и
н
д
о
кает
и
зн
во
м
ьтао
езул
р
ь
туал
еп
ц
н
о
передвижения (shuffled) формирует совсем иной когнитивный контекст, тоже
текса
я
и
ан
зд
со
fice
o
ватьн
о
ед
сл
ассоциативно связанный с птицей, но более крупной, тяжелой, возможно,
stco
й
и
щ
б
о
n
erso
p
даже неспособной летать, то есть совершать действие, являющееся одной из
г
н
д
схо
и
ird
b
ы
ан
р
тб
о
е
ы
ан
р
б
со
er
th
основных черт прототипического представления о птице как таковой. Итак,
c
n
evid
n
erctio
p
а
п
ти
ь
л
н
о
и
ац
р
значение одно, оно имеет сходные описания в лексикографических
й
ы
угл
см
ся
ю
аж
р
тб
о
ьы
ачл
н
во
ер
п
источниках, но объем концептуальной информации, фиксированный данным
е
такж
ва
о
сл
е
р
и
м
значением, когнитивные контексты, ассоциированные с ним, различны.
т
ен
о
м
ет
ж
о
м
ь
л
н
о
и
ац
р
Так же в примерах 1c, 1e и 1g происходит похожий по характеру
уется
и
м
р
о
ф
n
erso
p
когнитивный процесс инференции с элементами специализации, то есть
ус
п
р
ко
вм
о
сл
т
и
ж
ер
д
со
сужения первоначального объема концептуальной информации. В данных
вм
ко
язы
taio
sn
rep
примерах
когнитивные
ха
о
эп
контексты
м
н
д
о
м
и
щ
ую
ед
сл
я
и
н
л
ед
р
п
о
активизируются
в
сознании
и
способствуют более точной идентификации, по сути, сужая концептуальную
н
ж
о
м
е
ы
тр
ко
м
ы
учен
сть
м
н
эко
информацию о птицах вообще до представителей определенного класса
я
ан
д
(типа) птиц.
авд
ж
ер
е
и
ьш
л
о
б
s
u
rp
co
ки
ам
р
43
В
примерах
1d
и
1f
активизируются
когнитивные
м
ы
ан
д
контексты,
ассоциируемые с собственно прототипическим значением без сужения
n
w
ro
b
ая
усн
п
р
ко
х
и
щ
ую
ед
сл
объема концептуальной информации, то есть «a warm-blooded egg-laying
ть
ы
б
ая
р
вто
ьн
еал
р
г
о
vertebrate animal distinguished by the possession of feathers, wings, a beak, and
а
д
хо
ер
п
у
этм
о
п
я
зучен
и
сй
ан
р
кто
ви
х
вем
азы
н
typically by being able to fly».
стауэке
Далее перейдем к рассмотрению второй группы примеров:
re
d
n
u
h
еа
м
и
р
п
ьу
скл
о
п
2. a. Victoria Wood's quite an attractive bird for a fat lady (corpus.byu.edu).
eltr
sm
е
р
о
аб
н
я
чен
ю
закл
ут
ед
сл
ts
m
viro
en
b. Richie left with a bird yesterday (corpus.byu.edu).
er
w
o
p
н
ж
о
м
я
ац
м
р
о
ф
н
и
с. Oh look ain't that, that same bird (corpus.byu.edu).
ет
ж
о
м
s
u
rp
co
х
ы
н
вед
и
р
п
а
тем
си
d. He had risen in the City to a financial position which permitted him to park
й
вем
азы
н
b
stu
il
w
his BMW beside the flash docklands flat, close to his rough but pure roots, in
я
н
д
сего
я
н
д
сего
х
ы
тр
еко
н
risen
g
n
lo
which he kept his nice French bird (corpus.byu.edu).
ve
lo
ачеи
зн
стауэке
Во второй группе примеров активизируется комплекс когнитивных
аем
р
и
б
вы
кает
и
зн
во
n
w
ro
b
е
сан
и
п
о
контекстов, связанных с категорией «человек» — одушевленный объект, в
k
in
th
ах
д
о
вы
ет
ж
о
м
данном случае женского пола (Victoria Wood, lady), а также фиксирующих
е
и
ан
р
б
со
о
уж
н
ая
усн
п
р
ко
ic
h
w
я
р
сто
и
некоторые физические (fat) и оценочные (attractive) характеристики объекта.
й
ен
стр
о
п
ьу
етл
д
сви
г
то
ачеи
зн
Активизация данных областей в сознании помогает идентифицировать
етс
явл
ус
п
р
ко
g
rin
метафорическое, прагматически окрашенное значение — «привлекательная
е
ы
тр
ко
re
o
m
й
аьн
б
о
гл
женщина».
В примере 2b происходит активизация когнитивного контекста,
й
и
н
л
еб
тр
о
уп
ы
гр
и
ы
б
о
азн
р
отражающего вполне стереотипную ситуацию — мужчина покидает
й
н
хд
б
о
гая
р
о
д
аи
д
ето
м
ресторан/кафе/вечеринку в компании привлекательной девушки, которая
ую
н
м
гр
о
ая
усн
п
р
ко
s
u
rp
co
идентифицируется метафорическим значением существительного bird.
s
ard
w
to
siv
lo
exp
ct
exp
В примере 2с лингвистический контекст употребления слова bird
усы
п
р
ко
чек
стаи
тя
ьзую
л
о
сп
и
настолько узок, что не дает возможности однозначной идентификации
ятс
л
ед
р
п
о
n
w
ro
b
звест
и
о
р
п
смысла. Однако узнав из корпуса информацию о говорящем — молодом
е
вн
о
ур
в
о
сл
уя
зр
и
л
ан
человеке 19 лет, беседующем со своими сверстниками, по фонетическим
d
san
u
o
th
сти
н
ж
зм
во
tec
ro
p
характеристикам его речи можно предположить, что в данном случае
звест
и
о
р
п
есо
ы
ьн
ал
и
ц
в
ео
м
и
р
п
анализируемая лексическая единица использована в значении «молодая
e
ld
fo
n
u
я
и
ан
зд
со
и
о
укн
стр
уса
п
р
ко
вх
ко
язы
привлекательная женщина». Данный вывод можно сделать по стереотипным
ая
усн
п
р
ко
в
о
сл
зк
и
л
б
44
представлениям о молодых людях определенного возраста, особенностях их
p
m
co
и
м
ы
ен
ущ
асп
р
ted
o
an
поведения, возможных темах разговоров, то есть исходя из имеющегося у нас
ы
ер
сф
сть
н
ж
зм
во
lgia
eco
le
b
tain
su
конкретного когнитивного контекста, который является частью комплексной
й
вн
екти
ъ
б
о
sateli
м
и
щ
ую
ед
сл
ментальной репрезентации многозначного слова, иными словами, на основе
й
ьо
тал
ен
м
й
ачеы
зн
б
о
le
b
tain
su
ве
сн
о
м
и
вр
го
ряда прагматических стратификационных характеристик, которые в данном
ятс
л
ед
р
п
о
аясь
р
и
п
о
ic
h
w
случае и позволили идентифицировать значение слова.
е
вн
о
ур
счет
al
rign
o
В примере 2d активизируется когнитивный контекст, фиксирующий
ве
сн
о
n
erso
p
вм
о
сл
стереотипную информацию об успешном в финансовом и карьерном плане
о
еьн
л
ар
п
е
ы
тр
ко
р
о
б
вы
чиновнике и наборе тех характеристик, которыми такой мужчина должен
й
о
тем
си
ьу
скл
о
п
ао
гл
я
ачеи
зн
обладать: престижная и высокооплачиваемая работа (“had risen in the City to a
ci
glan
я
н
д
сего
и
ан
п
м
ко
financial position”), элитное жилье (“flash docklands flat”), дорогая машина у
кте
хар
р
о
б
вы
я
ставл
ед
р
п
и
м
ы
езн
л
о
п
ет
уд
б
дома (“to park his BMW”) и так далее. Когнитивный контекст, который уже
ес
ц
о
р
п
e
arp
sh
перестал
ical
typ
качеств
быть
тр
еко
н
и
н
ел
д
вы
культурно-специфическим,
может
вызвать
ю
азчеи
н
сходные
ассоциации у многих людей, которые неоднократно наблюдали такого рода
етс
явл
й
чы
азм
ер
н
усе
п
р
ко
в
то
н
ем
эл
tal
m
viro
en
ситуацию. Поэтому из всех значений полисемантического существительного
ваы
сн
о
ан
кд
ср
о
в
ео
м
и
р
п
ачеи
зн
сознание активизирует именно это.
е
м
и
р
п
ь
ел
д
о
м
Третья группа примеров демонстрирует еще одно метафорическое
х
ы
н
звд
и
о
р
п
й
н
д
о
le
b
tain
su
значение данного полисеманта, которое не зафиксировано большинством
s
ard
w
to
и
н
д
о
ус
п
р
ко
традиционных лексикографических источников, однако присутствует в
c
n
evid
а
н
ки
л
то
я
р
сто
и
корпусе, — «летательный аппарат, самолет»:
е
тсуви
о
3. a. How soon could Kirov get his bird off the ground, do you think
я
ги
л
о
техн
ь
и
чн
уто
я
ац
м
р
о
ф
н
и
(corpus.byu.edu)?
b. That's a *** there is still no other bird that can take off (corpus.byu.edu)!
с
и
зап
е
ал
д
о
есл
кр
fice
o
х
ы
азн
р
Ментальная репрезентация в примере 3а содержит разные когнитивные
ы
д
го
е
р
о
аб
н
я
ван
екти
о
р
п
вы
чи
й
усто
контексты — эпоха (Киров), место (Россия) и действие над объектом —
в
то
н
ем
эл
кй
о
р
и
ш
асть
вл
«поднять что-либо в воздух» (“get smth. off the ground”). В результате в
стью
н
ж
зм
во
сознании
ти
ен
сб
о
активизируется
er
th
sateli
когнитивный
контекст,
см
о
н
ер
п
т
ю
ачи
н
ассоциируемый
с
метафорическим значением слова — «летательный аппарат, самолет, ракета».
gh
u
ro
г
о
чн
вуязы
д
lgia
eco
к
ти
свар
чы
н
и
д
о
е
Наши фоновые знания о времени события, состоянии научно-технического
а
л
си
taio
sn
rep
в
о
сл
тя
хо
45
прогресса сужают объем значения слова bird до значения «самолет», так как
вй
ко
язы
стг
о
р
еп
н
е
ы
тр
ко
конструкции ракет в то время еще не были разработаны.
ую
н
м
гр
о
ся
его
щ
ю
азви
р
re
d
n
u
h
Во втором примере данной группы активизируется совсем иной
ую
ям
р
ап
н
г
о
чн
вуязы
д
ьн
аел
тщ
сю
о
й
ы
н
б
о
сп
и
сто
когнитивный контекст — невозможность вылететь (take off), покинуть
ь
и
ечал
встр
le
b
tain
su
тр
еко
н
аэропорт и вызванное этим раздражение. Стереотипная ситуация, знакомая
в
о
сл
щ
еж
л
ад
н
и
р
п
е
аи
зн
ьн
л
акси
м
о
всем, кто часто совершает перелеты. Данный когнитивный контекст
в
о
сл
еи
тм
о
а
всегд
способствует идентификации единственно подходящего значения.
аи
д
ето
м
й
ы
н
евл
уш
д
о
ch
su
Интересным представляется следующий пример:
я
р
сто
и
ваь
и
еж
тсл
о
ечь
р
4. Ninety seven there it is now showing, Lot ninety seven, singing bird in a
сть
н
ж
зм
во
n
w
ro
b
н
ж
о
м
ет
м
и
ьу
скл
о
п
cage I have three hundred offered for this, three hundred pounds and twenty, three
ью
ел
ц
е
ы
чн
и
азл
р
le
p
o
е
м
и
р
п
и
н
л
еб
тр
о
п
чает
ю
вкл
fifty, three eighty, four hundred and twenty, fifty four eighty five hundred fifty six
и
щ
ую
ед
сл
ird
b
и
еш
вн
яти
н
о
п
х
ы
связан
й
ачеи
зн
hundred and fifty, seven hundred fifty eight hundred eight hundred pounds seated
ка
б
ю
ую
н
м
гр
о
е
м
и
р
п
й
ы
о
ар
ун
д
еж
м
ey
th
le
b
tain
su
now, any more at eight hundred and fifty nine hundred and fifty nine fifty nine
уя
зр
и
л
ан
le
b
tain
su
й
евы
чн
и
р
ко
й
н
д
о
х
ы
н
звд
и
о
р
п
er
w
o
p
fifty, one thousand new bidder thousand one hundred one thousand one hundred
ьзуетя
л
о
сп
и
и
аф
гр
н
о
м
lte
agricu
pounds, any more (corpus.byu.edu)?
егко
л
В этом случае
е
ы
тр
ко
ментальная
asiz
h
p
em
репрезентация многозначного
слова
е
ы
ан
р
б
со
фиксирует информацию о типичной конвенциональной ситуации —
ь
стави
ед
р
п
fice
o
качеств
проведение торгов на аукционе. В данном контексте присутствует указание
le
b
tain
su
в
о
п
ти
ть
яи
вы
чскм
ети
н
о
ф
ears
w
на все необходимые элементы стереотипной ситуации — продавец (ведущий
тексы
аукционных
торгов),
ть
и
ел
д
вы
покупатели
й
и
щ
б
о
(“bidder”),
tifl
eau
b
деньги
le
b
tain
su
х
ы
н
вед
и
р
п
(перечисление
предлагаемых сумм) и, наконец, товар-лот (“bird in a cage”), обозначенный
я
и
еп
ц
н
ко
я
ги
л
о
техн
чем
и
р
п
г
о
ен
сьм
и
п
многозначным словом. Понятно, что речь вряд ли идет о продаже живой
е
ы
тр
ко
ваы
сн
о
усы
п
р
ко
тав
со
h
telgrap
птицы, так как стереотипное представление о данной ситуации —
сь
вш
ати
р
б
о
проведении аукциона — не ассоциировано в первую очередь с продажей
ark
d
ятс
ен
зм
и
n
erso
p
о
д
ви
кте
хар
живых птиц. Речь, вероятно, идет о неком предмете — картине, статуэтке и
и
м
ы
тр
ко
й
ы
о
хр
н
си
я
ачеи
зн
и
аф
гр
н
о
м
так далее. Отсутствие категориальной отсылки делает невозможной более
е
такж
точную
еи
вл
р
ап
н
й
ьы
л
о
и
ац
н
идентификацию
я
ачеи
зн
м
и
щ
ую
ед
сл
смысла,
тел
и
ж
создавая
тем
самым
эффект
st
co
неоднозначности.
В
результате
осуществленного
certain
концептуального
моделирования
процесса разрешения полисемии можно сделать вывод о важной роли
е
такж
ав
ж
ер
д
agred
м
и
течн
о
ел
д
я
ставл
ед
р
п
46
когнитивных контекстов разного типа, являющихся частями комплексной
и
м
ы
езн
л
о
п
и
есл
усы
п
р
ко
ачеи
зн
ментальной репрезентации, ассоциированной с определенным значением
ray
p
tem
n
co
гзач
о
н
м
ы
н
етад
м
слова, и способствующих идентификации соответствующего значения.
ечь
р
ы
б
о
азн
р
я
кац
тф
ен
д
и
Таким образом, данные фактического материала продемонстрировали
м
и
сво
преимущества
ет
уд
б
сочетания
е
ы
тр
ко
методов
e
arp
sh
эмпирической
ritsh
b
лингвистики,
le
viab
концептуального моделирования и данных корпусов для осуществления
ise
o
n
я
ставл
ед
р
п
анализа такого сложного феномена, как многозначность.
и
л
ы
б
и
сто
е
тб
асш
м
47
Выводы по Главе 2
усв
п
р
ко
В данной Главе были рассмотрены различные типы контекста и
ес
ц
о
р
п
й
ачеы
зн
б
о
я
взц
акти
затронуты нестандартные ситуации, возникающие при переводе, а также
й
во
ер
п
ус
п
р
ко
ьу
скл
о
п
il
w
en
p
o
проведен анализ лексико-семантической структуры различных слов. Данные
ая
усн
п
р
ко
й
ы
н
евл
уш
д
о
я
и
ен
ащ
р
б
о
фактического материала показывают, что роль контекста очень важна при
й
уго
р
д
переводе многозначных слов, так как в одних случаях он способствует
выбору надлежащего семантического варианта, а в других, только благодаря
контексту и возникает определенное значение слова. Таким образом,
необходимо всегда обращаться к контексту для раскрытия значения слова и
адекватной его передачи в переводе.
Во второй главе на примере английского прилагательного “sustainable”
выявляются преимущества использования лингвистических корпусов при
изучении полисемантичных лексических единиц; рассматриваются сферы его
функционирования, особенности сочетаемости и диверсификация его
синонимов.
Помимо
этого,
делается
попытка
определения
понятий
“sustainable economy”, “sustainable society”, “sustainable lifestyle”, которые
отражают
актуальные
Проанализировав
с
тенденции
помощью
развития
Корпуса
современного
современного
общества.
американского
английского данные по контекстному употреблению прилагательного
“sustainable”
можно
выделить
два
концептуальных
компонента:
«экологически безопасный» и «жизнеспособный». Наиболее частотным
является значение «экологически безопасный», так как в современном мире
возрастает значение экологических проблем, вызванных антропогенными
факторами в масштабе целой планеты.
На примере перевода различных словосочетаний со словами “stub”,
“roundabout”, “brown”, “loose”, “cold” и “state” показан выбор нужного
значения, которое определяется с помощью окружения данных слов, то есть
контекстом.
48
Кроме того, представлен анализ различных случаев влияния контекста
на
выбор
семантического
варианта
многозначного
английского
существительного “power”, рассмотрены способы перевода этого слова на
русский язык в различном грамматико-контекстуальном окружении, а также
продемонстрирована
статистика
использования
различных
значений
существительного “power” в английском языке на сегодняшний день.
Использование корпусов открывает новые возможности исследования
когнитивных механизмов формирования структуры многозначного слова, а
также идентификации его отдельных значений.
Многозначное слово может присутствовать в ментальном лексиконе,
комплексной ментальной репрезентации – наборе когнитивных контекстов,
ассоциированных со смыслами многозначного слова. Во второй главе
представлена вероятностная модель (алгоритм) концептуальных операций, в
результате
которых
становится
возможной
идентификация
соответствующего значения многозначного слова. Данный алгоритм является
результатом применения метода концептуального моделирования. Кроме
того, приводятся примеры, отобранные из Британского национального
корпуса, которые подтверждают данную гипотезу.
В
результате
осуществленного
концептуального
моделирования
процесса разрешения полисемии можно сделать вывод о важной роли
когнитивных контекстов разного типа, являющихся частями комплексной
ментальной репрезентации, ассоциированной с определенным значением
слова, и способствующих идентификации соответствующего значения.
49
ЗАКЛЮЧЕНИЕ
В рамках данной дипломной работы лексическая многозначность была
изучена как лингвистическая проблема.
В первой главе данного исследования было изучено то, что принято
понимать под корпусной лингвистикой, а также выявлены признаки
уникальности
корпусной
лингвистики
и
ее
основные
отличия
от
традиционной лингвистики. Кроме того, подробно разобрана и изучена
концептуальная классификация корпусов по различным признакам.
Таким образом, была создана теоретическая база для дальнейшего
практического исследования во второй главе, где с помощью языковых
корпусов, а именно с помощью Британского национального корпуса (British
National Corpus) и Корпуса современного американского английского (Corpus
of
Contemporary
American
English)
проанализированы
некоторые
многозначные лексические единицы. В ходе этого анализа был установлен
ряд наиболее часто употребляющихся переводов данных слов в соответствии
с контекстом.
В корпусах разрешение лексической многозначности осуществляется с
опорой на сочетаемость компонентов. Большие объемы современных
корпусов позволяют выполнять статистически значимые наблюдения о
совместной встречаемости слов в разных значениях. Наилучшие результаты
дают аннотированные корпуса, в которых у слов размечены значения.
Примером такого корпуса является Британский национальный корпус.
В ходе данного исследования было выявлено несколько преимуществ
использования корпуса текстов в лингвистических исследованиях:
1) удобство и простота его использования, которые достигаются за
счет структурности корпуса;
2) большой объем языкового материала, который обеспечивает
реальные статистические данные, на основе которых можно
50
вывести новые закономерности в языке или проверить ту или
иную гипотезу.
3) корпус имеет дело с языковыми данными (словоупотреблениями)
в их реальном контексте;
4) язык описывается в том виде, как он проявляет себя в речи,
представленной в специально подобранном корпусе текстов;
5) языковые
данные
большинства
лингвистических
корпусов,
постоянно обновляются и расширяются, что позволяет оценить
современное состояние языка, проследить изменение частот и
контекстов в различные периоды времени и изучить динамику
процессов изменения лексического состава языка.
Более того, представлена модель распознавания значения многозначного
слова, которая носит гипотетический характер и выглядит следующим
образом:
предъявление слова, употребленного одном из своих смыслов;
активизация набора когнитивных контекстов, ассоциированных со
словом;
идентификация соответствующего когнитивного контекста (или
его элемента);
идентификация соответствующего значения многозначного слова.
Представляется, что результаты данной работы могут быть полезны для
лингвистов, которые сталкиваются при переводе с проблемами лексической
многозначности.
51
Список используемой литературы
1.
Баранов, А.Н. Автоматизация лингвистических исследований: корпус
текстов как лингвистическая проблема [Текст] / А.Н. Баранов. Русистика
сегодня. 1998. № 1 – 179-191 с.
2.
Баранов А.Н. Введение в прикладную лингвистику: Учебное пособие
[Текст] / А.Н. Баранов — М.: Эдиториал УРСС, 2001. — 360 с.
3.
Вендина Т.И. Введение в языкознание: Учебное пособие для
педагогических вузов [Текст] / Т.И. Вендина – М., Высш. шк., 2001. – 288 с.
4.
Захаров В.П., Богданова С.Ю. З-38 Корпусная лингвистика: учебник
для студентов гуманитарных вузов [Текст] / В.П. Захаров, С.Ю. Богданова –
Иркутск: ИГЛУ, 2011. – 161 с.
5.
Захаров В.П. Корпусная лингвистика: учебное пособие [Текст] / В.П.
Захаров – СПб.: СПбГУ, 2005. – 48 с.
6.
Кутузов А.Б. Курс «Корпусная лингвистика» [Электронный ресурс] /
А.Б. Кутузов. – URL: http://lab314.brsu.by/kmp-lite/kmp2/CL/CorporeLingva.pdf
7.
Марчук Ю.Н. Основы компьютерной лингвистики. Учебное пособие
[Текст] / Ю.Н. Марчук. Издание 2-е дополненное. – М.: Изд-во МПУ
«Народный учитель», 2000. – 226 с.
8.
Нагель
О.В.,
Корпусная
лингвистика
и
ее
использование
в
компьютеризированном языковом обучении // Язык и культура. 2008.
[Электронный
ресурс]
/
О.В.
Нагель.
–
URL:
http://cyberleninka.ru/article/n/korpusnaya-lingvistika-i-ee-ispolzovanie-vkompyuterizirovannom-yazykovom-obuchenii.
9.
Рыков В.В., Корпус текстов как реализация объектно-ориентированной
парадигмы // Труды Международного семинара Диалог-2002. [Текст] / В.В.
Рыков. – М.: Наука, 2002. – 59-61 с.
10.
Рыков В.В. Курс лекций по корпусной лингвистике [Электронный
ресурс] / В.В. Рыков. – URL: http://rykov-cl.narod.ru/c.html
52
11.
Чейф У.Л. Значение и структура языка [Текст] / У.Л. Чейф. Пер. с англ.
Изд.3 URSS. 2009. – 424 с.
12.
G. Gilguin The place of prototipicality in corpus linguistics // Corpora in
cognitive linguistics: corpus-based approaches to syntax and lexis [Text] / G.
Gilguin. Berlin, 2006. – 157 p.
13.
J.H. Lau, P. Cook, D. McCarthy, D. Newman, T. Baldwin. Word sense
induction for novel sense detection [Text] / J.H. Lau, P. Cook, D. McCarthy, D.
Newman, T. Baldwin. // Proceedings of the 13th Conference of the European
chapter of the association for computational linguistics, 2012. – 103-111 pp.
14.
J. Svartvik Directions in Corpus Linguistics. Procedings of Nobel
Symposium 92, Stockholm, 4-8 August 1991 [Text] / J. Svartvik. Berlin: Mouton
de Cruyter, 1992. – 158 p.
15.
K. Aijmer and B. Altenberg, (Eds.) 1991. English Corpus Linguistics:
Studies in Honour of Jan Svartvik [Text] / K. Aijmer, B. Altenberg. London:
Longman – 62 p.
16.
M. Roth, S. Schulte im Walde. Corpus co-occurrence, dictionary and
Wikipedia entries as resources for semantic relatedness information [Text] / M.
Roth, S. Schulte. Proceedings of the 6th conference on language resources and
evaluation. Marrakesh, 2008. – 203 p.
17.
N. Ide, J. Véronis. Introduction to the special issue on word sense
disambiguation: the state of the art // Computational linguistics [Text] / N. Ide, J.
Véronis. 1998. V. 24. № 1. – 175 p.
18.
N. S. Dash: Corpus Linguistics: A General Introduction [Text] / N. S. Dash.
CIIL, Mysore, 2010. – 69 p.
19.
O.Y. Kwong. New perspectives on computational and cognitive strategies
for word sense disambiguation [Text] / O.Y. Kwong. New York, 2012. – 156 p.
20.
P. Cook. Using social media to find English lexical blends // Proceedings of
the 15th EURALEX International congress (EURALEX 2012) [Text] / P. Cook.
Oslo, 2012. – 846 p.
53
Список источников фактического материала
1.
Афоризмы
великих
[Электронный
ресурс].
–
URL:
http://www.aphorisme.ru/by-authors/hendriks/?q=1921
2. Электронный словарь ABBYY LingvoХ5/ABBYY, 2011. [Электронный
ресурс]. – URL: https://www.lingvolive.com/en-us
3. M. Lesk. Automatic sense disambiguation using machine readable dictionaries:
How to tell a pine cone from an ice cream cone [Text] / M. Lesk. Proceedings of
SIGDOC-86: 5th International conference on systems documentation. Toronto,
1986. – 24-26 p.
4.
British
National
Corpus
[Электронный
ресурс].
–
URL:
https://corpus.byu.edu/bnc/
5. Corpus of Contemporary American English [Электронный ресурс]. – URL:
https://corpus.byu.edu/coca/
6. English Oxford Living Dictionaries [Электронный ресурс]. – URL:
https://en.oxforddictionaries.com/
7. Oxford Dictionary of English Etymology [Электронный ресурс]. – URL:
https://www.etymonline.com/
8. J.R.R. Tolkien. “Hobbit” [Электронный ресурс] / J.R.R. Tolkien. – URL:
http://madbook.org/view?book=70&page=1
Отзывы:
Авторизуйтесь, чтобы оставить отзыв