ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ
«БЕЛГОРОДСКИЙ ГОСУДАРСТВЕННЫЙ НАЦИОНАЛЬНЫЙ
ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ»
( Н И У
« Б е л Г У » )
ИНСТИТУТ ИНЖЕНЕРНЫХ ТЕХНОЛОГИЙ И ЕСТЕСТВЕННЫХ НАУК
КАФЕДРА ИНФОРМАЦИОННО-ТЕЛЕКОММУНИКАЦИОННЫХ
СИСТЕМ И ТЕХНОЛОГИЙ
РАЗРАБОТКА ЦИФРОВОЙ ТЕХНОЛОГИИ ПЕРЕДАЧИ РЕЧИ В
НИЗКОСКОРОСТНЫХ КАНАЛАХ СВЯЗИ
Магистерская диссертация
обучающегося по направлению подготовки 11.04.02
Инфокоммуникационные технологии и системы связи,
магистерская программа «Системы и устройства радиотехники и связи»
очной формы обучения, группы 07001532
Герасимова Владислава Владимировича
канд. техн. наук,
доцент кафедры
Информационнотелекоммуникационных
систем и технологий
НИУ «БелГУ» Сидоренко И.А.
Рецензент
Заместитель директора
Белгородского филиала ПАО
«Ростелеком» - технический
директор
Скоморохов К.С.
БЕЛГОРОД 2017
2
ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ .............................................................................................................. 4
ГЛАВА 1 ПОСТАНОВКА ЗАДАЧИ ИССЛЕДОВАНИЯ .................................. 8
1.1 ОБЩАЯ ХАРАКТЕРИСТИКА НИЗКОСКОРОСТНЫХ СИСТЕМ ПЕРЕДАЧИ РЕЧИ .... 8
1.2 МЕТОДЫ СНИЖЕНИЯ СКОРОСТИ ПЕРЕДАЧИ РЕЧИ ........................................ 11
1.3 ОПИСАНИЕ КЛИППИРОВАННОЙ РЕЧИ ........................................................... 16
1.4 ОПИСАНИЕ СУЩЕСТВУЮЩИХ МЕТОДОВ И КРИТЕРИЕВ ОЦЕНКИ КАЧЕСТВА
ЗВУЧАНИЯ РЕЧИ .................................................................................................... 23
1.5 ПОСТАНОВКА ЗАДАЧ ИССЛЕДОВАНИЯ ......................................................... 28
2.1 РАЗРАБОТКА И ОПИСАНИЕ МОДЕЛИ В СРЕДЕ РАЗРАБОТКИ NI LABVIEW ... 29
2.2 ОЦЕНКА ВЛИЯНИЯ ЗНАЧЕНИЯ ЧАСТОТЫ ДИСКРЕТИЗАЦИИ НА
РАЗБОРЧИВОСТЬ КЛИППИРОВАННОЙ РЕЧИ ............................................................ 31
2.3 ИССЛЕДОВАНИЕ НАЛИЧИЯ ЭФФЕКТА ЭЛАЙЗИНГА ПРИ КЛИППИРОВАНИИ
ЦИФРОВОГО РЕЧЕВОГО СИГНАЛА .......................................................................... 35
2.4 ИССЛЕДОВАНИЕ ЭФФЕКТИВНОСТИ ПОРОГОВОГО ШУМОПОДАВЛЕНИЯ В
ПАУЗАХ РЕЧИ НА РАЗБОРЧИВОСТЬ КЛИППИРОВАННОЙ РЕЧИ ................................ 39
2.5 ИССЛЕДОВАНИЕ ВЛИЯНИЯ ТЕМБРА ГОЛОСА ДИКТОРОВ НА РАЗБОРЧИВОСТЬ
КЛИППИРОВАННОЙ РЕЧИ ...................................................................................... 44
2.5 РЕЗУЛЬТАТЫ И ВЫВОДЫ ГЛАВЫ...................................................................... 48
ГЛАВА 3 РАЗРАБОТКА СПОСОБА СНИЖЕНИЯ СКОРОСТИ ПЕРЕДАЧИ
ЦИФРОВОЙ КЛИППИРОВАННОЙ РЕЧИ С ОБЕСПЕЧЕНИЕМ
ИНФОРМАЦИОННОЙ БЕЗОПАСНОСТИ ....................................................... 50
3.1 РАЗРАБОТКА СПОСОБА СНИЖЕНИЯ СКОРОСТИ ПЕРЕДАЧИ КЛИППИРОВАННОЙ
РЕЧИ НА ОСНОВЕ ОДНОПОЛЯРНОГО КЛИППИРОВАНИЯ РЕЧЕВОГО СИГНАЛА ........ 50
3.2 ИССЛЕДОВАНИЕ ВОЗМОЖНОСТИ СНИЖЕНИЯ РАЗБОРЧИВОСТИ
КЛИППИРОВАННОЙ РЕЧИ МЕТОДОМ СКРЕМБЛИРОВАНИЯ ..................................... 55
3.3 ОПИСАНИЕ ТЕХНОЛОГИИ ПЕРЕДАЧИ ЦИФРОВОЙ КЛИППИРОВАННОЙ РЕЧИ ПО
НИЗКОСКОРОСТНЫМ КАНАЛАМ СВЯЗИ ................................................................. 59
ЗАКЛЮЧЕНИЕ ..................................................................................................... 63
3
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ ........................................... 65
ПРИЛОЖЕНИЕ А ................................................................................................. 71
ПРИЛОЖЕНИЕ Б .................................................................................................. 72
ПРИЛОЖЕНИЕ В ................................................................................................. 73
ПРИЛОЖЕНИЕ Г .................................................................................................. 74
ПРИЛОЖЕНИЕ Д ................................................................................................. 75
4
ВВЕДЕНИЕ
В настоящее время телекоммуникации являются одной из самых
динамично развивающихся областей науки и техники. В связи с постоянным
совершенствованием существующих и разработкой новых устройств связи и
методов
построения
телекоммуникационных
систем
появляется
необходимость в появлении новых методов передачи и распределения
информации.
Одной из самых актуальных является задача создания и развития новых
информационных технологий, позволяющих намного ускорить процесс
обмена информацией между людьми, при этом стоит отметить, что довольно
существенную долю этой информации составляют речевые данные.
Проблема сокращения объема данных при передаче речевых сигналов в
цифровых системах передачи информации и сейчас остается по-прежнему
одной из самых исследуемых, так как технологии сжатия речи используются
для повышения объемов передаваемой речевой информации, а также
компактного хранения этих данных. При решении этой проблемы
необходимо обращать внимание на сохранение качества речевого сигнала на
выходе системы передачи информации, которое определяется такими
показателями
как
разборчивость
речи
и
сохранение
тембра
речи,
обеспечивающего узнаваемость голоса.
В низкоскоростных каналах аналоговых систем служебной радиосвязи
также необходимо обмениваться речевыми данными. Специфичными
качествами таких систем связи являются мобильность, низкая энергетика,
высокая степень зашумлённости. На сегодняшний день представляет интерес
построение аналогичных систем на основе цифровых методов передачи речи.
В качестве одного из способов передачи речевых сообщений в таких
системах может применяться метод клиппирования речевого сигнала.
5
Цель диссертационного исследования: исследовать возможность
передачи клиппированной речи по низкоскоростным каналам связи на основе
применения цифровых методов ее формирования и обработки с сохранением
разборчивости и обеспечением информационной безопасности.
Постановка научной задачи: выбор наиболее целесообразного
способа передачи клиппированной речи по низкоскоростным каналам связи,
обеспечивающего
приемлемую
разборчивость
речи
с
возможностью
обеспечения информационной безопасности при минимизации скорости
передачи речевых данных.
Наиболее существенные новые научные положения, выдвигаемые для
защиты:
1)
Известные методы не обеспечивают допустимое качество
звучания клиппированных речевых сигналов при передаче по каналам связи,
в виду чего разработка технологии передачи клиппированной речи с
улучшенными исходными характеристиками является актуальной научной
задачей, новое решение которой обусловлено существенным техническим
вкладом в отрасль знаний по электросвязи.
2)
Функционирование
цифровой
технологии
передачи
клиппированной речи осуществимо в низкоскоростных каналах связи при
условии ее модификации.
3)
Значительное
улучшение
качества
клиппированной
речи
достижимо за счет применения методов ее обработки во временной области.
4)
Существенное снижение скорости цифрового потока реализуемо
целесообразным выбором кодирования клиппированной речи на основе
однополярного клиппирования сигналов.
К другим наиболее существенным новым научным результатам,
выдвигаемым для защиты, относятся:
1.
Модификация технологии передачи клиппированной речи –
клиппированная речь, обработанная в заданном необходимом порядке,
6
отличающаяся от известных использованием цифровых методов обработки
во временной области.
2.
Впервые предлагаемый метод кодирования клиппированной
речи для снижения скорости цифрового потока, разработанный на основе
знакового кодирования положительной полярности сигналов.
3.
сигналов
Впервые предлагаемый метод шифрования клиппированных
для
обеспечения
защиты
информации
и
обеспечения
конфиденциальности при передаче клиппированной речи по каналам связи,
основанный на скремблировании.
Объект исследования — цифровые технологии передачи речи по
низкоскоростным каналам связи.
Предметом исследования являются цифровые способы формирования и
обработки клиппированной речи в низкоскоростных каналах связи.
Методами
исследования,
использующимися
при
выполнении
диссертационного исследования, являются:
1) цифровые методы обработки данных;
2) компьютерное моделирование.
Научная
и
практическая
значимость
диссертационных
исследований
Интерес с научной точки зрения проявляется в значимости сжатия речи
в обработке сигналов, в возможности использовать минимальный размер
речевых данных с неизменной разборчивостью. Практическая значимость
состоит в возможности использования низкоскоростных каналов связи для
передачи цифровой клиппированной речи.
Апробация результатов диссертационного исследования
Результаты
диссертационного
исследования
обсуждались
на
следующих научно-практических конференциях: международная научнопрактическая конференция компании National Instruments «NI Academic Days
2017» (Москва, 2017); молодежная научно-практическая конференция с
международным
участием
«Естественнонаучные,
инженерные
и
7
экономические исследования в технике, промышленности, медицине и
сельском хозяйстве» (Белгород, 2017); неделя науки НИУ БелГУ (Белгород,
2017).
Проект,
соответствующий
направлению
диссертационного
исследования, победил в конкурсе молодежных проектов по инновационному
развитию бизнеса "Технократ" программы УМНИК по направлению Н1.
Информационные технологии (г. Москва, Роснано, 9 ноября 2016 г.)
Публикации
По теме диссертационного исследования опубликовано 3 печатных
работы, которые приведены в приложении.
Объем и структура работы
Диссертация
состоит
из
Введения,
трех
глав,
Заключения
и
Приложений. Работа изложена на 69 страницах машинописного текста,
включая 19 рисунков, 13 таблиц и список литературных источников из 60
наименований.
8
ГЛАВА 1 ПОСТАНОВКА ЗАДАЧИ ИССЛЕДОВАНИЯ
На сегодняшний день существуют цифровые системы передачи речи, в
соответствии с которыми речевой сигнал подвергается цифровой обработке в
соответствии с параметрами основного цифрового канала: 8 кГц, 8 бит, и
имеет скорость цифрового потока, равную 64 кБит/с.
Однако, в зависимости от поставленных задач, на практике для
передачи речи стремятся к снижению скорости с целью повышения
информационной
эффективности
систем
передачи
данных,
а
также
спектральных характеристик речи. Так, например, в сетях мобильных
операторов, командно-диспетчерской и производственной связи могут
применяться скорости значительно ниже стандартной, достигая 32 – 16
кБит/с.
Из этого следует, что задача снижения скорости передачи цифровой
речи актуальна, так как она позволяет увеличить пропускную способность
канала связи для передачи информации.
1.1 Общая характеристика низкоскоростных систем передачи речи
Физическая среда распространения информации является общим,
связующим звеном любой системы передачи данных, и, с точки зрения
организации связи, делится на лини и каналы. Она может представлять собой
кабель, атмосферу, тропосферу и космическое пространство, и иные среды, в
которых распространяются данные.
Линия связи представляют собой физические провода или кабели,
соединяющие пункты (узлы) связи между собой, а абонентов – с
ближайшими узлами.
Линии связи состоят из одной или нескольких пар проводов (кабелей) и
обеспечивают передачу данных на различные расстояния. Для передачи
9
данных образуют среду их распространения – совокупность линий или
каналов передачи данных и приемо-передающего оборудования (Рисунок 1).
Рисунок 1 - Структурная схема линии или канала передачи информации
В качестве среды распространения используется воздушное и
безвоздушное пространство. С другой стороны, в качестве такой среды
выступают различные информационные сети. Так, Интернет является средой
распространения
информации,
поскольку
представляет
единое
информационное пространство и средство коммуникации.
Телефонный канал тональной (звуковой, аналоговый) частоты имеет
полосу пропускания 300–3400 Гц. Эквивалентный ему цифровой канал
обеспечивает передачу данных со скоростью 64 Кбит/с.
Каналы связи образуются различными способами. Они могут быть
физическими проводными каналами – образуемыми кабелями связи,
волновыми каналами – формируемыми для организации в какой-либо среде
(например, эфире) различных видов радиосвязи с помощью антенн и
выделенной полосы частот, а так же коммутируемыми и виртуальными –
организуемыми на время передачи информации. В ряде случаев считается,
что канал связи можно называть линией связи и наоборот. При этом
электрические и оптические каналы связи (образуемые соответствующими
сигналами) подразделяются на: проводные и беспроводные (радио-,
инфракрасные и другие). По пропускной способности каналы связи делят на:
1) низкоскоростные (телеграфные, скорость передачи информации от
50 до 200 бод/с). 1 бод = 1 бит/сек. Единица «бод» была названа в честь
французского изобретателя телеграфного аппарата Эмиля Бодо. Боды
определяют количество любых переданных битов в секунду;
10
2) среднескоростные (аналоговые телефонные, от 300–9600 до 56000
бит/с для ЭВМ);
3) высокоскоростные или
широкополосные (скорость передачи
информации свыше 56000 бит/с). Так как, 1 байт равен 8 битам, можно легко
осуществить пересчет, например, 56000 бит/с = 7 Кб/с.
К низкоскоростным системам относят системы передачи речи, в
которых речевой сигнал в цифровой форме передается со скоростью от 16
кбит/с и меньше до 0,6-0,8 кбит/с вместо стандартной скорости цифрового
потока 64 или 32 кбит/с. При этом, в зависимости от метода обработки
речевого сигнала и скорости цифрового потока, обеспечивается большой
диапазон градаций разборчивости и качества переданной речи.
Все
методы
низкоскоростной
передачи
речи
основаны
на
параметрическом кодировании, т. е. ее представлении не речевым
колебанием, а набором медленно изменяющихся параметров, определяющих
понятность речи и в ряде случаев узнаваемость говорящего, требующих для
своей передачи меньшей скорости цифрового потока.
При представлении речи параметрическими методами из речевого
сигнала,
исключается
часть
имеющейся
в
нем
избыточности,
но
одновременно происходит и изменение его структуры, приводящее к
изменению характера звучания переданной речи. Это изменение обычно тем
сильнее, чем меньше скорость передачи представляющего речь цифрового
потока. При скорости менее 2 кбит/с речь, как правило, имеет механическое,
«роботоподобное» звучание.
Применение низкоскоростных систем передачи речи для массового
пользователя в телефонных сетях общего пользования возможно только при
условии обеспечения достаточно высокого качества передачи речи, но
существующие методы оценки и нормирования качества речи не учитывают
специфики обработки речевых сигналов при их низкоскоростной передаче и
потому
не
могут
быть
низкоскоростных систем.
положены
в
основу
оценки
различных
11
В настоящем стандарте в выбранных качественных показателях,
методиках их оценок и критериях допустимости тех или иных искажений в
максимальной степени учитываются особенности обработки речи при ее
параметрическом представлении и возникающих при этом искажениях и
отклонениях характера звучания. Эти показатели специально ориентированы
на фиксацию этих явлений и их взвешенного учета при определении
пригодности оцениваемой системы для выхода в сеть ТФОП.
Основным элементом систем низкоскоростной передачи речи являются
низкоскоростные кодеки, преобразующие речевой сигнал в низкоскоростные
цифровые потоки, передаваемые по цифровым каналам связи.
1.2
Методы снижения скорости передачи речи
Аналогово-цифровое преобразование
Снижение скорости передачи речевых данных может достигаться
различными методами, например, за счет кодирования речи таким образом,
чтобы выходной поток кодера имел меньшую символьную скорость, чем
входной.
Во-первых, при записи речевых данных можно добиться определенной
степени сжатия путем снижения значений частоты дискретизации и
количества уровней квантования при аналого-цифровом преобразовании
сигнала. Снижение данных за счет параметров цифровой обработки,
выбранных ниже значений, установленных в требованиях к основному
каналу связи возможно, но влечет за собой ограничение спектра речи в
области высоких частот, вызывая существенное снижение качества и
разборчивости обрабатываемого сигнала.
По данным причинам, такой метод снижения скорости не применяется
в современных системах передачи речи, которые, в свою очередь,
соответствуют всем параметрам основного цифрового канала, частота
12
дискретизации которого, исходя из следствий теоремы Котельникова, не
должны быть меньше 8 кГц.
Методы сжатия речи на основе использования словарей
Метод сжатия с использованием словаря — разбиение данных на
слова и замена их на индексы в словаре. В настоящее время это наиболее
распространенный подход для сжатия данных, он является естественным
обобщением RLE.
Кодирование длин серий RLE (run-length encoding) или кодирование
повторов — алгоритм сжатия данных, заменяющий повторяющиеся символы
(серии)
на
один
символ
и
число
его
повторов. Серией называется
последовательность, состоящая из нескольких одинаковых символов. При
кодировании строка одинаковых символов, составляющих серию, заменяется
строкой, содержащей сам повторяющийся символ и количество его повторов.
В
наиболее
распространенном
варианте
реализации
словарь
постепенно пополняется словами из исходного блока данных в процессе
сжатия.
Основной параметр любого словарного метода — это размер словаря.
Чем больше словарь, тем выше эффективность.
Группа словарных алгоритмов, в отличие от алгоритмов группы RLE,
кодирует не количество повторов символов, а встречавшиеся ранее
последовательности
символов.
Во
время
работы
рассматриваемых
алгоритмов динамически создаётся таблица со списком уже встречавшихся
последовательностей и соответствующих им кодов. Эту таблицу часто
называют словарём, а соответствующую группу алгоритмов называют
словарными.
К плюсам словарных алгоритмов относится их большая по сравнению с
RLE эффективность сжатия. Тем не менее, реальное использование этих
алгоритмов на практике сопряжено с некоторыми трудностями реализации.
Подводя итог, можно сказать, что основным преимуществом группы
алгоритмов RLE является простота и скорость работы (в том числе и
13
скорость декодирования), а главным минусом является неэффективность на
неповторяющихся
наборах
символов.
Использование
специальных
перестановок повышает эффективность алгоритма, но также сильно
увеличивает время работы (особенно декодирования).
Сжатие речи с применением Вокодеров
Вокодер (voice
coder)
—
устройство синтеза
речи на
основе
произвольного сигнала с богатым спектром. Изначально вокодеры были
разработаны в целях экономии частотных ресурсов радиолинии системы
связи при передаче речевых сообщений. Экономия достигается за счёт того,
что вместо собственно речевого сигнала передают только значения его
определённых параметров, которые на приёмной стороне управляют
синтезатором речи. Основу синтезатора речи составляют три элемента:
1) генератор тонального сигнала для формирования гласных звуков;
2) генератор шума для формирования согласных;
3) система формантных фильтров для воссоздания индивидуальных
особенностей голоса.
Классификация вокодеров по способу анализа и синтеза речи
Вокодеры можно разделить на два класа:
- речеэлементные;
- параметрические.
В
речеэлементных
вокодерах
при
кодировании
распознаются
произносимые элементы речи (например, фонема) и на выход кодера
подаются только их номера. В декодере эти элементы создаются по правилам
речеобразования, или берутся из памяти декодера.
В русском языке 42 фонемы: 6
гласных
звуков,
согласные. Чтобы закодировать их номера нужно
6
остальные
бит.
-
Человек
произносит в секунду около 10 звуков. То есть от центральной нервной
системы к речевому аппарату сигналы управления передаются со скоростью
10 [log 2 42] = 60 бит/с. Близкую к этой скорость способны обеспечить
речеэлементные вокодеры (при этом при хорошей разборчивости теряются
14
индивидуальные особенности
речи). В их основе лежит запоминание
отдельных фраз, речевых оборотов. Благодаря этому
запоминанию
на
воспроизводящий элемент передается не сама речь, а ее элементный номер.
Это широко применялось и применяется в системах управления голосом,
а также чтения текста с преобразованием в звук.
Параметрический
вокодер
представляет
собой
устройство,
которое совершает так называемое параметрическое компандирование
речевых сигналов. Компрессия речевых сигналов в кодере осуществляется в
анализаторе, который выделяет с речевого сигнала медленно меняющиеся
параметры. В декодере при помощи местных
которые
управляются
источников
сигналов,
принятыми параметрами, синтезируется речевой
сигнал.
Основное преимущество: вокодер позволяет существенно (примерно в
10 раз) уплотнить линию связи при незначительном ухудшении качества
передачи.
Недостатком вокодеров является невысокое качество речи, поэтому
они применяются главным образом в военной связи, где главное – не
натуральность речи, а ее высокая степень сжатия и хорошая разборчивость.
Иные
области
применения
вокодеров
–
автоматизированная
стенография, озвучивание текста, человеко-машинный диалог, биометрия
(идентификация диктора).
Методы сжатия речи на основе субполосных преобразований
Одним из основных средств обработки сигналов является линейное
преобразование. Субполосное кодирование является
частным
случаем
линейного преобразования и имеет многочисленные полезные свойства.
Традиционно кодеры, основанные на линейном преобразовании, делятся на
две
группы:
кодеры
с
преобразованием
и
Отличительной чертой данных преобразований
вычислений.
субполосные
кодеры.
являются методы их
15
Кодирование
с
преобразованием
обычно
основывается
на
ортогональном линейном преобразовании. Классическим примером такого
преобразования является дискретное преобразование Фурье (ДПФ), которое
декомпозирует сигнал на синусоидальные компоненты. Двумя другими
примерами являются дискретное косинусное преобразование (ДКП) и
преобразование Карунена-Лоэва (ПКЛ). Эти преобразования находятся путем
вычисления свертки сигнала конечной длины с семейством базисных
функций. В результате получается ряд коэффициентов, который и
подвергается
дальнейшей
обработке.
На
практике
многие
из
этих
преобразований имеют эффективные алгоритмы вычислений.
Субполосное кодирование реализуется путем свертки сигнала с
несколькими
полосовыми
фильтрами
и
децимацией
результата.
Совокупность набора фильтров с дециматорами называется банком или
блоком фильтров. Каждый получившийся в результате преобразования
сигнал несет в себе информацию о спектральной составляющей исходного
сигнала при некотором пространственном (временном) масштабе. Так
происходит анализ сигнала. Для обратного
реконструкции)
выполняется
операция
синтеза
сигнала
(его
интерполяции субполосных
сигналов, фильтрация и их сложение. Большинство методов
синтеза
фильтров направлено на устранение наложения спектров («элайзинга»),
возникающего при децимации.
Преобразование Фурье базисных функций имеет определенную
локализацию, и несет информацию о некоторой субполосе.
Основным недостатком данного метода являются высокие требования
к производительности вычислительной системы, выполняющей обработку
сигналов. Данный критерий в ряде случаев является решающим параметром
при выборе системы снижения скорости передачи речи, так как влечет за
собой дополнительные затраты на дорогостоющее оборудование для
обработки сигналов.
16
1.3 Описание клиппированной речи
Одним из методов повышения помехоустойчивости систем связи
является уменьшение избыточности передаваемой информации. В системах
связи, которые предназначены для передачи речевой информации, наиболее
простым методом уменьшения избыточности является использование ИКМ
при числе уровней квантования равном N = 2. При этом достигается
предельное сжатие динамического диапазона передаваемого речевого
сигнала — клиппирование, т. е., сигнал двухуровневой ИКМ является
клиппированным речевым сигналом КРС. Одной из разновидностей
двухуровневой ИКМ является асинхронная двухуровневая ИКМ.
При асинхронной двухуровневой ИКМ передаваемый речевой сигнал
(или его производная) подвергается только квантованию по уровню, а
квантование по времени отсутствует. При этом форма речевой функции
приобретает
вид
телеграфного
сигнала.
Такое
преобразование
сопровождается некоторым уменьшением смысловой информации, которое
проявляется в виде потерь узнаваемости голоса, то есть несколько
ухудшается
качество
воспроизведения
речевого
сигнала.
Однако,
в
результате исследований было установлено, что разборчивость ограниченной
(клиппированной) речи сохраняется достаточно высокой. Это обстоятельство
позволяет использовать передачу клиппированной речи в системах низовой
связи, в коммерческой радиотелефонии, где основным требованием,
предъявляемым к аппаратуре связи, является обеспечение больших
дальностей связи и высокой помехоустойчивости. При этом использование
передачи
клиппированных
речевых
сигналов
является
особенно
целесообразным, так как установлено, что при воздействии помех
клиппированная речь обеспечивает лучшее качество связи по сравнению с
другими видами передачи речевой информации.
17
Функция, описывающая речевой сигнал, при ограничении по уровню
(клиппировании) упрощается, и сигнал приобретает следующий ряд
особенностей, позволяющих существенно повысить помехоустойчивость
некоторых систем связи:
- форма передаваемого по каналу связи сигнала представляет собой
последовательность импульсов прямоугольной формы;
- клиппированный речевой сигнал имеет небольшой пик-фактор, под
которым
понимается
отношение
пикового
значения
амплитуд
следования
нулевых,
а
к
эффективному значению речи;
-
низкая
средняя
частота
в
случае
дифференцирования - экстремальных значений речевой функции.
Эти особенности клиппированного речевого сигнала позволяют
использовать оптимальные методы модуляции, обеспечивающие повышение
эффективности
некоторых
систем
связи,
в
которых
увеличение
помехоустойчивости достигается соответствующим построением системы,
параметры которой оптимальным образом согласуются с указанными
особенностями клиппированного речевого сигнала. К таким системам связи
можно отнести:
- системы связи с фазовой телеграфией ФТ;
- многоадресные импульсные асинхронные системы связи.
В системах связи с ФТ прием фазо-манипулированных сигналов
осуществляется синхронным приемником, поэтому помехоустойчивость
метода ФТ близка к потенциальной. Однако из-за явления "обратной работы"
метод ФТ не нашел практического применения для передачи дискретных
сигналов.
В
этом
отношении
практический
интерес
представляет
использование метода ФТ для передачи клиппированных речевых сигналов,
так как изменения полярности речевой волны человеческое ухо не
регистрирует, то есть наличие "обратной работы" не приводит к ухудшению
разборчивости речи. Таким образом, передача клиппированных речевых
18
сигналов
методом
ФТ
позволяет
реализовать
максимальную
помехоустойчивость этого метода.
В многоадресных импульсных асинхронных системах связи передача
информации осуществляется путем преобразования речевого сигнала в
последовательность прямоугольных импульсов малой длительности, которые
кодируются по правилам частотно временной матрицы ЧВМ. Основным
видом помех в этих системах являются взаимные импульсные помехи.
Средняя частота следования импульсных помех в асинхронных системах
связи в сильной степени зависит от плотности импульсов, излучаемых
отдельной радиостанцией.
Клиппированный речевой сигнал имеет среднюю частоту следования
нулевых (или экстремальных) значений значительно меньшую, чем
известные методы импульсной модуляции, например фазо-импульсная
модуляция, импульсно-кодовая, дельта-модуляция и другие. Поэтому
передача клиппированного речевого сигнала КРС в асинхронных системах
связи позволяет существенно уменьшить взаимные помехи и увеличить
число одновременно работающих абонентов в системе связи.
Одной из разновидностей клиппированного речевого сигнала КРС
является сигнал экстремально-кодированной речи ЭКР, который образуется в
результате
дифференцирования
передаваемого
речевого
сигнала
с
последующим предельным ограничением (клиппированием) по уровню.
Определяя
амплитудой,
клиппированную
можно
речь,
рассматривать
как
сигнал
процесс
с
ограниченной
клиппирования
как
приравнивание текущих значений речевого сигнала, превышающих нулевой
уровень к значению «+1», а значения, меньше нуля - к «−1».
Клиппированным
речевым
сигналом
называют
предельно
ограниченный «стриженый» сигнал, сохраняющий лишь два возможных
значения, которые условно принимаются за +1 и −1.
19
а)
б)
Рисунок 2— Речевой сигнал до (а) и после (б) клиппирования
После преобразования сигнала на цифровой схеме, на выходе
получается аналоговый клиппированный сигнал, имеющий лишь два
состояния. Преимущество такого метода клиппирования заключается в том,
что полученный аналоговый сигнал практически без потерь сохраняет
моменты переходов переменного напряжения звукового сигнала через ноль.
В различных работах отмечается, что, несмотря на недостаточную
естественность
звучания
клиппированной
речи,
ее
разборчивость
оказывается достаточно высокой, причем разборчивость речи повышается,
если до клиппирования речевой сигнал подвергнуть дифференцированию.
Это явление означает, что информация о распределении интервалов между
нулевыми пересечениями сигнала может быть использована для построения
устройств
автоматического
распознавания
и
синтеза
речи.
Привлекательность автоматического анализа клиппированной речи и
использования
ее
параметров
для
целей
построения
говорящих
и
понимающих речь машин лежит в простоте получения этих параметров.
Другим способом получения клиппированного сигнала является
обработка
звука
в
цифровом представлении.
Если речевой
сигнал
представлен дискретной последовательностью его отсчетов, то фиксирование
момента перехода сигнала через нуль происходит, когда знаки двух соседних
дискретных отсчетов речевого сигнала различны.
Информация об общем числе переходов сигнала на определенном
интервале и различных диапазонах длительностей участков между нулями
часто используется для грубой оценки частотного состава сигнала.
Существует
тесная
связь
между
числом
нулевых
пересечений
и
распределением энергии по частотам. Существуют системы автоматического
20
распознавания речи, в которых нулевые пересечения используются для
приближенного определения формантных частот.
История применения клиппированной речи в аналоговую эпоху
Исторически,
клиппированная
речь
применялась
в
телекоммуникационных системах всякий раз, когда в условиях недостатка
пропускной способности каналов связи требовалось довести смысловую
информацию. Главным критерием в подобных случаях становилась
разборчивость речи, а естественностью тембра речи обычно жертвовали. С
учетом этого, клиппированная речь применялась в системах команднодиспетчерской и производственной связи, а также в линиях служебной связи.
Спецификой
служебной
связи
(производственной,
командной,
поисковой и т. д.), является мобильность, так как большинство абонентов
подвижны. Кроме того, абоненты служебной связи не удалены от
радиосредств, им не требуется соединительная линия для подключения к
передатчику. В то же время в служебной связи очень важно сжатие
динамического диапазона речи, поскольку энергетика радиолинии очень
ограничена (малая мощность передатчика, малоэффективные антенны и т.
д.). Эта же проблема стоит в низовой связи – на районном или даже
областном уровне.
В технике связи, в особенности, низовой радиосвязи и в системах
коммерческой радиотелефонии, в настоящее время наблюдается тенденция к
созданию многоканальных дискретных систем для передачи речевых
сообщений.
Одним из недостатков таких систем связи, в частности, асинхронных
адресных систем связи, является наличие внутрисистемных помех (шумов
неортогональности), уровень которых в значительной степени зависит от
производительности
источника
сообщения
(скорости
передаваемых
импульсных сигналов) и является основной причиной существенного
ограничения числа одновременно работающих абонентов связи.
21
Значительного снижения уровня внутрисистемных (взаимных) помех в
этих системах можно достичь, используя дискретную передачу ограниченной
речи.
В
низкоскоростных
каналах
аналоговых
систем
командно-
диспетчерской радиосвязи для передачи речевых сообщений может с
успехом применяться клиппированная речь, когда речь передаётся в виде
сигнала с двумя значениями амплитуды: максимальным и минимальным, что
увеличивает дальность работы передатчика. Речь получается зашумлённой,
низкого качества, плохой узнаваемости, но потребитель может распознать
смысловое содержание передачи.
Также процесс клиппирования речевого сигнала можно определить
следующим образом: клиппирование - сжатие динамического диапазона речи
посредством предельного ограничения амплитуд. То есть случайные
значения
амплитуды
фиксированному
исходного
речевого
положительному
или
сигнала
преобразуются
отрицательному
к
значению
клиппированного сигнала в зависимости от текущей полярности напряжения
исходного речевого сигнала.
При
ограничении
амплитуды
полезного
сигнала
посредством
усилителя-ограничителя, возникает также и клиппирование шумов в паузах
между
словами,
которое
приводит
к
высокой
зашумлённости
клиппированного речевого сигнала и снижению качества и разборчивости
речи.
Специфический тембр клиппированной речи объясняется тем, что при
ограничении звуков повышается уровень гармонических спектров —
комбинационных продуктов нелинейного преобразования сигналов.
Существенным
недостатком
метода
клиппирования
является
зашумление пауз речи, что требует защиты микрофона от внешних акустических шумов (например, используется ларингофон). Поэтому, важным
параметром
клиппированного
речевого
зашумления (шума) в паузах между словами.
сигнала
является
уровень
22
Клиппированная речь в системах засекреченной связи
Первые исследования по применению клиппированной речи в системах
правительственной и засекреченной связи проводились еще в начале 50-х
годов сотрудниками Марфинской секретной лаборатории, где разработки
велись предпочтительно в области секретной связи.
Была предложена отечественная шифрующая аппаратура М-803,
созданная на основе использования клиппирования речи, где шифрование
происходило апериодической гаммой шифратора по принципу «знак на знак»
путем сложения по модулю 2.
В виду того, что исследования проводились в аналоговую эпоху тех
времен, это накладывало и существенные ограничения к разрабатываемым
технологиям, несмотря на высокие требования, накладываемые на них.
Главнейшей
проблемой
по-прежнему
являлось
существенное
повышение качества речи, восстановленной на приемном конце тракта связи.
Необходимо
было
повышать
качество
речи
и,
самое
главное,
"естественность" ее звучания.
В
выдержках
доклада
руководителя
группы,
работающего
в
направлении исследований в области клиппированной речи А.М. Васильева
от 21.12.1949 г. выдвигаются 2 положения:
- для скорейшего внедрения секретной связи необходим выпуск
небольшой серии аппаратуры, допуская при этом некоторое снижение
качества связи;
- радикальное улучшение качества речи может быть достигнуто только
при удвоенной полосе частот канала связи.
Прежде всего, следует отметить, что клиппированная речь в аппаратуре
секретной
связи
М-803
имеет
низкую
разборчивость
и
большую
зашумленность, к тому же полоса частот каналов связи не позволяла
повысить частоту дискретизации выше 4500 Гц.
В виду того, что аналоговая техника связи не удовлетворяла данным
требованиям, данный проект был вынужден закрыться.
23
Защита информации при передаче речевых сообщений по каналам
связи и в настоящее время является важной и неотъемлемой задачей
обеспечении обеспечения безопасности, так как злоумышленники могут как
несанкционированно вторгаться в передаваемую информацию с целью ее
перехвата, так и вносить в нее коррективы.
1.4
Описание существующих методов и критериев оценки
качества звучания речи
Оценка
качества речи
является
важным
этапом при
анализе
экспериментально полученных данных в ходе цифровой обработки речи.
Поэтому очень важно определиться со способом оценки, подходящим к
данной теме исследования.
В настоящий момент существуют три типа методов оценки качества
звуковых сигналов: субъективный, объективный и психоакустический.
Субъективные методы
Для
оценки
искажений
сигнала
производятся
субъективно-
статистические испытания (ССИ) с помощью группы экспертов.
Субъективные оценки качества основываются на статистической
обработке субъективных оценок качества достаточно большого числа
слушателей-экспертов. Эти оценки существенно зависят от возраста и пола
диктора, скорости произнесения фраз и других обстоятельств. Тесты при
получении субъективных оценок проводят с имитацией реальных условий,
например, посторонний шум, фоновая речь других людей и т. п.
Количественные результаты этих тестов отображают усредненное качество,
уровень усилий слушателя, разборчивость, естественность звучания.
Средняя
экспертная
оценка
MOS
(MeanOpinionScore)
—
это
субъективное измерение, определенное в рекомендации P.800 МСЭ-Т для
оценки качества передачи в телефонных сетях.
24
Для различных задач могут использоваться разные 5-балльные шкалы
оценок категорий. Три наиболее используемых в исследованиях МСЭ-Т
шкалы мнений:
Таблица 1 - Шкала качества при прослушивании
Качество речи
Оценка
Отличное
5
Хорошее
4
Удовлетворительное
3
Посредственное
2
Плохое
1
Таблица 2 - Шкала усилий при прослушивании
Усилие, требующееся для понимания смысла
фраз
Оценка
Возможно полное расслабление, не требуется
никакого усилия
5
Необходимо внимание, не требует заметного
усилия
4
Требуется умеренное усилие
3
Требуется значительное усилие
2
Смысл непонятен при любых условиях
1
Таблица 3 - Шкала предпочтений по громкости
Предпочтение по громкости
Оценка
Значительно громче предпочтительного уровня 5
Громче предпочтительного уровня
4
Предпочтительный уровень
3
Тише предпочтительного уровня
2
Значительно тише предпочтительного уровня
1
25
Вычисленная
по
оценкам
величина
(средняя
оценка
мнений)
обозначается символами MOS. Оценки MOS приведены в таблице:
Таблица 4 – Оценка качества символами MOS
Субъективная оценка
качества
звучания речи
Уровень восприятия речевой информации
Оценка
Отлично
Речь воспринимается полностью и без усилий
5
Хорошо
Речь воспринимается свободно, без ощутимых усилий
4
Удовлетворительно
Речь воспринимается с умеренными усилиями, наличие
дефектов неоспоримо
3
Плохо
Речь воспринимается вниманием
2
Очень плохо
Речь не воспринимается полностью или частично
1
Абсолютные значения MOS зависят от контекста тестов, на них
оказывают влияние различия в уровне знания языка и т. д.
Достоинствами метода являются:
- достаточно высокая достоверность полученных результатов, так как
проводится большое количество исследований, и на основе полученной
статистики
можно
сделать
необходимые
выводы
по
полученным
результатам.
Недостаток метода - довольно сложно собрать группу экспертов,
знающих тонкости и необходимые критерии оценки сигналов.
Объективные методы
Объективные методы предлагают менее трудоемкие способы по
сравнению с субъективными. Объективные методы основываются на оценке
степени
Несмотря
отличия
на
то,
кодированного
что
некоторая
и
корреляция
исходного
между
сигналов.
объективными
показателями и субъективным качеством есть, однозначно судить о
субъективном качестве нельзя, чем, собственно, и объясняется разный способ
26
оценки качества.
Различают два вида оценки качества объективными
методами:
- соотношение сигнал/шум (SNR);
- сегментное соотношение сигнал/шум (segSNR).
Достоинством
данного
метода
является
низкая
трудоемкость
испытаний.
К недостаткам можно отнести отсутствие полноты сведений о
полученном сигнале. Так как главное в передаче речи – восприятие ее
слушателем.
Психоакустические методы
Психоакустические методы оценки качества учитывают особенности
восприятия человеческого восприятия звука в целом и речи в частности.
Особенность данных методов в том, что оценивается только субъективное
качество сигнала с помощью технических и программных средств. Таким
образом, строго говоря, они относятся к объективным методам, но построены
исходя из особенностей субъективного восприятия звука человеком.
По мере развития способов устранения избыточности звуковых
сигналов оценивать качество объективными параметрами становилось
невозможным, а субъективно-статистические испытания оставались весьма
трудоемкими. Устранение избыточности основывалось на особенностях
восприятия звука и речи человеком, что послужило поводом для применения
знаний об этих особенностях уже в методах оценки качества.
Достоинства: оценка субъективного качества сигналов без привлечения
группы экспертов.
Недостаток метода состоит в том, что необходимо привлечение
дополнительных программных средств для оценки качества.
27
Выводы ГЛАВЫ 1:
В аналоговой технике связи клиппированная речь подошла к пределу
своих возможностей в виду ряда ограничений, присущих аналоговым
каналам связи.
При передаче в канале тональной частоты (ТЧ), клиппированная речь
имела ограниченную разборчивость и высокую степень зашумленности, что
было обусловлено следующими причинами:
- клиппированию подвергался спектр речи (полоса 200-3400 Гц) при
низкой частоте дискретизации Fд = 4500 Гц (отношение Fд к Fв = 3400 Гц
составляет 1,32, что недопустимо, так как не выполняется теорема
Котельникова);
- клиппированию подвергалась не только речь, но и шумы в паузах, что
приводило к сильному зашумлению речи и затрудняло её восприятие. Задача
шумоподавления не была решена;
-
повышение
частоты
дискретизации
до
8000
Гц
являлось
невозможным в виду отсутствия устройств, позволяющих передавать
клиппированную речь по аналоговым телефонным каналам связи ТЧ.
Отмеченные
негативные
факторы
не
могли
быть
устранены
аналоговыми технологиями, что, в конечном итоге, послужило причиной для
отказа от дальнейшего использования клиппированной речи в аналоговых
системах связи, и привело к закрытию проектов.
Однако, в настоящее время, цифровые методы передачи и обработки
информации открывают новые возможности для улучшения качества
звучания клиппированной речи. В первую очередь следует отметить
следующее:
- простота осуществления процесса клиппирования речи посредством
знакового кодирования отсчётов цифрового речевого сигнала;
- наличие удобных цифровых методов обработки клиппированой речи с
целью повышения качества её звучания;
28
- возможность обеспечения информационной безопасности при
хранении и передачи файлов с клиппированной речью.
Для оценки качества клиппированной речи в данном диссертационном
исследовании выбран субъективный метод средней экспертной оценки по
пятибалльной шкале оценки качества символами MOS.
1.5 Постановка задач исследования
На основе проведенного анализа относительно методов снижения
скорости передачи речи и в соответствии с целью работы можно
сформулировать следующие задачи диссертационного исследования:
1. Анализ существующих методов снижения скорости передачи речи.
2. Анализ существующих методов и критериев оценки качества
звучания речи.
3. Разработка и описание модели в среде разработки NI LabVIEW.
4. Исследование влияния
значения частоты
дискретизации
на
разборчивость клиппированной речи.
5. Исследование наличия эффекта элайзинга при клиппировании
цифрового речевого сигнала.
6. Исследование эффективности порогового шумоподавления в паузах
речи на разборчивость клиппированной речи.
7. Исследование влияния тембра голоса дикторов на разборчивость
клиппированной речи.
8. Разработка способа снижения скорости передачи клиппированной
речи на основе однополярного клиппирования речевого сигнала.
9.
Исследование
возможности
снижения
разборчивости
клиппированной речи методом скремблирования.
10. Описание технологии передачи цифровой клиппированной речи по
низкоскоростным каналам связи.
29
ГЛАВА 2 РАЗРАБОТКА И ИССЛЕДОВАНИЕ
КОМПЬЮТЕРНОЙ МОДЕЛИ УСТРОЙСТВА
ФОРМИРОВАНИЯ КЛИППИРОВАННОЙ РЕЧИ
2.1 Разработка и описание модели в среде разработки NI LabVIEW
В
соответствии
с
поставленными
задачами
диссертационного
исследования, необходимо располагать средствами для формирования и
обработки клиппированной речи. Техническими средствами это сделать
достаточно
сложно,
поэтому
в
качестве
средства
исследования
разборчивости и формирования клиппированной речи целесообразно
использовать компьютерное моделирование.
В качестве программной среды моделирования была выбрана среда
разработки и платформа для выполнения программ LabVIEW фирмы National
Instruments. Отличительной особенностью данной среды разработки является
графический язык программирования «G». Преимуществами NI LabVIEW
является наглядность получаемых результатов, возможность работы в
режиме реального времени, конвергенция с существующими аппаратными
средствами
обработки.
Помимо
этого,
главным
удобством блочной
структуры LabVIEW является как возможность написания алгоритмов
вручную, так и использование уже готовых функциональных блоков, что
является большим преимуществом при выборе среды разработки для
исследований.
В сочетании с графическим программированием, которое сокращает
время разработки, LabVIEW упрощает сложный процесс системного
проектирования с помощью самых современных инструментов и готовых
алгоритмов.
На первом этапе исследований в программной среде LabVIEW была
разработана компьютерная модель устройства формирования и обработки
30
цифровой клиппированной речи. Пользовательский интерфейс модели
представлен на рисунке 3.
Рисунок 3 – Главное окно имитационной модели для исследования и
улучшения характеристик клиппированной речи
Интерфейс программы содержит функциональные блоки, каждый из
которых отвечает за определенные этапы формирования и обработки
клиппированного речевого сигнала:
1 - окно выбора исходного сигнала;
2 - окно для записи обработанного сигнала;
3 - блок передискретизации;
4 - блок полосового фильтра с динамическим ползунком для изменения
параметров;
5 - блок порогового шумоподавителя с динамическим ползунком для
изменения параметров;
6 - клиппер;
7 - блок воспроизведения исходного сообщения;
8 - блок воспроизведения обработанного сообщения;
31
9 - эпюра исходного сигнала;
10 - эпюра клиппированного сигнала.
Для дальнейших исследований были взяты 10 тестовых фраз из ГОСТ
Р 50840-95 «Передача речи по трактам связи. Методы оценки качества,
разборчивости и узнаваемости», записанные в формате Wav, 96 кГц, 16 Бит,
моно:
1) «за горой течет река»;
2) «спорт требует упорства»;
3) «спортсмен сменил футболку»;
4) «сначала сдают математику»;
5) «офицер отдал приказ»;
6) «артисты обещают концерт»;
7) «синицы зимуют в Эстонии»;
8) «химики проходят практику»;
9) «геологи сдержали слово»;
10) «летчик видит хорошо».
А так же самостоятельно записанная фраза с помощью 2 дикторов: мужчины
и женщины с идентичными параметрами обработки: «…У незнакомого
поселка, на безымянной высоте…».
2.2
Оценка влияния значения частоты дискретизации на
разборчивость клиппированной речи
В цифровых системах передачи информации речевой сигнал перед
клиппированием подвергается дискретизации, которая является причиной
возникновения ошибки при определении момента времени перехода речевого
сигнала через ноль. То есть, при дискретизации точность определения
моментов времени перехода через ноль клиппированной речи зависит от
частоты дискретизации fд.
32
Рисунок 4 — Форма исходного звукового сигнала и сигнала, полученного при
клиппировании с частотой дискретизации fд, 0,5*fд
Это, в свою очередь, может привести к дополнительному снижению
разборчивости клиппированной речи. Очевидно, что величина ошибки
обратно пропорциональна значению частоты дискретизации.
Однако, повышение частоты дискретизации приводит к увеличению
скорости передачи данных, что не желательно. Поэтому задача установления
зависимости разборчивости клиппированной речи от частоты дискретизации
является актуальной.
Рисунок 5 — Величина погрешности определения перехода сигнала через ноль
при клиппировании, для частоты дискретизации fд, 0,5*fд
33
Отсюда очевидно, что ошибка квантования зависит от частоты
дискретизации (формула 1).
{ t }max=
t
1
=
2 2 fд
(1)
Вычислительный эксперимент
Цель: исследовать влияние значений частоты дискретизации на
качество звучания клиппированной речи.
План:
1) загрузить речевые фразы;
2) выполнить процедуру децимации сигналов с заданным шагом;
3) клиппировать сигналы с использованием метода знакового
кодирования;
4) при помощи методов субъективной оценки качества речевых
сигналов MOS дать экспертную оценку каждому полученному сигналу;
5)
построить
таблицы
с
соотношением
оценки
качества
клиппированных речевых сигналов к значениям частот дискретизации;
6) сравнить полученные результаты, сделать соответствующие выводы.
Исходные данные:
1) речевые сигналы, записанные с частотой дискретизации fd=96 кГц,
разрядностью кодовой последовательности 8 бит, моно;
2) речевые фразы для исследований приведены в подразделе 2.1;
4) количество используемых для исследования вариаций частот
дискретизации fd: 96 кГц; 48 кГц; 32 кГц; 24 кГц; 19,2 кГц; 16 кГц; 12 кГц; 9,6
кГц; 8 кГц; 6,4 кГц; 6 кГц; 4,8 кГц;
5) количество экспертов для субъективной оценки качества сигналов
методом MOS – 5 человек.
Словесное описание алгоритма проведения эксперимента:
1) загрузить исходный речевой сигнал длительностью N;
34
2) выполнить децимацию исходного сигнала до следующих значений
частоты дискретизации: fd: 96 кГц; 48 кГц; 32 кГц; 24 кГц; 19,2 кГц; 16 кГц;
12 кГц; 9,6 кГц; 8 кГц; 6,4 кГц; 6 кГц; 4,8 кГц;
3) выполнить операцию знакового кодирования сигнала;
4) повторить эксперимент при
следующем исходном сигнале,
записанном другим диктором. Загрузить новый сигнал для исследования и
повторить пункты 2-3;
5) конец.
Полученные
речевые сигналы с заданными параметрами оценены
пятью экспертами по модели оценки качества речи MOS, включающей в себя
5 критериев.
Таблица 5 — Зависимость качества клиппированной речи от частоты
дискретизации на основе субъективной оценки качества исследуемых сигналов MOS
fd, кГц
96
48
32
24
19,2
16
12
9,6
8
6,4
6
4,8
Эксперт 1
Эксперт 2
Оценка MOS
Эксперт 3
Эксперт 4
5
5
5
5
5
4
4
4
3
2
2
2
5
5
5
5
5
4
4
3
4
2
2
2
5
5
5
5
4
5
4
4
3
2
2
2
5
5
5
5
5
4
4
4
4
3
2
2
Эксперт 5
5
5
5
5
5
4
4
3
3
2
2
2
Средняя
оценка
5
5
5
5
4,8
4,2
4
3,6
3,4
2,2
2
2
Выводы:
Анализ полученных результатов говорит о том, что значительное
ухудшение разборчивости клиппированной речи становится заметным при
снижении частоты дискретизации fд ниже 8 кГц. Это вызвано ограничением
35
спектра речи в области высоких частот, которое существенно снижает
качество и разборчивость обрабатываемого сигнала.
Главным
результатом
проведенных
исследований
является
возможность понижения частоты дискретизации клиппированного речевого
сигнала до 8 кГц при сохранении высокой разборчивости. Исходя из этого,
дальнейшие эксперименты целесообразно проводить с сигналами при данном
значении частоты дискретизации, приняв его за исходное. Это обусловлено
применением данного значения частоты дискретизации при передаче речи в
основных каналах связи.
2.3
Исследование наличия эффекта элайзинга при
клиппировании цифрового речевого сигнала
Клиппированный сигнал сохраняет хорошую разборчивость речи, но
значительно зашумляет ее. Это вызвано тем, что амплитуда сигнала
ограничиваетя, фактически представляя собой прямоугольный импульс, что в
последствии
ведет
к
изменениям
спектра
сигнала.
Появляются
дополнительные гармоники, и спектр принимает форму sin(x)/x, что
приводит к значительному зашумлению исходного речевого сигнала.
При слишком низкой частоте дискретизации из-за слишком широкого
спектра исходного сигнала может возникать элайзинг.
Вычислительный эксперимент
Цель: исследовать наличие эффекта элайзинга при клиппировании
цифрового речевого сигнала.
План:
1) загрузить речевые фразы;
2) варьируя значениями частот среза фильтра с заданным шагом,
выполнить полосовую фильтрацию сигналов для выбранного значения
частоты дискретизации fd=8 кГц;
36
3) клиппировать сигналы с использованием метода знакового
кодирования;
4) при помощи методов субъективной оценки качества речевых
сигналов MOS дать экспертную оценку каждому полученному сигналу;
5)
построить
таблицы
с
соотношением
оценки
качества
клиппированных речевых сигналов к частотам среза полосового фильтра;
6) сравнить полученные результаты, сделать соответствующие выводы.
Исходные данные:
1) речевые сигналы с частотой дискретизации fd=8 кГц, разрядностью
кодовой последовательности 8 бит, моно;
2) речевые фразы для исследований приведены в подразделе 2.1;
3) фильтр для исследования – полосовой фильтр Баттерворта 2
порядка;
4) шаг изменения частоты среза фильтра равен 100 Гц;
5) количество экспертов для субъективной оценки качества сигналов
методом MOS – 5 человек.
Словесное описание алгоритма проведения эксперимента:
1) загрузить исходный речевой сигнал длительностью N;
2) выполнить полосовую фильтрацию сигнала с шагом i=100:100:1000
Гц для заданного значения частоты дискретизации fd;
3) выполнить операцию знакового кодирования сигнала;
4) повторить эксперимент при
записанном
другим
диктором.
следующем исходном сигнале,
Загрузить
следующий
сигнал
для
исследования и повторить пункты 2-3;
5) конец.
Полученные
речевые сигналы с заданными параметрами оценены
пятью экспертами по модели оценки качества речи MOS, включающей в себя
5 критериев.
Для реализации цели данного исследования в компьютерной модели
применен перестраиваемый полосовой фильтр Баттерворта.
37
На начальном этапе исследований экспертной группой по оцениванию
качества сигнала методом MOS было выявлено, что уменьшение частоты
среза в области высоких частот ниже уровня 3,4 кГц приводит к
«приглушению» речи, снижая уровень ее восприятия, следовательно,
дальнейшее уменьшение частоты среза в области высоких частот является
нецелесообразным. Данный вывод и служит основанием для выбора верхней
частоты среза, равной fср=3,4 кГц. Поэтому логично остановиться на данной
частоте и исследовать ограничения в области низких частот.
Рисунок 6 – Окно ПО LabView с исследуемой моделью влияния полосовой
фильтрации на качество клиппированной речи
а)
б)
Рисунок 7 — Эпюры исходных речевых сигналов до клиппирования:
а) до полосовой фильтрации;
б) с использованием полосового фильтра Баттерворта 2 порядка с
fср1=600 Гц, fср2=3,4 кГц.
38
На следующем рисунке предоставлены эпюры сигналов после
клиппирования, с использованием идентичного фильтра и его параметров.
а)
б)
Рисунок 8 —Эпюры клиппированных речевых сигналов:
а) до полосовой фильтрации;
б) с использованием полосового фильтра Баттерворта 2 порядка с
fср1=600 Гц, fср2=3,4 кГц.
Таблица 6 – Оценка качества сигналов после фильтрации в зависимости от
частоты среза
Частота
среза fср, Гц
Эксперт 1
100
200
300
400
500
600
700
800
900
1000
3
3
3
3
3
3
2
2
2
2
Оценка качества сигнала, MOS
Эксперт 2
Эксперт 3
Эксперт 4 Эксперт 5
4
3
4
3
3
4
3
2
2
2
3
4
3
3
4
3
3
3
2
2
4
4
3
4
3
4
2
2
2
2
3
3
4
3
3
3
2
2
2
2
Средняя
оценка
3,4
3,4
3,4
3,2
3,2
3,4
2,4
2,2
2
2
Анализируя полученные результаты, можно сделать следующие
выводы:
- Из рисунка 7 видно, что после фильтрации сигнала с заданными
параметрами произошло уменьшение максимальных амплитуд исходного
сигнала. Это объясняется потерей части энергии сигнала, попавшей за
39
пределы полосы прозрачности фильтра. Однако для клиппированного
сигнала этот факт не является существенным.
При проведении эксперимента с исследованием влияния изменения
частоты дискретизации на качество клиппированной речи было доказано, что
при fd=8 кГц искажений, вызванных эффектом элайзинга не возникает.
Эффект наложения спектров возникает при условии, что обработке
подвергается аналоговый клиппированный сигнал. При прохождении его
через АЦП возникает множество копий спектров, что и приводит к
элайзингу. При обработке сигналов, записанных уже в цифровой форме, и
клиппированных методом знакового кодирования, данный эффект не
возникает, что и подтверждают результаты данного вычислительного
эксперимента.
Данное утверждение говорит о том, что для экономии вычислительных
емкостей оборудования целесообразно отказаться от цифровой полосовой
фильтрации. Это обусловлено тем, что обработка сигналов в частотной
области требует наличие большой вычислительной мощности аппаратуры, а
также сделает затруднительной обработку речи в режиме реального времени
при недостатке ресурсов вычислительного оборудования. Для систем связи,
требующих соответствия единственному главному критерию - сохранение
высокой степени разборчивости речи, применение дополнительных процедур
обработки речи в частотной области не является необходимой.
2.4
Исследование эффективности порогового шумоподавления в
паузах речи на разборчивость клиппированной речи
При
клиппировании
речи
предельному
ограничению
также
подвергаются шумы в паузах сигнала. Они же и служат источником
большого числа побочных спектральных компонент, зашумляющих речь,
искажающих её тембр и, в конечном итоге, снижающих её разборчивость.
40
Во
избежание
появления
побочных
спектральных
компонент,
вызванных предельным ограничением шумов в паузах речевого сигнала,
предлагается ввести пороговый шумоподавитель с изменяемым значением
порога. Для подавления шумов в паузах, пороговый шумоподавитель
обнуляет все отсчеты дискретизированного сигнала, значения которых не
превышают величины заданного порога. Варьируя величину порога можно
эмпирически
добиться
существенного
повышения
разборчивости
клиппированной речи.
Вычислительный эксперимент
Цель: исследовать эффективность порогового шумоподавления в
паузах речи на разборчивость клиппированной речи.
План:
1) загрузить речевые фразы;
2) произвести процедуру децимации выбранного речевого сигнала до
заданного значения fd;
4) выполнить процедуру порогового шумоподавления с заданным
шагом;
5) выполнить операцию знакового кодирования сигнала;
6) при помощи методов субъективной оценки качества речевых
сигналов MOS дать экспертную оценку каждому полученному сигналу;
7)
построить
таблицы
с
соотношением
оценки
качества
клиппированных речевых сигналов к пороговому шумоподавлению;
8) сравнить полученные результаты, сделать соответствующие выводы.
Исходные данные:
1) речевые сигналы с частотой дискретизации fd=8 кГц, разрядностью
кодовой последовательности 8 бит, моно;
2) речевые фразы для исследований приведены в подразделе 2.1;
3) количество экспертов для субъективной оценки качества сигналов
методом MOS – 5 человек.
41
Словесное описание алгоритма проведения эксперимента
1) загрузить исходный речевой сигнал длительностью N;
2) выполнить процедуру децимации до заданного значения fd=8 кГц;
3) выполнить процедуру порогового шумоподавления с заданным
шагом i=0,003:0,003 до момента, когда подавлению будет подлежать
полезный сигнал;
4) выполнить операцию знакового кодирования сигнала;
5) повторить эксперимент при исходном сигнале, записанном другим
диктором. Загрузить новый сигнал для исследования и повторить пункты 2-4;
6) конец.
Полученные
речевые сигналы с заданными параметрами оценены
пятью экспертами по модели оценки качества речи MOS.
Результаты эксперимента
Рисунок 9 — Окно программы NI LabView с эпюрой клиппированного
сигнала до удаленных шумов в паузах
42
Рисунок 10 — Окно программы NI LabView с эпюрой клиппированного
сигнала с пороговым шумоподавлением
В результате апробации алгоритма порогового шумоподавления была
произведена оценка сигнала при 6 значениях шумоподавителя.
Так как пороговое ограничения удаляет не только шумы в паузах, но и
часть полезного сигнала (обнуляя отсчёты с уровнями меньше заданного
порога), то в ходе исследования потребовалось экспериментально подбирать
значение величины оптимального порога ограничения для заданной частоты
дискретизации fд речевого сигнала.
В таблице 7 приведено соотношение уровней порога шумоподавления с
соответствующими
им субъективными
экспертными
оценками
MOS,
характеризующими качество полученных при обработке клиппированных
сигналов.
Таблица 7 – Качество клиппированных речевых сигналов с удаленными
шумами, оцененных по шкале MOS
Порог
шумоподавления
0,003
Эксперт
1
2
0,006
0,01
0,013
0,016
0,02
3
3
3
2
2
Оценка качества сигнала, MOS
Эксперт Эксперт Эксперт Эксперт
2
3
4
5
3
4
4
3
4
4
4
3
3
4
4
3
4
3
3
3
4
3
3
3
4
3
4
3
Средняя
оценка
3,2
3,4
3,6
3,4
3,2
2,8
43
Рисунок 11 — Форма исходного звукового сигнала и сигнала, полученного при
клиппировании с применением порогового шумоподавителя
Рисунок 12 — Форма исходного звукового сигнала и сигнала, полученного при
клиппировании с применением порогового шумоподавителя
Выводы:
В результате проведенных исследований, на основе анализа оценок
качества сигналов, определенных экспертной группой методом MOS, было
установлено, что при выборе порога шумоподавления, равном p=0,01, у
клиппированного
сигнала
наблюдается
существенное
увеличение
разборчивости речи.
Необходимо отметить, что при пороговом ограничении возникают
искусственные паузы в самом речевом сигнале, которые, в свою очередь,
также могут повлечь снижение разборчивости речи (рисунок 12).
Паузы в самой речи вызываются либо слишком высоким значением
порога шумоподавителя, либо являются следствием подавления шипящих и
свистящих звуков речи, имеющих уровень амплитуды ниже установленного
порога.
44
Очевидно, что для устранения этого эффекта следует обеспечивать
высокое отношение мощности речевого сигнала к мощности шума на входе
порогового шумоподавителя.
Другим следствием применения порогового шумоподавления является
переход от двухуровнего к трехуровнему цифровому сигналу, поэтому для
кодирования амплитуд отсчетов потребуется уже не один, а два бита.
Увеличение в два раза объема передаваемой информации есть плата за
увеличение разборчивости клиппированной речи методом подавления шумов
в паузах речи.
2.5
Исследование влияния тембра голоса дикторов на
разборчивость клиппированной речи
Одним из самых главных критериев при передаче речи является
разборчивость.
Для передачи клиппированной цифровой речи следует обратить
внимание на многие факторы, так как она изначально сильно зашумлена, и
необходимо отгородить ее от лишних источников искажений, найти
оптимальные параметры и способы передачи.
Одним из методов для нахождения оптимальных параметров и
приемлемого
качества
может
являться
исследование
и
анализ
клиппированной речи, записанной разными дикторами, - мужчиной и
женщиной.
Необходимо
выявить,
насколько
универсальна
данная
технология, и проверить необходимость разработки конкретных требований
к обработке сигналов, записанных разными дикторами.
45
Вычислительный эксперимент
Цель: исследовать влияние тембра голосов разных дикторов –
мужчины и женщины, на разборчивость клиппированной речи.
План:
1) Записать 2 речевых фразы, произносимые двумя дикторами.
2) выполнить процедуру децимации с заданным шагом;
3) выполнить процедуру порогового шумоподавления с порогом 0,01;
4) Клиппировать сигналы с использованием метода знакового
кодирования.
5) При помощи методов субъективной оценки качества речевых
сигналов MOS дать экспертную оценку каждому полученному сигналу.
6)
Построить
таблицы
с
соотношением
оценки
качества
клиппированных речевых сигналов к частотам дискретизации.
7) Сравнить полученные результаты, сделать соответствующие
выводы.
Исходные данные:
1) Речевые сигналы, записанные двумя дикторами (мужчиной и
женщиной) с частотой дискретизации fd=96 кГц, разрядностью кодовой
последовательности 8 бит, моно;
2) речевая фраза, выбранная для эксперимента: «…у незнакомого
поселка, на безымянной высоте…»;
3)
значения
длительностей
речевых
фраз,
используемых
в
эксперименте: 3с. – сигнал, записанный мужчиной; 5с. - женщиной;
4) количество экспертов для субъективной оценки качества сигналов
методом MOS – 5 человек.
Словесное описание алгоритма проведения эксперимента
1) загрузить исходный речевой сигнал длительностью N;
2) выполнить процедуру децимации с заданным шагом;
3) выполнить процедуру порогового шумоподавления с заданным
порогом 0,01;
46
4) выполнить операцию знакового кодирования сигнала;
5) повторить эксперимент при исходном сигнале, записанном другим
диктором. Загрузить новый сигнал для исследования и повторить пункты 2-4;
6) конец.
Полученные
речевые сигналы с заданными параметрами оценены
пятью экспертами по модели оценки качества речи MOS.
Диктор 1 (Д1) – женщина, тембр высокое (лирическое) меццо-сопрано.
Диктор 2 (Д2) – мужчина, тембр бас-баритон.
Рисунок 13 – Скриншот программы, выполняющей функции клиппера в
LabView. Эпюра клиппированного РС диктора 1
Результаты эксперимента
В
таблице
соответствующими
8
приведены
частоты
им субъективными
дискретизации
экспертными
сигналов
оценками
характеризующими качество полученных при обработке сигналов.
с
MOS,
47
Таблица 8 – Качество клиппированных речевых сигналов, оцененных по
шкале MOS
Сигналы
1, Д1
2, Д2
Fd, кГц
96
16
12
9,6
8
4
96
16
12
9,6
8
4
Эксперт
1
5
5
4
4
3
2
5
5
4
3
3
2
Оценка качества сигнала, MOS
Эксперт Эксперт Эксперт Эксперт
2
3
4
5
5
5
5
5
4
5
5
5
5
4
4
5
4
4
3
4
4
4
3
4
2
2
2
2
5
5
5
5
4
5
5
5
4
5
5
4
4
4
4
4
4
3
4
4
2
2
2
2
Средняя
оценка
5
4,8
4,4
3,8
3,6
2
5
4,8
4,4
3,8
3,6
2
По результатам исследований можно сделать следующие выводы:
- Принципиальной разницы между качеством мужской и женской речи
нет, отсутствуют значительные отличия между зависимостью тембра речи от
качества звучания на различных частотах дискретизации.
- Отсутствуют отличия в качестве речи между 2-мя сигналами друг от
друга, следовательно, нет и необходимости применять какие-либо меры
индивидуального улучшения качества под каждого диктора. В соответствии с
данным результатом, в дальнейших вычислительных экспериментах не
считается обязательным проводить исследования отдельно для двух разных
дикторов. Достаточно будет речевого сигнала, записанного любым из
дикторов.
48
2.5 Результаты и выводы главы
Результаты, полученные в ходе вычислительных экспериментов
предыдущих
подразделов
наглядно
продемонстрировали
возможность
существенного повышения разборчивости клиппированной речи.
В цифровых системах передачи информации частота дискретизации
для любых видов сигналов должна выбираться кратной частоте 8 кГц,
являющейся общепринятой при цифровой передаче речи в цифровых
телефонных системах связи. Данное значение частоты дискретизации
является стандартным и связано с базовым цифровым каналом (БЦК),
обеспечивающим скорость передачи данных 64 кбит/с. При построении
систем цифровой иерархии PDH и SDH за основу всегда принимается
скорость БЦК, вот почему все частоты дискретизации должны быть кратны
частоте 8 кГц.
С учетом этого факта, возможность передачи клиппированной речи с
частотой дискретизации 8 кГц представляет особый практический интерес.
Эксперименты, проведенные в подразделах главы 2 показали, что
обеспечить высокую разборчивость клиппированной речи с приемлемым
качеством, не мешающим для восприятия информации, содержащейся в
речевых данных при частоте дискретизации 8 кГц возможно с применением
цифровых
видов
обработки,
приведенных
в
вышеперечисленных
подразделах, направленных на повышение разборчивости клиппированной
речи. При этом, предложенный подход к методу формирования и обработки
клиппированных сигналов позволяет работать с речью вне зависимости от
характеристик, влияющих на окрас голоса диктора, тем самым подтверждая
универсальность разрабатываемой технологии.
На основе результатов исследований, приведенных в главе 2,
разработан итоговый вариант устройства формирования и обработки
клиппированной речи, и доказана его работоспособность с помощью
апробаций, проведенных на множестве речевых фраз.
49
Оценка качества звучания речи указывает на то, что применение
разработанной цифровой технологии обработки речи позволяет передавать
клиппированные сигналы в каналах связи с частотой дискретизации 8 кГц.
Путем дальнейшей модернизации устройства можно добиться еще
большего снижения скорости передачи клиппированной речи, а так же
расширить возможности ее применения, воспользовавшись операцией
скремблирования.
Таким образом, существует предположение о возможности передачи
зашифрованной клиппированной речи в закрытых каналах связи. Это
предоставляет практический интерес, так как защита информации является
основополагающим направлением, актуальным во все времена.
50
ГЛАВА
3
РАЗРАБОТКА
СПОСОБА
СНИЖЕНИЯ
СКОРОСТИ ПЕРЕДАЧИ ЦИФРОВОЙ КЛИППИРОВАННОЙ
РЕЧИ
С
ОБЕСПЕЧЕНИЕМ
ИНФОРМАЦИОННОЙ
БЕЗОПАСНОСТИ
Разработка
3.1
клиппированной
способа
речи
на
основе
снижения
скорости
однополярного
передачи
клиппирования
речевого сигнала
Следствием применения порогового шумоподавления является переход
от двухуровневого к трехуровневому цифровому сигналу, поэтому для
кодирования амплитуд отсчетов потребуется уже не один, а два бита.
Увеличение в два раза объема передаваемой информации есть плата за
увеличение разборчивости клиппированной речи методом подавления шумов
в паузах речи.
В соответствии с этим, в данном исследовании будет проведена
разработка метода перехода от трехуровневого сигнала к двухуровневому.
Вычислительный эксперимент
Цель:
разработать
метод
перекодирования
трехуровневого
клиппированного сигнала в двухуровневый для снижения скорости передачи
речи.
План:
1) загрузить речевые фразы;
2) произвести децимацию выбранного речевого сигнала до заданного
значения fd;
3)
выполнить
процедуру
модернизированного
шумоподавления с заданным шагом;
4) выполнить операцию знакового кодирования сигнала;
порогового
51
5) при помощи методов субъективной оценки качества речевых
сигналов MOS дать экспертную оценку каждому полученному сигналу;
6) построить таблицы с соотношением оценки качества однополярных
клиппированных речевых сигналов к уровню порогового шумоподавления;
7) сравнить полученные результаты с результатами, полученными в
подразделе 2.4, сделать соответствующие выводы.
Исходные данные:
1) речевые сигналы, записанные с выбранной частотой дискретизации
fd=8 кГц, разрядностью кодовой последовательности 8 бит, моно;
2) количество экспертов для субъективной оценки качества сигналов
методом MOS – 5 человек.
Речевые данные записаны в идентичных условиях, в пределах одной
комнаты на одинаковой аппаратуре. Дополнительных побочный воздействий
на сигналы, кроме шумов аппаратуры, не производилось.
ПО для проведения эксперимента: программная среда National
Instruments LabView.
Словесное описание алгоритма проведения эксперимента
1) загрузить исходный речевой сигнал длительностью N;
2) выполнить процедуру децимации до заданного значения fd=8 кГц;
3) выполнить процедуру порогового шумоподавления положительной
полярности сигнала с заданным шагом i=0,003:0,003 до момента, когда
подавлению будет подлежать полезный сигнал. Отрицательная полярность
должна быть подавлена;
4) выполнить операцию знакового кодирования сигнала;
5) повторить эксперимент при исходном сигнале, записанном другим
диктором. Загрузить новый сигнал для исследования и повторить пункты 1-4;
7) конец.
Полученные речевые сигналы оценены пятью экспертами по модели
оценки качества речи MOS.
52
Результаты эксперимента
Рисунок 14 — Окно программы NI LabView с эпюрой клиппированного
сигнала до удаленных шумов в паузах
Рисунок 15 — Эпюра клиппированного сигнала с модернизированным
пороговым шумоподавлением
В ходе исследований было найдено оптимальное решение проблемы
перехода от трехуровневого сигнала к двухуровневому.
Перейти к двухуровневому кодированию можно при использовании
порогового шумоподавителя. Суть заключается в том, чтобы оставлять
только положительную полярность клиппированного сигнала, подавляя
53
вместе с шумами значения сигнала, лежащие в его отрицательной
полярности, т.е. приравнивать их к нулю.
а)
б)
Рисунок 16 — Клиппированный сигнал: а)трехуровневый; б) двухуровневый
В результате апробации данного алгоритма модернизированного
порогового шумоподавления была произведена оценка сигнала при 6
значениях шумоподавителя.
В
таблицах
9,
10
приведено
соотношение
уровней
порога
шумоподавления с соответствующими им субъективными экспертными
оценками MOS, характеризующими качество полученных при обработке
клиппированных сигналов.
Таблица 9 – Зависимость качества трехуровневых клиппированных речевых
сигналов от уровня порога шумоподавления, оцененные по шкале MOS
Порог
шумоподавления
0,003
Эксперт
1
2
0,006
0,01
0,013
0,016
0,02
3
3
3
2
2
Оценка качества сигнала, MOS
Эксперт Эксперт Эксперт Эксперт
2
3
4
5
3
4
4
3
4
4
4
3
3
4
4
3
4
3
3
3
4
3
3
3
4
3
4
3
Средняя
оценка
3,2
3,4
3,6
3,4
3,2
2,8
54
Таблица 10 – Зависимость качества двухуровневых клиппированных речевых
сигналов от уровня порога шумоподавления, оцененные по шкале MOS
Порог
шумоподавления
0,003
Эксперт
1
2
0,006
0,01
0,013
0,016
0,02
3
3
3
2
2
Оценка качества сигнала, MOS
Эксперт Эксперт Эксперт Эксперт
2
3
4
5
3
4
4
3
4
4
4
3
3
4
4
3
4
3
3
3
4
3
3
3
4
3
4
3
Средняя
оценка
3,2
3,4
3,6
3,4
3,2
2,8
Выводы:
Данный метод кодирования позволяет без существенных затрат на
вычислительный эксперимент произвести переход от трехуровневого сигнала
к двухуровневому, решая одновременно 2 проблемы – устраняя лишнюю
избыточность трехуровневого сигнала и зашумленность клиппированной
речи.
Однако это влечет за собой незначительное снижение качества речи,
которое
возникает
в
виду
отсечения
отрицательной
полярности
клиппированного сигнала. Данный недостаток вносит незначительные
искажения в речь, несущественно влияя на ее разборчивость. Он проявляется
лишь в появлении побочных «тресков».
Исходя из вышеперечисленного следует вывод, что данный метод
позволяет перейти к двухуровневому сигналу при незначительных потерях в
качестве звучания речи, сохраняя ее разборчивость.
55
3.2 Исследование возможности снижения разборчивости
клиппированной речи методом скремблирования
В основе данного исследования лежит гипотеза о возможности
обеспечения защиты информации при использовании метода клиппирования
речи.
Вычислительный эксперимент
Цель: проверка гипотезы о возможности обеспечения защиты
информации при использовании метода клиппирования речи.
План:
1) загрузить речевые фразы;
2) произвести процедуру децимации выбранного речевого сигнала до
заданного значения fd;
3)
выполнить
процедуру
модернизированного
порогового
шумоподавления с заданным порогом = 0,001;
4) выполнить операцию знакового кодирования сигнала;
5) произвести кодирование сигнала методом скремблирования с ПСП;
6)
дешифровать
закодированный
сигнал,
сравнить
его
с
клиппированным сигналом до скремблирования;
7) построить таблицы с соотношением оценки разборчивости и
качества полученных кодированных, дешифрованных и закодированных
клиппированных сигналов;
9) сравнить полученные результаты, сделать соответствующие выводы.
Исходные данные:
1) речевые сигналы, записанные с выбранной частотой дискретизации
fd=8 кГц, разрядностью кодовой последовательности 8 бит, моно;
2) количество экспертов для субъективной оценки качества сигналов
методом MOS – 5 человек.
56
Речевые данные записаны в идентичных условиях, в пределах одной
комнаты на одинаковой аппаратуре. Дополнительных побочный воздействий
на сигналы, кроме шумов аппаратуры, не производилось.
ПО для проведения эксперимента: программная среда National
Instruments LabView.
Выбранным способом шифрования клиппированной речи является
скремблирование с псевдослучайной последовательностью.
Словесное описание алгоритма проведения эксперимента
1) загрузить исходный речевой сигнал длительностью N;
2) выполнить процедуру децимации до заданного значения fd=8 кГц;
3) выполнить процедуру порогового шумоподавления положительной
полярности сигнала с заданным шагом i=0,003:0,003 до момента, когда
подавлению будет подлежать полезный сигнал. Отрицательная полярность
должна быть подавлена;
4) выполнить операцию знакового кодирования сигнала;
5) задать длительность генерируемой ПСП, равной длительности
кодируемого клиппированного сигнала;
6) произвести операцию скремблирования сигнала с ПСП;
7) дешифровать закодированный сигнал;
8) повторить эксперимент при следующем исходном сигнале. Загрузить
новый сигнал для исследования и повторить пункты 1-7;
9) конец.
Полученные речевые сигналы оценены пятью экспертами по модели
оценки качества речи MOS.
Модификация модели исследования клиппированой речи для
предоставления возможности защиты информации
В ходе проведения эксперимента в компьютерной модели был создан
генератор ПСП. Его функциональные возможности позволяют управлять
следующими
параметрами
генерируемой
последовательности, которые и показаны на рисунке 17:
псевдослучайной
57
Рисунок 17 – Функционал генератора ПСП
Модель
позволяет
выбирать
порядок
полинома,
функцию
инициализации внутреннего состояния, коэффициент изменения частоты
дискретизации для формируемой ПСП.
Результаты исследования:
а)
б)
в)
г)
Рисунок 18 – Эпюры сигналов:
а) исходный речевой сигнал; б) клиппированный речевой сигнал;
в) сигнал, зашифрованный методом скремблирования с ПСП;
г) восстановленный сигнал
В
результате
апробации
данного
алгоритма
шифрования
клиппированной речи была произведена оценка разборчивости полученных
сигналов.
В
таблице
11
приведено
соотношение
качества
звучания
и
разборчивости клиппированных сигналов до и после шифрования, а так же
дешифрованные
сигналы
с
соответствующими
им
субъективными
58
экспертными оценками MOS, характеризующими качество полученных при
обработке клиппированных сигналов.
Таблица 11 – Влияние скремблирования сигналов на разборчивость и
качество, оцененных по шкале MOS
Диктор
Д1
Клиппированный сигнал до
скремблирования, средняя
оценка MOS
3,6
Шифрованный
сигнал, средняя
оценка MOS
1
Д2
3,6
1
Как
видно
из
представленных
Дешифрованный
сигнал, средняя
оценка MOS
3,6
3,6
выше
эпюр
сигналов,
модернизированная модель позволяет скремблировать клиппированный
сигнал с ПСП.
Исходный речевой сигнал предоставлен на рисунке 18 а). Далее он
подвергается процедурам клиппирования и улучшению качества звучания
(полосовая фильтрация, шумоподавление), принимает форму сигнала,
показанную на рисунке 18 б).
Для того, чтобы сигнал можно было смешать с ПСП, необходимо
обеспечить
совпадение
размерностей
клиппированного
сигнала
с
размерностью генерируемой псевдослучайной последовательности. Это
достигается путем считывания длительности клиппированного сигнала, и
подачей данного значения на необходимый вход генератора ПСП.
Смешав клиппированную речь с ПСП, мы получаем полностью
неразборчивый сигнал, подобный белому шуму. Эпюра данного сигнала
показана
на
рисунке
18
в).
Восстановленный
(раскодированный)
клиппированный речевой сигнал предоставлен на рисунке 18 г).
Выводы:
При прослушивании зашифрованного сигнала невозможно уловить
информацию, сигнал невозможно отличить от белого шума.
59
Зная ключ, то есть образующий полином, данный сигнал можно
дешифровать на приемной стороне, вернув сигналу полную разборчивость.
Сигнал становится абсолютно таким же, как и до шифрования, что
подтверждается идентичностью эпюр, предоставленных на рисунках 18 б), 18
г).
Данное исследование подтверждает возможность обеспечения защиты
информации при использовании технологии клиппированной речи.
Этот результат имеет важное практическое значение, так как позволяет
применить данную технологию формирования и обработки клиппированной
речи в существующих цифровых закрытых системах передачи речи.
4. Найдены оптимальные параметры генератора ПСП при шифровании
информации методом скремблирования клиппированной речи с ПСП:
- Порядок полинома=31.
- Функцию инициализации внутреннего состояния= -1
- Коэффициент изменения частоты дискретизации = 1.
3.3 Описание технологии передачи цифровой клиппированной
речи по низкоскоростным каналам связи
В рамках диссертационного исследования в программной среде
LabVIEW была разработана компьютерная модель системы передачи
цифровой клиппированной речи, которая предоставлена на рисунке 19.
60
Рисунок 19 – Главное окно имитационной модели для исследования и
улучшения характеристик клиппированной речи
Данная модель состоит из 10 основных блоков:
1 - окно выбора исходного сигнала;
2 - окно для записи обработанного сигнала;
3 - блок передискретизации;
4 - блок полосового фильтра с динамическим ползунком для изменения
параметров;
5 - блок порогового шумоподавителя с динамическим ползунком для
изменения параметров;
6 - клиппер;
7 - блок воспроизведения исходного сообщения;
8 - блок воспроизведения обработанного сообщения;
9 – блок скремблирования клиппированной речи с ПСП, параметры
генератора псевдослучайной последовательности;
10 - эпюра исходного сигнала;
11 - эпюра клиппированного сигнала.
Функциональные возможности генератора псевдослучайных чисел
позволяют
управлять
следующими
параметрами
генерируемой
псевдослучайной последовательности, которые и показаны на рисунке 19
61
(блок 9): модель позволяет выбирать порядок полинома, функцию
инициализации внутреннего состояния, коэффициент изменения частоты
дискретизации для формируемой ПСП.
Описание технологии:
Исходный цифровой речевой сигнал открывается компьютерной
моделью при помощи блока (1). После получения моделью доступа к
исходному речевому сигналу, он подвергается процессу передискретизации в
блоке (3). Для выявления и удаления частот, не содержащих речевые данные
и
ограничения
уровня
внеполосных
шумов,
в
модели
применён
перестраиваемый полосовой фильтр (4). Для подавления шумов в паузах
речи в модели используется пороговый шумоподавитель (5), который должен
быть обязательно установлен до клиппирующего устройства (6), так как
после клиппирования сигнал примет значения только «0» и «1», и выявление
и
подавление
шумов будет
невозможным.
Клиппированный
сигнал
образуется после последующего предельного амплитудного ограничения (6).
В окне «результат» можно наблюдать эпюру выходного сигнала, как
исходного (10), так и обработанного клиппированного (11). Кроме этого, для
субъективной оценки качества звучания клиппированной речи, в данной
модели с помощью блоков (7) и (8) обеспечена возможность прослушивать
результаты влияния изменяемых параметров устройств обработки речи на её
звучание.
Для обеспечения защиты передаваемой речевой информации от
злоумышленников в компьютерной модели предусмотрена возможность
шифрования клиппированной речи (9). При помощи блока XOR ПСП
происходит скремблирование клиппированного сигнала с псевдослучайной
последовательностью. Параметры ГПСЧ можно перестраивать, используя
соответствующие блоки: Порядок полинома, Функция инициализации
внутреннего состояния, Коэффициент увеличения частоты дискретизации
ПСП. Для дешифрования полученного сигнала в модели предусмотрена
функция «восстановить сигнал с ПСП», предоставленная в блоке (9). Если на
62
приемной стороне известен образующий полином, то при помощи данного
блока представляется возможным раскрыть закодированную информацию.
Сравнивая исходный сигнал с выходным клиппированным речевым
сигналом можно судить о степени влияния изменяемых параметров
устройств формирования и обработки клиппированной речи. Это сравнение
является необходимым, так как оценка качества речи должна проводиться с
помощью экспертов «на слух». По окончании работы программа сохраняет
полученные в результате исследований аудиоданные в файле на ПК.
Созданные файлы могут быть прослушаны экспертами без применения
специализированного программного обеспечения.
Для
корректной
работы
данной
технологии
рекомендуется
использовать следующие параметры:
Таблица 12 — Рекомендуемые параметры основных функциональных блоков
модели клиппирования речи
Частота дискретизации, кГц
Уровень порогового шумоподавителя
8
0,001
Таблица 13 — Предложения по формированию ПСП
Порядок полинома
Функция инициализации
внутреннего состояния
Коэффициент изменения
частоты дискретизации
31
-1
1
63
ЗАКЛЮЧЕНИЕ
В данном диссертационном исследовании была разработана цифровая
технология передачи речи в низкоскоростных каналах связи на основе
использования метода клиппирования. Разработанная технология позволяет
осуществлять передачу речи не только в низкоскоростных каналах, БЦК, но и
открывает возможность передачи зашифрованной речи в закрытых каналах
связи.
Для осуществления цели данного диссертационного исследования были
выполнены следующие задачи:
1. Проведен анализ существующих методов снижения скорости
передачи речи.
2. Проведен анализ существующих методов и критериев оценки
качества звучания речи.
3. Разработка и описание модели в среде разработки NI LabVIEW.
4.
Исследовано
влияние
значения
частоты
дискретизации
на
разборчивость клиппированной речи.
5. Исследовано наличие эффекта элайзинга при клиппировании
цифрового речевого сигнала.
6. Исследована эффективность порогового шумоподавления в паузах
речи на разборчивость клиппированной речи.
7. Исследование влияния тембра голоса дикторов на разборчивость
клиппированной речи.
8. Разработан способ снижения скорости передачи клиппированной
речи на основе однополярного клиппирования речевого сигнала.
9.
Подтверждена
возможность
снижения
разборчивости
клиппированной речи методом скремблирования.
10. Описана технология передачи цифровой клиппированной речи по
низкоскоростным каналам связи.
64
11. Предложены рекомендации по выбору параметров основных
функциональных блоков созданной модели.
Для реализации цифровой технологии передачи речи в низкоскоростных
каналах связи была выбрана среда разработки и платформа для выполнения
программ LabVIEW, созданная на графическом языке программирования
«G» фирмы National Instruments.
В качестве передаваемых объектов по каналам связи были выбраны
клиппированные сигналы.
В помощь исследованию и разработке была использована программная
среда MatLab.
Результаты вычислительных экспериментов, полученные в ходе
диссертационного исследования доказывают, что:
- улучшение качества звучания клиппированной речи возможно при
соблюдении описанных в диссертации требований и рекомендаций;
- применение данной технологии осуществимо в современных каналах
связи, таких как: низкоскоростные КС, БЦК, закрытые КС, так как
соответствует необходимому критерию оценки качества речевых данных
MOS ≥ 3;
-
при
существенном
снижении
скорости
цифрового
потока
передаваемых клиппированных сигналов до 8 кБит/с разборчивость остается
неизменной;
- качество клиппированной речи не зависит от характеристик голоса
диктора, тем самым подтверждается универсальность применения данной
технологии.
65
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
1.
Козленко,
непрерывных
Н.И.
Помехоустойчивость
сообщений
[Текст]:
дискретной
монография.
–
передачи
Москва:
Изд-во
Радиотехника, 2003. – 352 с.
2.
Бухвинер,
В.Е.
Управляемое
компандирование
звуковых
сигналов [Текст]: монография. – Москва: Изд-во Связь, 1978. - 208 с.
3.
Методы и алгоритмы повышения качества звучания речи [Текст]:
учеб. пособие для науч. работников и студентов вузов / Е.Г. Жиляков [и др.].
- Белгород: Изд-во ООО «ГиК», 2012. – 117 с.
4.
Продеус, А.Н. Акустические информационные системы (АИС)
[Электронный
ресурс]
/
А.Н.
Продеус.
–
Режим
доступа:
http://aprodeus.narod.ru/. – Загл. с экрана. (Дата обращения: 15.05.2017)
5.
Жиляков, Е. Г. О сжатии речевых сигналов [Текст] / Е. Г.
Жиляков, С.П. Белов, Е.И. Прохоренко // Вестник НТУ ХПИ. - 2005. - №56. –
с. 32-40.
6.
Татарников, О. Как улучшить разборчивость речи? [Электронный
ресурс] / О. Татарников. – Режим доступа: http://www.compress.ru. – Загл. с
экрана. (Дата обращения: 5.04.2017)
7.
Прохоренко, Е.И. Цифровое кодирование клиппированной речи с
сохранением разборчивости и узнаваемости диктора [Текст] / Е.И.
Прохоренко, И.А. Сидоренко, А.В. Болдышев // Научные ведомости НИУ
БелГУ - 2008.
8.
основе
Прохоренко, Е.И. Цифровое кодирование речевых данных на
клиппирования
и
частотных
представлений
[Текст]
/
Е.И.
Прохоренко, И.А. Сидоренко, А.В. Болдышев // Вестник НТУ ХПИ - 2008.
9.
Слепов, Н.Н. Синхронные цифровые сети SDH
[Текст]:
монография. – Москва: Изд-во Связьиздат, 1997. – 150 с.
10.
Жиляков, Е. Г. Сжатие речевых данных как средство обеспечения
скрытности речевых сообщений [Текст] / Е.Г. Жиляков, Е.И. Прохоренко,
66
А.В. Болдышев, А.В. Эсауленко // Вестник НТУ ХПИ. - 2009. - №65. – с. 7583.
11.
Методы сжатия данных. Устройство архиваторов, сжатие
изображений и видео [Текст]: учеб. пособие для вузов / Д. Ватолин [и др.]. –
Москва: Изд-во Диалог – МИФИ, 2003. – 384 с.
12.
Сапожков, М.А. Речевой сигнал в кибернетике и связи [Текст]:
монография. – Москва: Изд-во Связьиздат, 1969. - 125 с.
13.
Калачев, К.Ф. В круге третьем [Текст]: монография. – Москва:
Изд-во Самиздат, 1999. – 320 с.
14.
Покровский, Н.Б. Расчет и измерение разборчивости речи
[Текст]: монография. – Москва: Изд-во Связьиздат, 1962. – 390 с.
15.
Передача речи по трактам связи. Методы оценки качества,
разборчивости и узнаваемости. Издание официальное. [Текст]: ГОСТ Р
50840-95 - 1997. – Введ. 1997-01-01. – М.: Госстандарт России, 1997. – 202 с.
16.
Большов, О.А. Пороговые значения при вокодерной связи
(ортогональный вокодер) [Текст] / О.А. Большов // Спецтехника и связь –
2011.
17.
Воробьев, В.И. Теория и практика вейвлет-преобразования
[Текст]: учеб. для вузов / В.И. Воробьев, В.Г. Грибунин. – М: ВУС. – 1999. –
204 с.
18.
Objelean, Nicolae. Машины, которые говорят и слушают [Текст]:
монография. – Кишинев: Изд-во Иститута Математики Академии наук
Молдовы, 1987. – 93 с.
19.
Сентябренко, Г.Н. Вокодер и цифровая технология [Электронный
ресурс] / Г.Н. Сентябренко. – Режим доступа: http://nexedge.com.ua. – Загл. с
экрана. (Дата обращения: 01.05.2017)
20.
Венедиктов, М.Д. Асинхронные адресные системы связи [Текст]:
учеб. для вузов / М.Д. Венедиктов, В.В. Макаров, Г.С. Эйдус. – М.: Связь –
М, 1968. – 231 с.
67
21.
Величкин, А.И. Теория дискретной передачи непрерывных
сообщений [Текст]: монография. – Москва: Изд-во Советское радио, 1970. 296 с.
22.
Сергеенко, В.С. Сжатие данных, речи, звука и изображений в
телекоммуникационных системах [Текст]: монография. – Москва: Изд-во
РадиоСофт, 2009. – 360 с.
23.
Сергиенко,
А.Б.
Цифровая
обработка
сигналов
[Текст]:
монография. – Санкт-Петербург: Изд-во БХВ-Петербург, 2002. – 603 с.
24.
Сэломон, Д. Сжатие данных, изображений и звука [Текст]:
монография. – Москва: Изд-во Техносфера, 2006. – 368 с.
25.
Chu Wai, C. Speech coding algorithms: Foundation and evolution of
standardized coders – Canada, 2003. – 578 p.
26.
Шелухин, О.И. Цифровая обработка и передача речи [Текст]:
учеб. для вузов / О.И. Шелухин, Н.Ф. Лукьянцев. – М: Радио и связь - М,
2000. – 456 с.
27.
Пирогов, А.А. Вокодерная телефония. Методы и проблемы
[Текст]: монография. – Москва: Изд-во Связь, 1974. – 246 с.
28.
Вологдин, Э.И. Аналоговая и цифровая звукозапись [Текст]:
учеб. для вузов / Э.И. Вологдин. – СПб.: СТ «Факультет ДВО» - СПб, 2004,
52 с.
29.
Вологдин, Э.И. Слух и восприятие звука [Текст]: учеб. для вузов
/ Э.И. Вологдин. – СПб.: СТ «Факультет ДВО» - СПб, 2004, 52 с.
30.
Пируновский,
Е.В.
Современные
технологии
сжатия
аудиосигнаов [Текст] / Е.В. Пируновский, А.А. Тропченко // Научнотехнический вестник Санкт-Петербургского государственного университета
информационных технологий, механики и оптики. – 2010. - № 1. – с. 65.
31.
Ковалгин, Ю.А. Цифровое кодирование звуковых сигналов
[Текст]: учеб. для вузов / Ю.А. Ковалгин, Э.И. Вологдин. – СПб: КОРОНАпринт – СПб, 2004. – 240 с.
68
32.
Оппенгейм, А.В. Цифровая обработка сигналов [Текст]: учеб. для
вузов / А.В. Оппенгейм, Р.В. Шафер. – М: Техносфера – М, 2012. – 1048 с.
33.
Солонина, А.И. Цифровая обработка сигналов. Моделирование в
Simulink [Текст]: учеб. для вузов / А.И. Солонина. – СПб: БХВ-Петербург –
СПб, 2012. – 432 с.
34.
Цифровая обработка сигналов и изображений [Текст]: учеб.
пособие для студентов вузов / М. Басараб [и др.]. – Москва: Изд-во
ФИЗМАТЛИТ, 2007. – 552 с.
35.
Лупов, С.Ю. LabVIEW в примерах и задачах [Текст]: учеб. для
вузов / С.Ю. Лупов, С.И. Муякшин, В.В. Шарков. – Н. Новгород.: ННГУ – Н.
Новгород, 2007. - 101 с.
36.
Тревис, Дж. LabVIEW для всех [Текст]: учеб. для вузов / Дж.
Тревис. - Москва: Изд-во ДМК Пресс, 2005. – 544 с.
37.
Климентьев, Е.К. Основы графического программирования в
среде LabVIEW [Текст]: учеб. пособие для вузов / Е.К. Климентьев. - Самара:
Изд-во Самар. гос. аэрокосм. ун-т, 2002. - 65 с.
38.
Учебный курс LabVIEW/ Основы I [Текст]: учеб. пособие для
вузов. / П.М. Михеев [и др.]. – Москва: Изд-во Международный учебнонаучный лазерный центр МГУ им. М.В. Ломоносова, 2007. – 365 с.
39.
Мещеряков, Р.В. Система оценки качества передаваемой речи
[Текст] / Р.В. Мещеряков // Доклады ТУСУРа. – 2010. - №2 (22). – с. 6.
40.
Гуревич, В.Э. Импульсно-кодовая модуляция в системах связи
[Текст]: учеб. для вузов / В.Э. Гуревич, Ю.Г. Лопушнян, Г.В. Рабинович. –
М.: Связь – М, 1973. – 336 с.
41.
Федосов, В.П. Цифровая обработка сигналов в LabVIEW [Текст]:
учеб. Пособие для вузов / В.П. Федосов. - Москва: Изд-во ДМК Пресс, 2007. 456 с.
42.
Ватолин, Д. Обзор методов сжатия данных [Электронный ресурс]
/ Д. Ватолин, А. Ратушняк, М. Смирнов, В. Юкин и др. – Режим доступа:
69
(Дата
http://www.compression.ru/arctest/descript/methods.htm.
обращения:
02.03.2017)
43.
Горьков, А. Методы сжатия данных [Электронный ресурс] / А.
Горьков. – Режим доступа: https://habrahabr.ru/post/251295/. - Загл. с экрана.
(Дата обращения: 18.02.2017)
44.
Голованов,
[Электронный
В.
ресурс]
Алгоритмы
/
https://habrahabr.ru/post/231177/.
В.
-
сжатия
Голованов.
Загл.
с
данных
–
экрана.
без
Режим
(Дата
потерь
доступа:
обращения:
13.05.2017)
45.
Брауде-Золотарев, Ю. Сжатие речи [Электронный ресурс] / Ю.
Брауде-Золотарев. – Режим доступа: http://old.computerra.ru/1999/293/196258/.
- Загл. с экрана. (Дата обращения: 20.03.2017)
46.
Бабкин, В.В. Вокодер 600 Бит/с [Текст] / В.В. Бабкин // 9-я Межд.
Конф. и Выставка Цифровая обработка сигналов и ее применение (DSPA2007). - 2007. - №9. – с. 1-4.
47.
Кэтермоул, К.В. Принципы импульсно-кодовой модуляции
[Текст]: монография. – Москва: Изд-во Связь, 1974. – 408 с.
48.
Лифшиц, А.Р. Многоканальные асинхронные системы передачи
информации [Текст]: монография / А.Р. Лифшиц, А.П. Биленко. – М: Связь –
М, 1974. – 224 с.
49.
Козленко,
Н.И.
Помехоустойчивость
импульсно-кодовой
модуляции при передаче речи [Текст] / Н.И. Козленко // Радиотехника. –
1972. - №2. – том 27.
50.
Козленко, Н.И. Помехоустойчивость клиппированной речи с
переменным порогом ограничения [Текст] / Н.И. Козленко // Вопросы
радиотехники. Техника радиосвязи. – 1972. - № 4. – с. 25-27.
51.
Петрович, Н.Т. Передача клиппированных речевых сигналов с
помощью фазовой телеграфии [Текст] / Н.Т. Петрович, Н.И. Козленко //
Радиотехника. – 1964. - №11. – с. 14.
70
52.
Козленко, Н.И. Помехоустойчивость фазовой телеграфии при
передаче клиппированных речевых сигналов [Текст] / Н.И. Козленко //
Электросвязь. – 1965. - №3. – с.5-7.
53.
Козленко, Н.И. Помехоустойчивость передачи клиппированных
речевых сигналов методом фазовой телеграфии [Текст] / Н.И. Козленко //
Электросвязь. – 1965. - №6. – с. 15-17.
54.
Козленко, Н.И. Дискретная передача клиппированной речи и ее
огибающей [Текст] / Н.И. Козленко, Е.А. Кузьмин // Сборник трудов ВПИ
Генерирование и усиление колебаний. – 1972. - №5. – с. 32-33.
55.
Покровский, Н.Б. Расчет и измерение разборчивости речи
[Текст]: монография. – Москва: Изд-во Гос. изд-во лит. по вопросам связи и
радио, 1962. – 391 с.
56.
Козленко, Н.И. Помехоустойчивость клиппированных речевых
сигналов при действии импульсной помехи в канале связи [Текст] / Н.И.
Козленко, В.К. Волков // Электросвязь. – 1964. - №12. – с. 58-60.
57.
Быков, Ю.С. Теория разборчивости и повышение эффективности
радиотелефонной
связи
[Текст]:
монография.
–
Москва:
Изд-во
Госэнергоиздат, 1959. - 350 с.
58.
Козленко, Н.И. Исследование артикуляционных характеристик
экстремально-кодированной речи при двухполосной фильтрации [Текст] /
Н.И. Козленко, Р.Н. Рыжкова // Акустический журнал Академии наук. – 1974.
- №1. – с. 95-96.
59.
Козленко,
Н.И.
Помехоустойчивость
дискретной
передачи
ограниченной речи [Текст] / Н.И. Козленко // Вопросы электроники. Техника
радиосвязи. – 1971. - №7. – с. 55-57.
60.
Сергеев, С.И. Классификация методов защиты информации
[Электронный
ресурс]
/
С.И.
Сергеев.
–
Режим
http://camafon.ru/informatsionnaya-bezopasnost/metodyi-zashhityi.
экрана. (Дата обращения: 17.04.2017)
доступа:
–
Загл.
с
Отзывы:
Авторизуйтесь, чтобы оставить отзыв