Сохрани и опубликуйсвоё исследование
О проекте | Cоглашение | Партнёры
Выпускная квалификационная работа студентки 11.03.02. Инфокоммуникационные технологии системы связи
Источник: Белгородский государственный университет - национальный исследовательский университет (НИУ «БелГУ»)
Комментировать 0
Рецензировать 0
Скачать - 2,5 МБ
Enter the password to open this PDF file:
-
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ «БЕЛГОРОДСКИЙ ГОСУДАРСТВЕННЫЙ НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ» ( Н И У « Б е л Г У » ) ИНСТИТУТ ИНЖЕНЕРНЫХ ТЕХНОЛОГИЙ И ЕСТЕСТВЕННЫХ НАУК Кафедра информационно-телекоммуникационных систем и технологий РАЗРАБОТКА АЛГОРИТМА СКРЫТНОЙ ПЕРЕДАЧИ РЕЧЕВОГО СИГНАЛА Выпускная квалификационная работа студентки очной формы обучения направления подготовки 11.03.02 Инфокоммуникационные технологии и системы связи 4 курса группы 07001208 Бака Яны Витальевны Научный руководитель ст. преп. кафедры Информационнотелекоммуникационных систем и технологий НИУ «БелГУ» Лихолоб П.Г. Рецензент к.ф.-м.н., начальник отдела ОСС АО «НПП «Спец-Радио»», Туяков С.В. БЕЛГОРОД 2016
СОДЕРЖАНИЕ ВВЕДЕНИЕ………………………………………………….…………………….4 1. ПРЕДСТАВЛЕНИЕ РЕЧЕВОГО СИГНАЛА…………………..………….6 1.1 Способы представления речи для скрытной передачи информации……………………………………………………………..………...6 1.2 Элементы анализа и синтеза сигналов………………………………...…..8 1.3 Векторное представление речевого сигнала…………………………......13 2. МЕТОДЫ СКРЫТНОЙ ПЕРЕДАЧИ ИНФОРМАЦИИ………..………..22 2.1 Анализ метода расширения спектра………………………………………24 2.2 Анализ модифицированного метода расширения спектра и алгоритмов его реализующих…………………………………………...……………………30 3. ОЦЕНКА СКРЫТНОСТИ РЕЧЕВОГО СООБЩЕНИЯ…………………41 3.1 Качественная оценка искажений, вызываемых кодированием сообщения в речевых данных………………………………………………………………..41 3.2 Количественная оценка искажений, вызываемых кодированием сообщения в речевых данных……………………………………………..……52 4. ЭКОНОМИЧЕСКОЕ ОБОСНОВАНИЕ РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЯ………………………………………………………………55 4.1 Планирование работ по исследованию………………………………….55 4.2 Расчет расходов на оплату труда………………………………………...58 4.3 Расчет продолжительности исследования………………………………60 4.4 Расчет стоимости расходных материалов……………………………….61 4.5 Расчет сметы расходов на исследование………………………………...61 ЗАКЛЮЧЕНИЕ………………………………………………………………….65 СПИСОК ИСПОЛЬЗУЕМЫХ ИСТОЧНИКОВ……………………………….67 Изм. Лист Разраб. Провер. Рецензент Н. контр. Утв. № докум. Бака Я.В. Лихолоб П.Г. Туяков С.В. Лихолоб П.Г. Жиляков Е.Г. Подпись Дата 11070006.11.03.02.093.ПЗВКР Разработка алгоритма скрытной передачи речевого сигнала Лит. Лист Листов 2 89 НИУ «БелГУ», гр. 07001208
ПРИЛОЖЕНИЕ А………………………………………………………………72 ПРИЛОЖЕНИЕ Б……………………………………………………………….75 Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 3
ВВЕДЕНИЕ Для крупных коммерческих и корпоративных структур существует необходимость осуществлять защищенный обмен данными представляющими коммерческую тайну. Использование стеганографических методов скрытия факта передачи информации[26] позволяет осуществить не только защиту коммерческой информации, но и в частности, позволяет скрыть косвенные признаки факта осуществления переговоров. Наиболее часто для передачи информационных сообщений не содержащей чисел используют устную речь. Использование устной речи как средства коммуникации вызвано так же простотой её восприятия человеком. Далее речевое сообщение, скрытно передаваемая информация, зарегистрированная в виде речевого сигнала и преобразованная в цифровую форму. Стоит отметить, что зачастую ресурсы для скрытной передачи речевых сообщений, методами стеганографии ограничены. Вызвано это тем, что для скрытия защищаемого речевого сообщения необходимо использовать данные, объем которых в несколько раз должен превышать объем защищаемого речевого сообщения. Поэтому количество методов и алгоритмов, которые возможно использовать для целей скрытной передачи речевых сообщений не велико [22, 25, 26]. Разработка метода и алгоритма реализующих принципы скрытной передачи речевого сообщения в речевых данных, может позволить повысить оперативность скрытного обмена речевыми сообщениями, за счет более эффективного использования скрытности и емкости речевого материала. Под эффективностью в работе понимается, использование подхода для кодирования речевого сообщения с обеспечением его скрытности, позволяющего увеличить объём передаваемых речевых сообщений без необходимости увеличения объема речевого материала [27,28]. Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 4
Целью работы является развитие методов скрытого внедрения информации в звуковые файлы посредством разработки нового алгоритма скрытной передачи информации. Для успешного выполнения поставленной цели необходимо выполнить ряд задач, а именно: 1. Разработать алгоритм скрытного кодирования/декодирования речевого сообщения в речевые данные. 2. Проанализировать отобранный речевой материал и выбрать наиболее оптимальный сигнал для скрытия в него информационного сообщения. 3. Провести качественную оценку скрытности передаваемого речевого сообщения. 4. Провести количественную оценку скрытности передаваемого речевого сообщения. 5. Разработать программную поддержку алгоритмов стеганографического кодирования речевого сообщения в речевые данные и их декодирования. 6. Выполнить экономическое обоснование результатов исследования. Иными словами, необходимо выявить закономерности изменения качества звучания и восприятия искажений при скрытном кодировании информации модифицированным методом расширения спектра. Пояснительная записка к дипломной работе состоит из 89 стр., включает в себя 4 раздела и 2 приложения, 30 рисунков, 9 таблиц, использовано 27 литературных источников. Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 5
1 ПРЕДСТАВЛЕНИЕ РЕЧЕВОГО СИГНАЛА 1.1 Способы представление речи для скрытной передачи информации Направление информационных технологий невозможно представить и реализовать без коммуникаций. Передача информация является важным компонентом любой системы, выполняющей какую-либо работу с данными (хранение, обработка, преобразование). В данном случае, под информацией понимается совокупность каких-либо сведений, данных, которые, в свою очередь, должны Стандарты, быть достоверны, разработанные полны, специалистами в актуальны, области информативны. связи позволяют передавать данные различного типа. Таким образом, в канале связи имеется возможность передавать неподвижные и подвижные изображения, пакетные сообщения, данные и речевые сигналы. Стоит отметить, что именно работа с речевым материалом как сигналом, который необходимо передать является актуальным и стремительно развивающимся направлением информационно – телекоммуникационных систем связи, а именно областей аналоговой телефонии, сотовой и спутниковой связи. Речь, по своей природе, является инструментом общения, взаимодействия, т. е. коммуникации. Как правило, при коммуникации речь изначально формируется в мозге человека в виде абстрактного представления, после чего преобразуется в последовательность нервных импульсов, управляющих артикулярным аппаратом, который, в свою очередь, приходит в движение и формирует речевое сигнал с учётом интонации и дикции человека. В сфере телекоммуникаций речевой сигнал целесообразно представлять как акустическое колебание, подверженное распространению в упругой среде. Сообщение, передаваемое посредством речевого сигнала, может быть представлено конечной последовательностью фонем – звуковых символов, составляющих данный речевой сигнал, следовательно, данное сообщение дискретно. В русском языке 41 фонема. Для обозначения и передачи звуков Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 6
используют символы – буквы, которые подразделяются на гласные, воспроизводимые только голосом и согласные, которые, в свою очередь разделяются по способу порождения их голосовым аппаратом. Таким образом, среди согласных звуков различают следующие основные типы: Взрывные согласные: [п], [п'], [б], [б'], [т], [т'], [д], [д'], [к], [к'], [г], [г']; Фрикативные согласные: [ф], [ф'], [в], [в'], [с], [с'], [з], [з'], [ш], [ш':], [ж], [ж':], [х], [х']; Сонорные согласные: [р], [р']. По мере изменения формы артикулярного аппарата диктора, в формируемом речевом сигнале возникают усиленные резонатором частотные характеристики, называемые формантами. При взаимодействии двух или более дикторов акустический сигнал, представленный речью, преобразуется в механическое колебание, соприкасаясь с ушной барабанной перепонкой. Далее, во внутреннем ухе , сигнал является уже импульсом нервной системы. В центральном отделе нервной системы данный сигнал идентифицируется, т. е. исходное речевое сообщение воссоздается с определенной корреляцией в зависимости от индивидуальных особенностей произношения диктора или же меры воздействия внешних шумов. В настоящее время используется множество способов передачи, преобразования и хранения речевого сигнала. При использования технических средств необходимо преобразовывать форму представления данного сигнала. Поэтому существуют некоторые особенности, которые необходимо учесть: Сохранение информационной составляющей речевого сигнала; Представление речевого сигнала в форме, удобной для его обработки, хранения, передачи; Возможность преобразовывать сигнал без серьезных информационных потерь; Легкое восприятие информации техническими (машинными) средствами или человеком при прослушивании. Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 7
1.2 Элементы анализа и синтеза сигналов Для того, чтобы исследовать методы цифровой обработки сигналов, необходимо начать с того, что речевой сигнал как сформированное в голосовом тракте акустическое колебание имеет аналоговую природу, т. е. его можно рассмотреть как непрерывно изменяющийся во времени процесс. Математически такой сигнал можно обозначить как xn (t). Данный сигнал может быть представлен в виде последовательности x(n) чисел, которая является последовательностью мгновенных значений сигнала xn (t), периодически взятых через равные промежутки времени T. Эта операция описывает процесс дискретизации речевого сигнала xa(t), её можно обозначить как xn (T). На рисунке 1.1 Представлен дискретный сигнал: Рисунок 1.1 – Дискретный сигнал Дискретный сигнал характеризуется длительностью, частотой дискретизации. Длительность сигнала – временной интервал существования данного сигнала. Длительность, как правило, определяется в секундах, если речь идет о непрерывном сигнале, либо в отсчетах, представляющий собой значение амплитуды в данный момент времени. Частота дискретизации – величина, показывающая меру частоты взятия отсчетов аналогового сигнала при его дискретизации. Интервал T есть период дискретизации, следовательно, частота дискретизации – величина, обратная периоду дискретизации: Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 8
fd 1 , T (1.1) где Т – период дискретизации, с. Формула (1.2) описывает цифровой сигнал как совокупность значений n-х отсчетов: T x x1 ,.., xn ,.., x N (1.2) где x - отрезок речевого сигнала; T - знак транспонирования обозначает, что данные представлены в виде столбца. Сигнал, подверженный дискретизации во времени и квантованию по уровню называется цифровым. Данный сигнал можно описать квантованной последовательностью xun(T), отсчеты которой принимают значения уровней квантования в каждый момент времени T. Также необходимо упомянуть теорему Котельникова, согласно которой, исходный сигнал возможно однозначно восстановить, если частота дискретизации будет как минимум в два раза превышать верхнюю частоту, (наибольшую в спектре сигнала). Иными словами, аналоговый сигнал, имеющий ограниченный спектр полностью определяется последовательностью своих отсчетов, взятых с интервалом: T 1 , 2 fв (1.3) где fв – верхняя частота конечного спектра, Гц Под спектром сигнала подразумевается распределение энергии сигнала по его частоте. При увеличении частоты дискретизации, увеличивается спектр дискретного сигнала. Также, следует обозначить величину, равную половине частоты дискретизации и называемую Частотой Найквиста. Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 9
Дискретные сигналы следует рассматривать в области диапазона частот: основного 0; f d / 2 . Таким образом, можно ввести понятие нормированной круговой частоты: 2 2 f , T (1.4) где - круговая частота, нормированная к π, Гц. Также следует ввести понятие единичного отсчета, равного одному единичному импульсу и определяемому следующим образом: 1, n 0 . 0, n 0 n (1.1) При этом, последовательность единичного скачка представлена в виде: 1, n 0; u n 0, n 0. (1.6) При анализе сигнала целесообразно раскладывать его на синусоидальные составляющие (гармоники). Данные синусойды проходят через линейные системы не изменяя при этом своей формы (изменяются при этом амплитуда либо фаза). Таким образом, можно показать, что синусоиды являются «собственными функциями» линейных систем. Преобразование Фурье (FFT) [19, 23]– это метод анализа сигналов основанный на разложении функций на синусные и косинусные составляющие, описываемое выражением: x e jt x(t ) e jt , n 0 (1.7) где xt - вещественная или же комплексная функция – оригинал; X j - Фурье – образ функции; xt - результат Фурье – преобразования. Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 10
Сигнал может быть представлен в амплитудно – временной и амплитудно – частотной областях, и в зависимости от того, каким образом необходимо использовать реализацию, применяют Прямое и обратное преобразования Фурье [19, 25]. Прямое преобразование определяется формулой: X j xt e jt dt . (1.8) 0 Обратное преобразование Фурье определяется следующим образом: X j xt e jt dt , (1.9) 0 xt 1 2 X j e jt d , (1.10) где xt - вещественная или же комплексная функция – оригинал; X j - Фурье – образ функции; xt - результат Фурье – преобразования. Наиболее широкое применение среди спектральных преобразований дискретных сигналов конечной длительности, содержащих N отсчетов получило Дискретное преобразование Фурье [20, 282] с использованием базисных функций, количество отсчетов которых совпадает с количеством отчетов исследуемого сигнала. Базисную систему в данном преобразовании составляют ортогональные дискретные экспоненциальные функции: k nT e jknT e 2 k n N WN k n , (1.11) где n – номер отсчета дискретного сигнала; n=[0; N-1]; k – номер спектральной составляющей дискретного сигнала k=[0; N-1]; где Wn - поворачивающий множитель ДПФ. Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 11
2 Wn= e j N , (1.12) 2 , N T (1.13) где - основная частота ДПФ. Положим, дискретный сигнал является периодическим: xnT xn m N T ; m=0, 1, 2…. (1.14) Для перехода сигнала из временной области в спектральную используется прямое дискретное преобразование Фурье ПДПФ [20, 285]: N 1 X jk x n T e n 0 Последовательность j 2 k n N N 1 N 1 n 0 n 0 x n T W Nk n x n T e jknT . X jk (1.15) является периодической (период в N отсчетов): X jk X jk l N . l=1, 2, … (1.16) Частота дискретизации комплексного спектра X jk : д N . (1.17) Для осуществления обратной процедуры – перехода сигнала из спектральной области во временную применяется обратное дискретное преобразование Фурье ОДПФ [20, 286]: Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 12
1 xnT N N 1 X jk e j 2 k n N k 0 1 N N 1 X jk WNk n k 0 1 N N 1 X jk e jknT . (1.18) k 0 Данное выражение можно пояснить следующим образом: периодический сигнал x n T с периодом в N отсчетов можно представить в виде суммы N соответствующих комплексных дискретных экспонент, действительные части которых представляют собой косинусойды | X 0 |, | X j 1 |, | X j 2 |,... | X j N 1 | , с амплитудами угловыми частотами 0, ,2, N 1 и начальными фазами arg X 0, arg X j 1 ... arg X j N 1 . 1.3 Векторное представление речевого сигнала Для обработки, преобразования речевого сигнала применяются различные технические области программирования. Учитывая тот факт, что программный код способен воспринять речевой сигнал в виде массива мнгновенных значений сигнала определенной длительности, необходимо рассмотреть сигнал как вектор некоторого бесконечного пространства Любaя coвoкупнoсть n линейно независимых векторов n – мерного пространства, в котором каждый вектор eдинственным oбразом мoжет быть прeдставлeн в виде линeйнoй кoмбинации вектoрoв даннoй совoкупнoсти нaзывaется его базисом. [Рыжиков Ю.И. «Вычислительные методы»] Гильбертово пространство – нормированное векторное пространство, бесконечномерное Евклидово пространство. Пространство также можно назвать метрическим, если в его области существует метрика – расстояние между элементами пространства (векторами). Важную роль среди линейных метрических пространств играют нормированные пространства, в которых каждому вектору S (t ) соответствует его длина, т. е. норма S . Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 13
Норма для вещественных аналоговых сигналов: S s t dt . 2 (1.19) Норма для комплексных сигналов: S st s t dt * (1.20) Энергия сигнала есть квадрат его нормы. Данная величина определяется выражением: ES S 2 s 2 t dt (1.21) Взаимная энергия двух сигналов S i и S j определяется их скалярным произведением: Eij 2 si s j dt (1.22) причем, если равенство (1.22) принимает значение 0, т. е. сигналы обладают нулевой взаимной энергией, то они являются ортогональными. Если в пространстве сигналов c конечной энергией существует бесконечное множество взаимоортогональных функций i , норма которых равна 1, базис является ортонормированным. Классической системой ортонормированных кусочно – постоянных функций меандрового типа, определенных на интервале [0,1] является система функций Хаара [6, 1]. Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 14
При спектральной обработке сигнала удoбнo использовать ненормированный базис Хаара ввиду отсутствия многозначности функций. В данном случае, значения элементов базиса будут соответствовать 0, либо же ±1. Ортогональность данного базиса доказывает выражение: 1 h(k , z )h( p, z )dz 0 (1.23) o при k≠p. h(k,z) – функции базиса Хаара. На рисунке 2 представлен базис Хаара из восьми функций: h(0,z) h(4,z) +1 +1 0 0 1/8 1/4 3/8 1/2 5/8 3/4 7/8 1 z 1/8 1/4 3/8 1/2 5/8 3/4 7/8 1 z -1 h(1,z) h(5,z) +1 +1 0 0 1z 1 z -1 -1 h(6,z) h(2,z) +1 +1 0 0 1 z 1 z -1 -1 h(3,z) h(7,z) +1 +1 0 1z -1 0 1z -1 Рисунок 1.2 – Система функций Хаара для N=8 Однако система функций Хаара является не оптимальной для кодирования информации по причине недостаточной простоты функций – т. е. конечности набора значений. Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 15
В данном случае, преимуществом обладает Система Радемахера, построенная на основе системы Хаара методом сложения и нормировки функций Хаара, имеющих идентичный нижний индекс. Функция Радемахера с номером k определяется: Rk sign sin 2 k t , t 0,1 (1.24) причем для знака аргумента выполняется условие: 1, x 0; sign( x) 1, x 0 (1.25) Итак, функция определена на отрезке от 0 до 1. Функция R0 (k=0) является постулированной, поскольку она равна 1 на всей области определения. Последующая функция R1 (k=1) определяется по формуле (1.26): R1 sign sin 21 t sin 2 t , t 0,1 (1.26) За время, когда t изменяется от 0 до 1, аргумент синуса меняется от 0 до 2π, то есть преодолевает всю окружность(Рисунок 1.3). Рисунок 1.2 – Окружность синусоидальной функции Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 16
Учитывая, что выше Ох значения функции синус положительные, а ниже – отрицательные, формируется функция Радемахера, в которой первая половина принадлежит +1, а вторая -1(Рисунок 1.4): Рисунок 1.4 – Нулевая и первая функции Радемахера На рисунке 1.5 представлены первые 4 функции Радемахера: Рисунок 1.3 – Функции Радемахера Видно, что по мере увеличение номера функции, увеличивается количество меандровых волн, принадлежащих отрезку [0, 1]. Иными словами, Чем больше индекс рассматриваемой функции, тем более детально просматриваются особенности построения некоторой функции в базисе, составленном из данных функций. Очевидно, что все эти функции Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 17
взаимоортогональны, поскольку, если взять скалярное произведение любых двух функций из данного базиса, то в результате взятия интеграла получится одинаковое количество +1 и -1, которые скомпенсируют друг друга. C помощью функций Радемахера можно построить ортонормированную систему Уолша. Система Уолша – система взаимоортогональных ортонормированных функций, принимающих значения ±1 в области T T : . 2 2 Свойства ортогональности позволяют осуществлять оптимальное кодирование в речевом сигнале. Базис Уолша обладает свойствами ортогональности и мультипликативности: 1) Ортогональность: wal (n, ) wal (k , ) 0 , k n 2) Мультипликативность: wal (n, ) wal (k , ) wal (i, ), где i n k . Данная система определяется формулой: waln t Rn 1 (t ) Rn1 (t ) ... Rk 1 (t ), t 0,1 (1.26) где Rn1 (t ) , [i=1,k] – функции системы Радемахера. Попарную ортогональность функций системы Уолша в Гильбертовом пространстве можно доказать следующим образом. Положим, используются различные номера n и l, причем: n 2 v1 2 v 2 ... 2 vp ,0 v1 v2 ... v p ; l 21 2 2 ... 2q ,0 1 2 ... q . (1.27) Склалярное произведение находится следующим образом: 1 1 0 0 ( wn , wl ) wn ( x) wl ( x)dx (rv11 ( x)...rvp 1 ( x)) (r11 ( x)...rq 1 ( x))dx (1.28) где x [0,1] , rv – функция Радемахера. Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 18
Из произведения (rv11 ( x)...rvp 1 ( x)) (r11 ( x)...rq1 ( x)) в подынтегральном выражении необходимо удалить пары с одинаковым индексом: (rv11 ( x)...rvp 1 ( x)) (r11 ( x)...rq1 ( x)) r j1 ( x)r j 2 ...r jk ( x), (1.29) где 1 j1 j 2 ... j k (равенство выполняется почти всюду на отрезке [0,1]. Согласно определению системы Радемахера, произведение функций с меньшими индексами rj1(x)rj2(x)…rjk-1(x) это кусочно – постоянная функция, элементы которой равны +1 и -1, а каждый интервал постоянства Ei=(ai,bi) разбивается функцией rjk(x) с более высоким индексом на четное количество интервалов равной длины, причем функция попеременно принимает значения +1 и -1 . Поэтому для любого интервала Ei=(ai,bi) постоянства функции rj1(x)rj2(x)…rjk-1(x), получается: (r j1 ( x)r j 2 ( x)...r jk 1 ( x))r jk ( x)dx 1 r jk ( x)dx 0 . Ei Ei (1.30) В результате, просуммировав эти равенства по всем интервалам постоянства, получается: 1 r j1 ( x)r j 2 ( x)...r jk ( x)dx (r j1 ( x)r j 2 ( x)...r jk 1 ( x))r jk ( x)dx 0. i 0 (1.31) Ei Из равенства следует, что для всех n l : 1 1 0 0 ( waln , wall ) waln ( x) wall ( x)dx r j1 ( x)r j 2 ( x)...r jk ( x)dx 0 . (1.32) Исходя из того, что квадрат любой функции Радемахера равен 1 почти всюду на отрезке [0,1]: Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 19
waln2 ( x) rv211 ( x)rv221 ( x) (1.33) rvp2 1 ( x) 1 значит для всех n=0, 1, 2…норма: 1 || waln || wal 2 n ( x)dx 1. (1.34) 0 Итак, система функций Уолша waln ( x) [0, ) является ортонормированным базисом на отрезке [0,1], а система Радемахера есть подмножество системы Уолша. В процессе исследования всреде Matlab был сформирован ортогональный базис u n , но необходимо убедиться, что его элементы не искажены, для этого необходимо задать взаимопротивоположные гипотезы и осуществить проверку. Гипотеза H0 – базис u n ортогонален; Альтернативная гипотеза H1 - базис u n не ортогонален. На данном этапе необходимо проверить гипотезу H0. Ортогональность данного базиса наблюдается в особенности его построения. В этом можно убедиться, проверив аналитически условие ортогональности для каждой пары вектор – столбцов данного базиса. В данном случае, матрицу u n составляет набор из 9 функций (9 вектор – столбцов): u1 , u1 , u2 , u2 ... u9 , u9 . Предлагается попарно выделять элементы базиса и находить их скалярное произведение. Таким образом, если скалярное произведение всех векторных пар будет равно машинному нулю, ортогональность базиса с использованием основного условия данного критерия будет доказана. При этом, необходимо учитывать некоторые свойства, ввиду которых, не все пары будут включены в расчет. Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 20
Во – первых, используя свойство скалярного произведение вектора самого на себя, при котором результат может быть не только равен 1, но и быть больше на величину , необходимо исключить пары, имеющие одинаковый индекс номера: ui , ui ui где ui - энергия функции, 2 2 1 , (1.35) - величина сдвига. Во – вторых, используя свойство коммуникативности, при котором, от перестановки множителей результат один и тот же, следует исключить пары с идентичными индексами противоположных элементов: ui , u j u j , ui (1.36) Таким образом, зная понятия и свойства наиболее оптимальных с точки зрения обработки сигналов базисов, можно выбрать наиболее оптимальную систему для кодирования информационного сообщения в речевой сигнал. Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 21
2 МЕТОДЫ СКРЫТНОЙ ПЕРЕДАЧИ ИНФОРМАЦИИ Современные возможности сферы цифровой обработки сигналов позволяют не только производить качественную и количественную оценку аудиоконтента , но и рассмотреть его как среду для скрытия и шифрования в нём каких либо данных. Эти процессы детально отражены во взаимодействующих науках: криптография и стеганография. Криптография информации за – это наука, изучающая счет её шифрования с процесс целью её преобразования сокрытия от несанкционированного доступа злоумышленника (криптоаналитика) и других неавторизованных лиц. Сам факт скрытия информации ещё не является полноценным гарантом её защиты, поскольку он дает понять злоумышленнику, что в передаваемом сообщении содержатся данные, имеющие какую-либо ценность. Для решения данной проблемы существует понятие стеганографии: Стеганография – наука, изучающая методы скрытия самого факта наличия секретных данных при их передаче, обработке и хранении. Существует три основных направления применения стеганографии: 1. Скрытие факта передачи информации; 2. Скрытие самой информации при её передаче; 3. Аутентификация пользователя. Скрытная передача информации заключается в проблеме, при получении информации криптоаналитиком [22], человеком, который осуществляет попытки несанкционированного доступа к передаваемой информации. Для осуществления кодирования, обеспечивающего скрытность передачи информации, необходимо воспользоваться одним из методов цифровой стеганографии[5]. В различных источниках [3, 5, 10] данное понятие стеганографического кодирования трактуется как процесс, при котором в одни битовые последовательности, имеющие аналоговую природу, надежно и незаметно встраиваются другие последовательности бит. Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 22
Существуют различные способы применения цифровой стеганографии: Встраивание информации с целью ее скрытой передачи; Внедрение ЦВЗ (ЦВЗ – цифровой знак); Внедрение заголовков; Внедрение идентификационных номеров. Алгоритмы внедрения секретной информации также можно следующие группы: алгоритмы, работающие непосредственно с цифровым сигналом (например, метод LSB); наложение скрытой информации (текстовой или мультимедийной) поверх оригинала. (актуален при внедрении ЦВЗ); использование особенностей форматов файлов. Для стеганографического кодирования речевых данных наиболее приемлемы следующие методы: Метод наименьшего значащего бита (LSB - Least Significant Bit). Основная идея: произвести замену последних значащих бит в контейнере речевого сигнала на биты скрываемого сообщения. Недостаток данного метода заключается в ограниченной устойчивости к различным видам атак, а значит, данные методы разумно реализовывать лишь при отсутствии шума в канале связи. Эхо-методы. Основная идея реализуется с использованем эхо-сигналов, которым соответствует свое значение задержки, начальной амплитуды и степени затухания. Чтобы закодировать битовую последовательность, необходимо задействовать интервалы между эхо-сигналами. В свою очередь, интервалы не равномерны. Чтобы сделать искажения, вызванные кодированием незаметными для слуховой системы, необходимо установить некоторый порог слияния эхо и сигнала. Преимуществом метода является стойкость к атакам, взаимодействующим с фазой и амплитудой. Недостатком является возможная недостоверность считываемости, т. е. ошибочное принятие 0 за 1 и наоборот. Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 23
Суть фазового кодирования заключается в том, чтобы заменить исходный звуковой элемент на скрытое сообщение, в качестве которого выступает относительная фаза. Это один из наиболее эффективных методов цифровой стеганографии. Сетевая стеганография. Метод основан на том, что стегоконтейнером являютя протоколы модели OSI (взаимодействия открытых систем). Информация передается по скрытому каналу, при этом изменяется структура передачи пакета в сетевом протоколе. Типичный пример сетевой стеганографии основан на изменении свойств одного из сетевых протоколов, а также использование взаимосвязи между двумя или более различными протоколами для улучшения надежности секретности передачи сообщения. Метод расширенного спектра. Основная идея заключается во внедрении в контейнер случайной последовательности, а затем процесс её детектирования с помощью согласованного фильтра. Таким образом, в контейнер можно встраивать несколько сообщений так, что они не будут создавать друг другу помех. Проанализировав все перечисленные методы, было выявлено, что эхо методы и методы фазового кодирования не подходят для проведения эксперимента по причине малой ёмкости и недостаточной стойкости эхо – сигнала. Использование метода расширения спектра позволяет скрывать и передавать информацию не по биту, а в виде потока данных, следовательно, этот метод весьма оптимален для выполнения эксперимента. 2.1 Анализ метода расширения спектра Наиболее эффективным способом защита аудиоконтента от несанкционированного доступа является встраивание в сигнал специальной цифровой метки, которую нельзя идентифицировать без специального ключа Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 24
либо программного обеспечения. Данная метка называется цифровым водяным знаком (ЦВЗ). Алгоритмы, применяемые для аудиосигналов, реализуются и функционируют с учетом некоторых свойств слухового аппарата и самого звукового сигнала. Слуховая система человека функционирует в широком динамическом диапазоне, поэтому, помимо информативных данных, слушатель проявляет высокую чувствительность к аддитивному флотационному шуму, иными словами, к белому шуму. Несмотря на способность слышать и распознавать звуки широкого динамического диапазона, система слуха характеризуется достаточно малым разностным диапазоном. Ввиду этого, звуки, произнесенные с большей громкостью маскируют наименее слышимые. Метод расширения спектра функционирует во временной области сигнала и используется для шифрования информационного потока. Скрываемые данные при этом оказываются рассредоточенными в пределах всего спектра частот. Таким образом, в случае воздействия помех сигнал всё-равно будет передан. Расширение спектра прямой последовательностью (РСПП) – метод, при котором информационный сигнал расширяется за счет его умножения на элементарную посылку – псевдослучайную последовательность (ПСП), имеющую максимальную длину и модулированную известной частотой. Сообщение - это секретная информация, наличие которой необходимо скрыть. Контейнером называется несекретная информация, которую можно использовать для скрытия в ней сообщения. По наличию или отсутствию содержимой стеганоинформации контейнеры подразделяются на: Контейнер – оригинал «с», т. е. пустой, не содержащий стеганоинформации; Контейнер – результат (Стегоконтейнер) «с\» - заполненный и содержащий скрытую информацию m. Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 25
Следует отметить, что для качественной передачи необходимо, чтобы контейнер – результат нельзя было визуально отличить от контейнера – оригинала. Сигнал – контейнер является дискретным, благодаря чему имеется возможность правильного определения границ ПСП с целью фазовой синхронизации. Для шифрования и дешифрования информации при РСПП используется единый ключ – псевдослучайный (белый) шум. Идея данного метода заключается в следующем: сообщение (сигнал, содержащий какие-либо данные) умножается на сигнал несущей и на ПСП, спектр которой весьма широк. Вследствие этого, спектр данных расишряется в пределах диапазона частотной полосы. Полученные данные ослабляются и в качестве аддитивного шума прибавляются к исходному сигналу. На рисунке 6 представлена структурная схема кодека с применением расширения спектра: Рисунок 2.1 – Структурная схема кодека с расширением спектра Синтез информации при данном методе с шифрованием прямой последовательностью, показан на рисунке 7: Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 26
Рисунок 2.2 – Изменение сигнала при кодировании с расширением спектра Как видно из рисунка 2.2, фаза сигнала с ПСП чередуется с фазой, которая промодулированна последовательностью ±1. Таким образом можно сказать, что речь идет о двоичной фазовой манипуляции. При извлечении фазовые значения ϕ0 и ϕ0 + π представлены битовыми значениями 1 и 0, с помощью которых была закодирована последовательность битовых данных. Для реализации кодирования необходимо учитывать некоторые положения: - ПС ключ есть последовательность (М) с максимально возможным и равномерно рассредоточенным набором комбинаций; - Сигнал синхронизирован; - Аналитик при приеме владеет следующей информацией: поток ключей, границы расширенных данных, частота следования ПСП, скорость передачи данных и вид несущей. Реализация программного алгоритма метода РСПП: 1. Ввод начальных данных: речевой материал, имеющий длину I бит и сообщения, подлежащего скрытию, длиной LM бит. Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 27
Для того, чтобы скрыть сообщение размерностью LM бит в речевой сигнал-контейнер, необходимо сегментировать контейнер на LM отрезков, длина которых прописывается в программном коде, как: SegLen= Math.Floor(I); где Math.Floor() – округление до целого числа в меньшую сторону [10]. В каждый сегмент пощмещается 1 бит информации. 2. ПСП с минимальной длиной seglen элементов, представленная значениями ± 1 генерируется для каждого информационного бита. длиной. Генератором ПСП возможно назначить регистр сдвига с линейной обратной связью (РСЛОС) [10] Регистр сдвига есть битовая последовательность разрядов r. Их количество d соответствует длине регистра сдвига. Сумма по модулю 2 определенных битов регистра есть обратная связь. В теории, d-битовый РСЛОС может находиться в каком-либо внутреннем состоянии из из 2d – 1 (период генерирования ПСП). Рисунок 2.3 - Обобщенная схема работы регистра сдвига с линейной обратной связью При этом наблюдается последовательность: px 0 x 0 1 x1 ... d x d , (2.1) где µi (i = 0, 1, …, d) - весовые коэффициенты полинома степени d. Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 28
При этом, состояние µi = 1 означает, что ключ замкнут, а состояние µi = 0 говорит о том, что ключ разомкнут. Необходимое количество разрядов регистра вычисляется как Math.Ceiling(log2 SegLen)) , где Math.Ceiling() – оператор округления в большую сторону. Наименьший значащий бит состояния регистра определяет конечную последовательность. На выходе получается последовательность 0 и 1, преобразованная в последовательность ±1. 3. Производится встраивание информационных бит в сигнал- контейнер. Символы сообщения преобразовываются в вектор значений ±1, после чего контейнер равномерно сегментируется, причем одному биту соответствует один сегмент. С помощью сгенерированной ПСП полученные биты накладываются на сегменты пустого контейнера за счет преобразования каждого 16-битного отсчета в сегменте. Энергию ЦВЗ задает параметр alpha, который варьируется в зависимости от условий стойкости ЦВЗ. Оптимальное значение данного параметра составляет примерно 0,01 (1 % искажения пустого контейнера). Далее преобразованныые сегменты суммируются в один вектор, причем после встраивания крайнего информационного бита длина вектора увеличивается за счет не преобразованных элементов пустого контейнера, соответствуя длине исходного сигнала. По завершению встраивания ЦВЗ стегоконтейнер объединяется с непреобразованным каналом и загружается в файл формата WAV. 4. Последним шагом является декодирование, т. е. извлечение информационных данных. Аналитик на приемной стороне должен иметь оригинальный аудиофайл, знать численное значение SegLen,+. При считывании ЦВЗ из стегоконтейнера применяется ПСП, использууемая для кодирования. Разница между исходным и синтезированным сигналом посегментно анализируется, причем берется усредненное значение сегмента, в результате чего определяются закодированные значения (1, если знак разницы сигналов положительный или 0, если отрицательный). Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 29
Среди достоинств вышеуказанного метода стоит отметить высокий показатель скрытности и устойчивость к модификации, однако емкость речевых данных используется не достаточно эффективно. 2.2 Анализ модифицированного метода расширения спектра и алгоритмов его реализующих Метод расширения спектра [22, 26] довольно часто применяется при обработке речевых сигналов, его можно описать выражением: ~ y y k e u e u ; y, u ,....................................(2.2) где y – исходный стеганографически ~ y – отрезок отрезок (речевой материал); закодированную информацию содержащий (стегоконтейнер); u - псевдослучайная последовательность (ПСП); – множитель определяющий взаимную энергию ПСП и исходного отрезка; k – коэффициент определяющий скрытность и стойкость стеганографически кодируемой информации; e – ортонормальное представление кодируемого бита информации: e 2b 1, (2.3) где b – кодируемый бит. Декодирование информации из стегоконтейнера происходит посредством определения знака скалярного произведения отрезка речевых данных содержащих информацию и ПСП: ~ e~ sign y , u , (2.4) где sign – операция выделения знака; e~ – ортонормальное представление декодируемого бита информации. Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 30
~ b e~ 1 / 2 , (2.5) где e~ – бит декодируемой информации. Для повышения емкости в качестве ПСП последовательности предлагается использовать ортогональный базис, энергия каждой функции которого равна единице: 2 ui 1 ; i 1,2,...9. (2.6) На рисунке 2.4 – 2.5 представлены сигналы, принадлежащие одному из ортогональных базисов полученных на основе функций Радемахера. Рисунок 2.4 - Ортогональный базис Радемахера (функция rad1, rad2, rad3, rad4) u 0.05 0 значение амплитуды -0.05 0 0.05 0.002 0.004 0.006 0.008 0.01 0.012 0.014 0.016 0.018 0.02 t 0.002 0.004 0.006 0.008 0.01 0.012 0.014 0.016 0.018 0.02 t 0.002 0.004 0.006 0.008 0.01 0.012 0.014 0.016 0.018 0.02 0.002 0.004 0.006 0.008 0.01 0.012 0.014 0.016 0.018 0.02 t 0.002 0.004 0.006 0.008 0.01 0.012 0.014 0.016 0.018 0.02 t 0 -0.05 0 0.05 0 -0.05 0 0.05 t 0 -0.05 0 0.05 0 -0.05 0 время, с Рисунок 2.5 - Ортогональный базис Радемахера (функция rad5, rad6, rad7, rad8, rad9) Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 31
Для кодирования используется ортонормальный базис, содержащий ортогональные друг другу функции u и представляется в виде матрицы U размерности M N : U u1 ,..., um ,..., uM ; um radm ; radm i sign sin 2m 2 i , i 1, , N , (2.7) где M – количество строк матрицы U , зависящее от объема скрываемого сообщения x : T x x1 ,..., xi ,..., xM , (2.8) где x – отрезок данных соответствующий цифровому представлению речевого сигнала (речевое сообщение). Учитывая вышеописанные подходы модель (2.2), для осуществления скрытной передачи речевого сообщения в речевых данных, примет вид: M ~ y y w k x U ; w u i ; y , w , (2.9) i 1 где w – сигнально-кодовая конструкция отображающая речевое сообщение, длительностью M отчетов. Для декодирования речевого сообщения, необходимо для каждого отчета выполнить свертку вида: T ~x ~y , u ; i 1,2,..., M ; ~ x ~ x1 ,..., ~ xi ,..., ~ xM , i i где ~ x – декодированный отрезок данных соответствующий (2.10) цифровому представлению переданного речевого сигнала (речевое сообщение). Речевой сигнал, записанный с частотой дискретизации Fs был разбит на равное количество отрезков, соответствующих i-й букве (i=1,…,Z) и имеющих Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 32
определённую длительность T в секундах. В программном коде отсчеты в секундах необходимо вводить. Количество отсчетов одного окна: N Fs T . Следовательно, в Zй отрезок, (2.11) содержащий N отсчетов, можно закодировать количество бит, определяемое по формуле: n log2 N . (2.12) При частоте дискретизации Fs и известном количестве отсчетов, приходящихся на Zй отрезок, можно также определить количество отрезков для анализа и кодирования информации: Z Fs . N (2.13) Таким образом, если в 1сек можно поместить n отсчетов, то в весь РС помещается количество отсчетов, определяемое следующим образом: L Z n. (2.14) Каждая буква слова, подверженная шифрованию, имеет размерность примерно 100-300 отсчетов. В данных условиях, с целью полного скрытия необходимой информации (РС, слово – фрагмент предложения) необходимо записать её с частотой дискретизации Fs=8кГц. Это позволит поместить по одной букве, имеющей размерность, примерно, 100 – 300 отсчетов, в каждый контейнер y . Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 33
Предполагается, что в качестве контейнера y для скрытия данных берется РС с частотой дискретизации Fs=48 кГц. Для осуществления кодирования был сформирован ортогональный базис, представленный на Рисунке 2.4 – 2.5. Словестный алгоритм формирования базиса Радемахера Ввод: Т, Fs; Вывод: u n . 1. Начало; 2. Ввести длительность отрезка Т; 3. Рассчитать количество отсчетов для одного окна: N=fix(Fs*T); 4. Рассчитать длительность прямоугольного импульса dN=N/2; 5. Задать начальное количество базисных функций (столбцов) J=0; 6. Задать условие: dN>1/Fs 7. Задать количество строк: I= -1; 8. Увеличить количество базисных функций: J=J+1; 9. Задать элемент начальной размерности: n=1; 10. Задать условие: n<N; 11. Найти количество строк I как элементов базиса u, от n до J с шагом n+dN-1: u(n:n+dN-1,J)=I; 12. Осуществить смену знака для I: I=-1*I; 13. Переприсвоить n на отрезок длительности dN больше: n=n+dN; 14. Осуществить проверку условия: dN>1/Fs: - если dN>1/Fs, вернуться к п. 8; - если dN<1/Fs, завершить цикл и перейти к п. 13; 15. Осуществить разбиение фронта прямоугольного импульса dN=dN/2; 16. Осуществить проверку условия: dN>1/Fs: - если dN>1/Fs, вернуться к п. 5; - если dN<1/Fs, завершить цикл и перейти к п. 15; 17. Осуществить цикл: нормировку базиса к 1 для каждого столбца: j=1:J; Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 34
18. Просуммировать квадрат каждого столбца матрицы (базисной функции) u, найдя тем самым энергию матрицы Еu: Eu=sum(u(:,j).^2); 19. Сформировать нормированную базисную функцию un как частное каждого jго столбца матрицы u и корня из Еu: un(:,j)=u(:,j)/sqrt(Eu) ; 20. Вывод базисной функции u; 21. Вывод нормированной базисной функции un; 22. Конец. Рисунок 2.6 – Блок-схема формирования ортогонального базиса Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 35
Ортогональный базис для кодирования сформирован. Далее необходимо скрыть в контейнере y аудиосигнал, x . Положим, каждый внедренный символ имеет номер m. Значит, зная количество анализируемых окон Z и границы каждого необходимого окна можно закодировать информацию путём последовательного сложения каждого необходимого окна и скалярного произведения коэффициента внедрения на элемент скрываемого РС x и транспонированную функцию ортогонального базиса u u1,..., ui ,..., uN (элемента вектор - столбца). При этом, необходимо подобрать такое значение коэффициента внедрения K, при котором искажения стегоконтейнера будут минимальны. Данная величина является порогом кодирования. Кодирование производится в соответствии с формулой (2.9) ~ В результате данной операции формируется стегоконтейнер y , состоящий из Z окон, длительностью (v(z):v(z)+N-1). Словесный алгоритм кодирования: Ввод: T, K, [V], Z, Wfile, fs, Xfile, Fs; Вывод: c , Fs. 1. Начало 2. Ввести длительность сигнла T; 3. Задать коэффициент внедрения K; 4. Загрузить файл [V]– массив нижних границ анализируемых окон предложения ; 5. Задать количество анализируемых отрезков Z; 6. Загрузить звуковой файл Wfile – информация, которую необходимо скрыть, fs=8000 Гц; 7. Загрузить звуковой файл - контейнер Xfile, Fs=48000 Гц; 8. Назначить счетчик m=0 - номер внедренного символа; 9. Назначить звук Xn файлом – контейнером: C=Xn; Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 36
10. Назначить счетчик: z=1:Z – перебор отрезков c шагом 1; 11. Из контейнера выделить необходимый отрезок x: x=Xn(v(z):v(z)+N-1); 12. Назначить счетчик j=1:J – перебор вектор столбцов базисной нормированной матрицы – с шагом 1; 13. Увеличить счетчик: m=m+1; 14. Осуществить кодирование: x=x+K*W(m)*un(:,j)’; 15. Осуществить проверку условия: j=J : - если j<J, вернуться к п. 11; - если j=J завершить цикл и перейти к п. 15; 16. Присвоить x отрезок контейнера: C(v(z):v(z)+N-1)=x; 17. Осуществить проверку условия: z=Z : - если z<Z, вернуться к п. 9; - если z=Z завершить цикл и перейти к п. 17; 18. Вывести воспроизводимый стегоконтейнер ; 19. Конец. Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 37
Рисунок 2.7 – Блок-схема кодирования речевого сообщения в РС С целью корректного проведения эксперимента было реализовано декодирование скрываемой информации. Данный этап позволяет оценить, насколько искажается передаваемое сообщение под воздействием изменения различных параметров сигнала. Декодирование осуществляется следующим образом: Предположим, что скрываемое сообщение имеет определенное количество значений. Каждому значению сигнала соответствует скрытый символ mn. Следовательно, информацию, которая содержится в отрезке стегоконтейнера, Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 38
длиной от v(z) до v(z)+N-1, можно извлечь, скалярно умножив данный отрезок на транспонированный элемент базисной функции, нормированный к единице (2.10). Словесный алгоритм декодирования: Ввод: T, c , Fs, [V]; Вывод: wn , fs. 1. Начало; 2. Задать длительность анализируемого отрезка T; 3. Считать стегоконтейнер c , полученный при кодировании с частотой дискретизации Fs=8000 Гц; 4. Загрузить файл [V] – массив нижних границ анализируемых отрезков предложения ; 5. Определить количество анализируемых отрезков Z, исходя из размерности [V]; 6. Считать сформированную ранее матрицу un; 7. Считать J - количество вектор – столбцов нормированой матрицы ; 8. Задать начальное количество скрытых символов mn=0; 9. Назначить счетчик: z=1:Z – перебор отрезков c шагом 1; 10. Выделить отрезок s из стегоконтейнера C: s = C(v(z):v(z)+N-1) ; 11. Назначить счетчик J=1:J; 12. Увеличить номер скрытого символа: mn=mn+1 ; 13. Осуществить декодирование: =un(:,j)'*s; 14. Осуществить проверку условия: j=J : - если j<J, вернуться к п. 12; - если j=J завершить цикл и перейти к п. 16; 15. Осуществить проверку условия: z=Z : - если z<Z, вернуться к п. 10; - если z=Z завершить цикл и перейти к п. 17; 16. Вывести декодированную информацию wn 17. Конец. Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 39
Рисунок 2.8 – Блок-схема декодирования речевого сообщения из РС В данном разделе была реализована модификация метода расширения спектра посредством использования элементов ортогонального базиса Радемахера, позволяющего скрыть в одном отрезке речевого сигнала не 1 бит информации, а поток данных (примерно 9 бит). Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 40
3 ОЦЕНКА СКРЫТНОСТИ РЕЧЕВОГО СООБЩЕНИЯ 3.1 Качественная оценка искажений, вызываемых кодированием сообщения в речевых данных Для проведения исследования в соответствии с выбранным методом использовались следующие компоненты: 1) Три РС y , записанные с частотой дискретизации fd = 48 кГц, разрядностью 16 бит. Параметр частоты дискретизации достаточно велик (соответствует студийной записи речевого материала ГОСТ), что позволит увеличить емкость скрываемой информации. 2) Длительность речевых сигналов y i: N1=202046, N2=154437, N3=163412 отсчетов при выбранной частоте дискретизации; 3) РС, используемый в качестве скрываемого сообщения x (побуквенно) с частотой дискретизации fd=8 кГц, разрядностью кодовой последовательности 16 бит. 4) Длительность РС, используемого в качестве скрываемого сообщения x : NС=25734 отсчетов при выбранной частоте дискретизации. В ходе выполнения данного эксперимента были отобраны 3 предложения, содержащие преимущественно: 1. Взрывные согласные; 2. Звонкие согласные; 3. Шипящие согласные. Данная процедура проводилась для того, чтобы скрыть информацию в этих согласных и исследовать качество полученных аудиосигналов. Ниже представлены реализации временных осциллограмм выбранных предложений. Выделен необходимый набор звуков, обозначены границы начала данных звуков. Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 41
Предложение 1 y1 длительностью 4.209 с. с частотй дискретизации 48кГц содержит взрывные звуки и соответствует фразе: «Руководитель потребовал прекратить посадку». 0.2 р у к о в о д' и т' ель п о т р' е б о в а л пр'е к р а т' и ть п о с а д к у значения амплитуды 0.15 0.1 0.05 0 t -0.05 -0.1 -0.15 -0.2 0.922 1.115 1.278 1.487 1.608 1.815 2.196 2.324 2.554 2.726 2.863 3.278 3.360 длительность звука, с Рисунок 3.1 - Временная осциллограмма предложения 1 Предложение 2 y2 длительностью 3.217 с. с частотй дискретизации 48кГц содержит звонкие звуки и соответствует фразе: «Герои вернулись домой с победой». 0.3 г’ е р о в' е р н и у л' и сь д о м о й с п о б' е д о й значения амплитуды 0.2 0.1 0 -0.1 -0.2 -0.3 -0.4 0.303 0.541 0.869 1.0331.073 1.275 1.537 1.738 1.952 2.390 2.644 2.845 длительность звука, с Рисунок 3.2 - Временная осциллограмма предложения 2 Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 42
Предложение 3 y3 длительностью 3.404с. с частотй дискретизации 48кГц содержит щипящие звуки и соответствует фразе: «Дежурный принес одежную щетку». 0.15 д е ж у рн ый пр' и н' ё с о д' ё ж ну ю щ ё тк у значения амплитуды 0.1 0.05 0 -0.05 -0.1 -0.15 -0.2 0.350 длительность звука, с 2.260 2.750 Рисунок 3.3 - Временная осциллограмма предложения 3 Далее из каждого предложения были выделены границы звуков и определена их длительность в отсчетах и секундах. Эти данные представлены в таблицах (1 – 3) приложения А. В качестве скрываемого сообщения был использован фрагмент предложения «Фильм снимали целый год». Длительность предложения 3.216 с. (3191 отсчет) Длительность отобранного фрагмента x , соответствующего слову «год» - 0.398 с при частоте дискретизации 8кГц. Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 43
0.1 г о д значения амплитуды 0.05 0 -0.05 -0.1 -0.15 0.035 0.045 0.052 координаты начала звука, с Рисунок 3.4 - Временная осциллограмма скрываемого слова Также были определены координаты начала, конца звуков и их длительность: Таблица 3.1 – Диапазоны звуков скрываемого РС Буквы Звуки Нижняя Верхняя Длительность, Длительность, граница граница отсчеты сек 1 2 3 4 5 6 г [г] 1659(0.035) 1941 282 0.035 о [о] 2168(0.045) 2442 274 0.034 д [т] 2484(0.052) 2661 177 0.022 В результате скрытия отрезка речевого сигнала в сигналах – контейнерах при различном значении порога кодирования были получены стегоконтейнеры, представленные на рисунках 3.5 – 3.13. На рисунках 3.5 – 3.7 представлены стегоконтейнеры, полученные при скрытии информации в предложение 1: Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 44
Рисунок 3.5 - Временная осциллограмма предложения 1 при K=0,1 Рисунок 3.6 - Временная осциллограмма предложения 1 при K=0,5 Рисунок 3.7 - Временная осциллограмма предложения 1 при K=1 Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 45
Рисунки 3.8 – 3.10 иллюстрируют стегоконтейнеры, полученные при скрытии информации в предложение 2: Рисунок 3.8 - Временная осциллограмма предложения 2 при K=0,1 Рисунок 3.9 - Временная осциллограмма предложения 2 при K=0,5 Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 46
Рисунок 3.10 - Временная осциллограмма предложения 2 при K=1 Осциллограммы предложений-стегоконтейнеров, полученных при скрытии информации в предложение 3 представлены на рисунках 3.11 – 3.13: Рисунок 3.11 - Временная осциллограмма предложения 3 при K=0,1 Рисунок 3.12 - Временная осциллограмма предложения 3 при K=0,5 Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 47
Рисунок 3.13 - Временная осциллограмма предложения 3 при K=1 Как видно из рисунков 3.5 – 3.13, при увеличении коэффициента скрытности, видимые на осциллограмме искажения проявляются с большей степенью, таким образом, увеличение видимых искажений напрямую зависит от коэффициента K, регулирующего порог кодирования. Наиболее очевидные сигнальные искажения при единичном значении коэффициента K проявились в предложении 1, причём из всех 13 взрывных звуков с закодированным в них сигналом, наиболее четко проявили искажения звуки: [п], [т], [к], [т’]. Это может быть вызвано особенностью распределения долей энергии в данных интервалах. В предложении 2 искажения проявились во всех исследуемых звуках, но с меньшей степенью заметности, что вызвано более интенсивным распределением энергии в частотах данного набора звуков. Наименее заметно искажения проявились в шипящих звуках предложения 3. Это вызвано способностью шумоподобного вида шипящего звука маскировать возникшие при кодировании искажения. Помимо особенностей распределения долей энергии в звуках русской речи и индивидуальных свойств исследуемых звуков, важное значение имеет количество анализируемых окон и длина исследуемого отрезка. В программной реализации анализ проводился на отрезке длиной в N=1024 отсчета, временная длительность при частоте дискретизации 48 кГц составила 0,22 с. Количество Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 48
анализируемых окон R=45 определялось из отношения частоты дискретизации к длине одного отрезка в отсчетах. В звуковом спектре при диапазоне слышимости человеком 20 Гц – 20 кГц существуют следующие показатели: 1. Звуки с диапазоном слышимости: от 20Гц – 20 кГц: низкочастотные звуки: до 500 Гц; среднечастотные звуки: 0.5 – 10 кГц; высокочастотные звуки: более 10 кГц; 2. Инфразвуки: до 20 Гц; 3. Ультразвуки: от 2 кГц и выше; К диапазону среднечастотных звуков: 1 – 5 кГц слуховая система наиболее чувствительна, а при более низкочастотных или же высокочастотных звуках чувствительность уменьшается, в результате чего слуховой аппарат теряет слышимость низкочастотных звуков в диапазоне (20 – 60) дБ, но способен слышать звуки , энергия которых приближенак 0 дБ из среднечастотного диапазона. То есть, звуки с одной и той же энергией. Имеется в виду, что звуки среднечастотного диапазона можно принять за громкие, а звуки, принадлежащие низкочастотному диапазону считать тихим или же вовсе не слышать их. На данном этапе была реализовано восприятие на слух речевых сигналов – стегоконтейнеров. Для оценки были назначены три проинструктированных эксперта – оценщика различной возрастной категории. Каждому оценщику предлагалось прослушать три речевых сигнала с закодированной аудиоинформацией. Для каждого предложения информация скрывалась в различном наборе звуков: во взрывных, звонких и шипящих согласных. Далее была составлена анкета для аудиальной оценки исходного РС и РС с искажениями, вызванными скрытием в нём аудиоданных с различными значениями порога кодирования. По результатам опроса были выявлены следующие результаты: 1. Слышимость. Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 49
Наибольшее количество искажений при различных значениях порога кодирования было замечено в предложении со скрытием в звонких согласных. 2. Абсолютное отсутствие искажений, воспринимаемых на слух: В предложении 3 слушатели не заметили искажений при прослушивании материала. 3. Значение порога кодирования. Во всех трех предложениях, по мере увеличения порога кодирование, количество слышимых искажений так же возрастает. Таблица 3.2 - Количество воспринятых на слух искажений при различном значении порога кодирования Количество воспринятых искажений K=0,1 K=0,5 K=1 2 3 4 Предложение 1 6 15 16 Предложение 2 6 9 21 Предложение 3 0 0 0 1 По результатам качественной оценки было выявлено, что нецелесообразно скрывать информацию в звонких согласных, так как в спектре данного набора звуков наиболее просматриваемы внесенные искажения. Это может быть связано с особенностью распределения энергии в звонких звуках. Также было выявлено, что оптимальным набором для встраивания скрытой информации является набор шипящих, ввиду того, что их реализация близка к шумоподобной, также проявляемомой как следствие кодирования. За счет слияния этих компонентов, искажения маскируются. Ещё одним заключением является выбор оптимального порога кодирования, который должен варьироваться от 0,1 до 0,3. На рисунках 3.14 – 3.16 представлены исходные и искаженные кодированием звуки, а так же их спектры. Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 50
Рисунок 3.14 – Временная осциллограмма и спектр звука «ж» при значении коэффициента внедрения K=0.1 Рисунок 3.15 – Временная осциллограмма и спектр звука «ж» при значении коэффициента внедрения K=0.5 Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 51
Рисунок 3.16 – Временная осциллограмма и спектр звука «ж» при значении коэффициента внедрения K=0.1 3.2 Количественная оценка искажений, вызываемых кодированием сообщения в речевых данных В данном разделе были определить параметры исходного РС и сигналов – сегоконтейнеров при различном значении порога кодирования. Данная оценка очень важна, так как необходимо убедиться, что синтезированный сигнал качественно и количественно не отличается от исходного. Степень искажений, вносимых в сигнал при кодировании в него информации, можно пронаблюдать, определив следующие параметры: Отношение сигнал/шум, параметр, определяющий суммарные мощности как шума, так и сигнала на всей его длительности : N x i 2 ОСШ 10 lg i 1 N xi yi , (3.2) 2 i 1 где N – общее количество отсчетов в РС; xi и yi - отсчеты исходного и искаженного (синтезированного) сигналов с номером i. Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 52
В процессе исследования может возникнуть необходимость вычисления отношения сигнал/шум на отдельных сегментах речевого сигнала. В этом случае удобно пользоваться формулой 3.3: ОСШ сег 10 M 1 N m N 1 x 2 i , lg М m 0 xi yi 2 Nm (3.3) где М - количество сегментов в РС; N - длина сегмента; xi и yi - отсчеты исходного и искаженного (синтезированного) сигналов с номером i, вычесленные на m-м сегменте. Среднеквадратическая ошибка[23, 2] позволяет анализировать сигнал во временной области, определяя различие энергии отрезков сигналов: N СКО xn ~ xn 2 , n1 (3.4) где xn – амплитуды исходного отрезка данных; ~ xn –амплитуда отрезка данных, содержащего дополнительную информацию; N – количество отсчетов анализируемых сигнальных отрезков. Однако при использовании данной оценки, энергия самого сигнала не учитывается, поэтому стоит ввести оценку, обладающую аналогичным поведением при определении СКО, нормированную среднеквадратическую ошибку [23, 2]: N НСКО (x n 1 n ~ xn ) 2 , N x n 1 (3.5) 2 n где xn - исходный сигнал; ~xn – синтезированный сигнал; Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 53
Степень взаимосвязи между исходным и синтезированным речевыми сигналами определяется их корреляцией: N (x r n 1 n xn )(~ xn ~ xn ) (3.6) , N (x n 1 n xn ) 2 ( ~ xn ~ xn ) 2 где x n – исходный сигнал; ~xn – синтезированный сигнал; x n и ~x n – выборочное среднее исходного и синтезированного сигнала, определяемое формулой: 1 ~ xn N N x i 1 (3.7) i Все вышеперечисленные оценки позволяют сравнить исходный и синтезированный отрезки речевого сигнала в процессе кодирования, функционируя при этом во временной области. Таблица 3.2 - Представлены результаты количественной оценки звуков – стегоконтейнеров Предложение 1: звук Предложение 2: звук Предложение 3: звук «к» «д» «ж» К=0,1 К=0,5 К=1 К=0,1 К=0,5 К=1 К=0,1 К=0,5 К=1 1 2 3 4 5 6 7 8 9 10 ОСШ 66.383 38.42 26.380 45.52 17.585 5.542 72.074 44.13 32.09 2 7 0.002 0.008 0.006 0.025 0.997 0.988 3 СКО 5.684* 2 0.001 0.006 10-5 ɛ 4.796* 8.232 0.002 0.008 *10-5 0.012 0.048 0.005 10-5 0.132 0.528 10-4 r 0.999 7.766* 2.491* 10-4 0.994 0.977 0.997 0.937 0.785 0.999 Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 54
По результатам количественной оценки было выявлено, что наиболее оптимальным является скрытие речевого сигнала в шипящих звукахконтейнерах с использованием порога кодирования в диапазоне от 0,1 до 0,5. Как видно, при данных критериях уровень зашумленности велик, но синтезированный сигнал практически идентичен исходному. Величина среднеквадратической ошибки в данном случае приближена к нулю при минимальном коэффициенте внедрения, но по мере его увеличения, СКО незначительно возрастает. Тем не менее, допустимая степень идентичности исходного и синтезированного сигнала сохраняется. Также видно, что при увеличении интенсивности кодирования, отношение сингал/шум уменьшается, что свидетельствует об увеличении искажений. Корреляция при исследовании каждого набора звуков и при всех вариациях коэффициента K не опускается ниже 0,97, следовательно, сохраняется достаточная схожесть между сигналами. Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 55
4 ЭКОНОМИЧЕСКОЕ ОБОСНОВАНИЕ РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЯ Основная задача научно-исследовательской работы заключалась в разработке алгоритма скрытной передачи речевого сигнала, в результате чего был получен необходимый продукт, а также проведено исследование искажений при различной интенсивности порога кодирования. По мере выполнения работы возникал ряд определенных экономических затрат. 4.1 Планирование работ по исследованию Для реализации работы были задействованы следующие сотрудники: - младший научный сотрудник, выполняющий сбор и обработку необходимой информации, теоретическое описание и изложение математической модели исследования, разработку расчетных и функциональных алгоритмов, соответствующих выбранной теме. - старший научный сотрудник, контролирующий и проверяющий работу в процессе её реализации. - экономист, оценивающий экономические затраты на исследования. Расчет трудоемкости и временных затрат представлен в таблице 4.1. Таблица 4.1 - Планирование работ по исследованию Этапы выполнения работы 1 1.1.Поиск информации Исполнитель 2 1.Подготовительный Младший научный сотрудник Трудоем кость, час 3 Продолжи тельность, дней 4 120 15 Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 56
Окончание таблицы 4.1 Этапы выполнения работы Исполнитель 1 Трудоем кость, час 2 3 Продолжи тельность, дней 4 1.2.Формирование направления исследования Старший сотрудник научный 120 15 1.3.Определение объема исследовательских работ 1.4.Формирование исследовательской работы 1.5.Обработка и анализ информации Итого: Младший сотрудник научный 40 5 Младший сотрудник научный 8 1 Младший сотрудник научный 64 8 59 44 24 3 320 40 344 43 40 5 40 5 80 10 2.1.Обоснование актуальности исследовательской работы 2.2.Реализация работы 472 2.Основной (экономический анализ) Старший научный сотрудник Младший сотрудник научный Итого: 3.Заключительный Экономист 3.1.Экономическое обоснование результатов исследования 3.2. Оформление и Младший утверждение сотрудник документации Итого: научный В результате планирования было определено штатное количество сотрудников, задействованных в работе, а также была рассчитана почасовая и ежедневная трудоемкость исследования. Было выявлено, что наибольшая временная нагрузка на всех этапах выполнения работы приходится на младшего научного сотрудника, а наиболее продолжительным по времени является подготовительный этап, поскольку необходимо собрать достаточное количество информации, соответствующей теме исследования. Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 57
4.2 Расчет расходов на оплату труда Распределение расходов на оплату труда по разработке алгоритма скрытной передаче речевого сигнала представлен в таблице 4.2. Таблица 4.2 - Распределение расходов на оплату труда Должность Трудоемкость, Оклад, Исполнителей час руб 1 2 3 Младший научный сотрудник 592 17000 Старший научный сотрудник 144 31000 Экономист 40 15000 Итого: 776 63000 Часовая тарифная ставка (ЧТС) определяется формулой: Ч ТС Р , (4.1) F мес где Fмес – фонд рабочего времени месяца, составляет 176 часов (22 рабочих дня, 8 часов в день); Р – оклад сотрудника, руб. Для младшего научного сотрудника часовая тарифная ставка составит: Ч 17000 96,59 руб / час. . ТС1 176 Для старшего научного сотрудника часовая тарифная ставка составит: Ч ТС 2 31000 176 ,14 руб / час. . 176 Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 58
Часовая тарифная ставка экономиста: Ч ТС 3 15000 85,23 руб / час. 176 Таким образом, общая часовая тарифная ставка составит: Ч 96,591 176,136 85,227 357,95 руб / час. ТС Расход на оплату труда (РОТ) находится следующим образом: , Р Ч *Т ОТ ТС сум (4.2) где ТСУМ – суммарная трудоемкость каждого из исполнителей, час. Расход на оплату труда младшего научного сотрудника: Р 95,591 592 56589,87 руб. ОТ1 Расход на оплату труда старшего научного сотрудника: Р 176,136 144 25363,58 руб. ОТ 2 Расход на оплату труда экономиста: Р 85,227 40 3409,08 руб. ОТ 3 Общий расход на оплату труда: Р 56589,872 25363,584 3409,080 85362,54 руб. ОТ Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 59
Результаты расчетов сведены в таблицу 4.3: Таблица 4.3 - Расчет расходов на оплату труда Должность Трудоемкость, Оклад, ЧТС, РОТ, час руб руб/час руб 2 3 4 5 научный 592 17000 96,59 56589,87 научный 144 31000 176,14 25363,58 Экономист 40 15000 85,23 3409,08 Итого: 776 63000 357,95 85362,54 Исполнителей 1 Младший сотрудник Старший сотрудник Согласно расчетам трудоемкость исследования составила 776 часов, итоговый оклад оценивается в 63000 рублей, общая часовая ставка равна 357,954 руб/час, а суммарный расход на оплату труда составляет 85362,54 рубля. 4.3 Расчет продолжительности исследования Длительность проводимой работы составит: Т иссл Т сум / Т РД (4.3) где ТСУМ = 776 часов - суммарная трудоемкость исследования; ТРД = 8 часов – продолжительность рабочего дня. ТИССЛ = 776/8 = 97 дней. Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 60
Без учета выходных и праздничных дней продолжительность работы составляет 97 дней. 4.4 Расчет стоимости расходных материалов В данном разделе рассчитываются расходы на приобретение материалов для печати, необходимых канцелярских для товаров, проведения различных исследования, бумажных нанесения материалов необходимых письменных заметок, печати и оформления документации. Расчет стоимости расходных материалов приведен в таблице 4.4: Таблица 4.4 - Стоимость расходных материалов. Наименование расходных Цена за единицу, Количество, Сумма, материалов шт. руб. руб. 1 2 3 4 Бумага 180 2 360 Канцтовары 200 1 200 Расходные материалы для 3800 1 3800 Ватман 10 10 100 Итого: 4180 14 4460 принтера (картридж) Выявлено, что расход на приобретение используемых материалов составляет 4460 рублей. 4.5 Расчет сметы расходов на исследование. В категорию расчетов расходов на исследования включаются премиальные выплаты, районный коэффициент и страховые взносы. Данные Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 61
показатели зависят от величины расхода на оплату труда. По итогам расчета была составлена смета, в которой обозначены расходы на реализацию исследования. Премиальные выплаты рассчитываются по формуле: ПВ Р К ОТ ПВ (4.4) где КПВ - коэффициент премиальных выплат - 20 %, в случае если премии не предусмотрены КПВ=1. Сумма премиальных выплат составит: ПВ 85362 ,54 0,2 17072 ,51 руб. Дополнительные затраты на проведение исследования можно определить как:: З ДОП Р К ОТ (4.5) где К - коэффициент дополнительных затрат (К=14%). З З ДОП ДОП Р 14 %. ОТ 85362 ,54 0,14 11950 ,76 руб. В случае, если работа осуществляется в неблагоприятных условиях, необходимо сделать доплату к основной заработной плате. Величину доплаты характеризует районный коэффициент, определяемый формулой: РК Р К ОТ РВ (4.6) где КРВ – коэффициент районных выплат, для примера составляет 15 % от суммы. РК 85362 ,54 0,15 12804 ,39 руб. Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 62
Общие расходы на оплату труда вычисляются по формуле: (4.6) Р Р ПВ РК З общ ОТ ДОП где РОТ - основная заработная плата; ПВ - премиальные выплаты; ЗДОП - дополнительные затраты; РК - районный коэффициент. Р 85362,54 17072,51 12804,39 11950,76 127190,20 руб. общ Итоговая сумма стоимости расходных материалов по статье расходных материалов: Σ РРМ =4460 руб. Страховые взносы рассчитываются по формуле: (4.7) СВ Р 0,3 ОТ СВ 85362 ,536 0,3 25608 ,60 руб. На использование компьютера предусмотрены амортизационные исчисления, составляющие 25% от его стоимости и вычисляемые по формуле: АО С ПК 0,25 (4.8) СВ 23000 0,25 5750 руб. Расходы на использование Интернета берутся из расчета месячной абонентской платы для предприятия. Пусть: РИНТ=800 руб. Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 63
Административно-хозяйственые расходы составляют 50% от основной заработной платы (РОТ). (4.9) Р Р 0,5. АХ ОТ Р 85362,54 0,5 42681,27 руб. АХ Результирующие расходы были сведены в таблицу. Смета расходов на разработку и проведение исследования представлена в таблице 4.5. Таблица 4.5 - Смета расходов на разработку и проведение исследования Наименование статей расходов 1 1.Стоимость расходных материалов 2. Расходы на оплату труда 2.1. Основная заработная плата 2.2. Дополнительные затраты 2.3. Премиальные выплаты 2.4 Районный коэффициент 3. Единый социальный налог 4. Амортизационные исчисления на использование компьютера 5. Расходы на использование Интернет 6.Административно-хозяйственные расходы Итого: Сумма, руб. 2 4460 127190,20 85362,54 11950,76 17072,51 12804,39 25608,60 5750 Удельный вес статей, % 3 2,16 800 42681,27 206490,07 0,388 20,67 100 41,34 5,79 8,268 6,2 12,4 2,785 В результате экономической оценки исследования были определены затраты на разработку и реализацию исследования: - продолжительность исследовательских работ составила 97 дней; - сметы расходов на исследование – 206490,07 рублей с учетом отчислений и единого социального налога. Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 64
ЗАКЛЮЧЕНИЕ В реализованной работе были рассмотрены основные стеганографические методы, позволяющие осуществлять скрытную передачу информации. Проанализировав преимущества и недостатки было выявлено, что наиболее оптимальным с точки зрения емкости скрываемой информации, маскировки и сложности реализации является алгоритм, основанный на методе расширения спектра. Данный метод был модифицирован за счет замены псевдослучайной последовательноси как ключа на ортонормированный базис, в результате чего появилась возможность скрывать поток данных, а не 1 бит информации в сегменте. Использование ортонормированного базиса вместо ПСП, позволяет более эффективно с позиции объема кодируемой информации использовать речевой материал для скрытной передачи сообщения. Стеганографическое кодирование имеет ряд этапов. Первый включает в себя кодирование сообщения в ортонормальном базисе. Второй осуществляет адаптивную фильтрацию, для того чтобы декодирование сообщения обладало более высокой достоверностью и не было подвержено искажениям. Третий этап непосредственное кодирование с адаптивным коэффициентом. Как показали эксперименты скрытность можно обеспечить за счет использования в качестве коэффициентов отражающих значение энергии исходного отрезка. В процессе исследовательской работы была выполнена основная цель, так как разработанный алгоритм способствует модификации методов скрытого внедрения информации в звуковые файлы. Для достижения поставленной цели был проведен мониторинг изменений качества звука и восприятия искажений при скрытном кодировании информации модифицированным методом расширения спектра. Поэтапно был реализован ряд задач. В результате анализа метода расширения спектра и его модификации был разработан алгоритм скрытного кодирования и декодирования речевого сообщения в речевые данные, причем в Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 65
качестве ПСП был использован ортогональный базис Радемахера, что позволило увеличить скрытность. Проанализировав речевой материал, содержащий преимущественно взрывные, звонкие и шипящие согласные было выявлено, что наиболее оптимальным сигналом для скрытия в него информационного сообщения является предложение, содержащее шипящие звуки ввиду минимального наличия визуальных искажений на осциллограмме. Результаты качественной оценки также направлены на оптимальность предложения с шипящими звуками, так как слияние шумоподобных составляющих звука и искажения способны взаимомаскироваться. При количественной оценке были определены величины отношения сигнаол шум, среднеквадратической и нормированной среднеквадратической ошибки, корреляции. Было выявлено, что наиболее оптимальным является скрытие речевого сигнала в шипящих звуках-контейнерах с использованием порога кодирования в диапазоне от 0,1 до 0,5. Разработанные алгоритмы стеганографического кодирования и декодирования речевого сообщения в речевые данные были реализованы в среде программирования Matlab в соответствии с приведенными словесными алгоритмами. Программный код позволил за короткое время получить достоверные результаты расчетов с использованием общеизвестных и разработанных формул. В результате экономической оценки исследования удалось оценить продолжительность исследовательских работ – 97 дней и сумму расходов на исследование – 206490,07 рублей с учетом отчислений и единого социального налога. Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 66
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 1. Yong Xiang Spread Spectrum-Based High Embedding Capacity Watermarking Method for Audio Signals [электронный ресурс] / Yong Xiang, Iynkaran Natgunanathan, Yue Rong, , Song Guo // IEEE.ACM TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING. 23(12). 2015. pp. 2228 – 2237 URL: https://www.researchgate.net/publication/281930141_Spread_SpectrumBased_High_Embedding_Capacity_Watermarking_Method_for_Audio_Signals?C (дата обращения: 04.05.2016) 2. Ahmed Hussain Ali A Review on Audio Steganography Techniques [электронный ресурс] / Mohd Rosmadi Mokhtar, LoayEdwar George // Research Journal of Applied Sciences, Engineering and Technology. 12(2). 2016. pp. 154-162 URL:https://www.researchgate.net/publication/292361595_A_Review_on_Audio_Ste ganography_Techniques (дата обращения: 05.05.2016) 3. Таравков, А.В. Разработка алгоритма синхронизации для внедрения цифрового водяного знака в потоковое видео [Электронный ресурс]/ Григорьев А.С., Баженов Р.И.// Современная техника и технологии. № 11. 2014. URL: https://d.docs.live.net/99ddf781f115b8ed/Литература%20к%20диплому/3.html (дата обращения 18.04.2016) 4. Zhenghui Liu A security watermark scheme used for digital speech forensics [электронный ресурс] / Jiwu Huang, Xingming Sun, Chuanda Qi // Springer Science+Business Media New York. 10.1007/s11042-016-3533-9. 2016. pp 1-21.URL: https://www.researchgate.net/publication/301576015_A_security_watermark_scheme _used_for_digital_speech_forensics (дата обращения 25.04.2016) 5. Коробейников, А.Г. Встраивание цифровых водяных знаков в аудиосигнал методом расширения спектра [Электронный ресурс] / А.Г. Даурских, Н.В. Павлова // Научно-технический вестник Санкт-Петербургского государственного университета информационных технологий, механики и оптики. № 1(59). 2009. URL: http://cyberleninka.ru/article/n/vstraivanie-tsifrovyhЛист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 67
vodyanyh-znakov-v-audiosignal-metodom-rasshireniya-spektra (дата обращения 27.04.2016) 6. Сюзев, В.В. Основы спектрального анализа в базисах Хаара [Электронный ресурс] // Вестник Московского государственного технического университета им. Н.Э. Баумана. Серия «Приборостроение». № 2. 2011. URL: http://cyberleninka.ru/article/n/spektralnyy-analiz-v-bazisah-funktsiy-haara (дата обращения 29.04.2016) 7. Сергиенко А.Б. Цифровая связь: Учеб. пособие. СПб / А.Б. Сергиенко – Изд – во: С32 СПбГЭТУ «ЛЭТИ», 2012. 164с. 8. Nedeljko Cvejic. Spread spectrum audio watermarking using frequency hopping and attack characterization [Электронный ресурс] / Nedeljko Cvejic, Tapio Seppanen// Signal Processing 84. 2004. pp 207 – 213. URL: http://www.mediateam.oulu.fi/publications/pdf/465.pdf (дата обращения 04.05.2016) 9. Saito S. A digital watermarking for audio data using band division based on QMF bank [Электронный ресурс] / S. Saito, T. Furukawa, K. Konishi // IEEE International Conference on Acoustics, Speech, and Signal Processing. 2002. – V. 4. pp 3473-3476. URL: http://books.google.ru/books?id (дата обращения 05.05.2016) 10. Конахович, Г.Ф. Компьютерная стеганография. Теория и практика [Текст] / Г.Ф. Конахович, А.Ю. Пузыренко. – Киев: «МК-Пресс», 2006 - 288с. 11. Boney, L. Digital watermarks for audio signals Tewfic [Электронный ресурс] / A.H., Hamdy A.K. // Department of Electrical engineering, University of Minnesota. DOI: 10.1109/MMCS.1996.535015. 1996. URL: https://www.researchgate.net/publication/3639217_Digital_watermarks_for_audio_sig nals (дата обращения 11.05.2016) 12. Рабинер, Л.Р. Цифровая обработка речевых сигналов = Digital processing of speech signals: для инженеров, специализирующихся в данной области, а также для студентов вузов соответствующих специальностей / Л.Р. Рабинер, Р.В. Шафер; Пер. с англ./ Под ред. М.В. Назарова и Ю.Н. Прохорова М.: Радио и связь, 1981. - 496 с., ил. Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 68
13. Кирякова, Г.С. Системы искусственного интеллекта: Учеб. пособие / Г.С. Кирякова. Красноярск: ИПЦ КГТУ. 2005. 168 с. 14. Чесебиев, И.А. Компьютерное распознавание и порождение речи [Текст] / И.А. Чесебиев. Спорт и культура-2000, 2008. 128 с. 15. Ле, Н. В. Предварительная обработка речевых сигналов для системы распознавания речи [Электронный ресурс] / Н. В. Ле, Д. П. Панченко // Молодой ученый. — — 2011. №5. Т.1. — С. 74-76. URL: http://www.moluch.ru/archive/28/3171/ (Дата обращения 18.04.2016) 16. Горшков, Ю.Г. Обработка речевых сигналов на основе вейвлетов [Электронный ресурс] // T-Comm. 2015. №2. С. 46 – 53. URL: http://cyberleninka.ru/article/n/obrabotka-rechevyh-signalov-na-osnove-veyvletov (дата обращения: 18.05.2016). 17. Белов, С.П. Метод частотно – временного анализа сигналов [Электронный ресурс] / С.П. Белов, Е.И. Прохоренко, А.С Белов // Научные ведомости Белгородского государственного университета. Серия: Экономика. Информатика. 2009. №1 (56). URL: http://cyberleninka.ru/article/n/metod-chastotnovremennogo-analiza-signalov-1 (дата обращения: 20.05.2016). 18. Жиляков, Е.Г. Алгоритмы обнаружения основного тона речевых сигналов [Электронный ресурс] / Е.Г Жиляков, А.А. Фирсова, Н.А. Чеканов // Научные ведомости Белгородского государственного университета. Серия: Экономика. Информатика. 2012. №1-1 (120). URL: http://cyberleninka.ru/article/n/algoritmy-obnaruzheniya-osnovnogo-tona-rechevyhsignalov (дата обращения: 18.05.2016). 19. Рыболовлев, А.А. Основы цифровой фильтрации: Пособие / А.А. Рыболовлев, А.А. Афанасьев. – Орел: Академия ФАПСИ. 2013. – 121 с. 20. Солонина, А.И. Основы цифровой обработки сигналов: Учеб. Пособие / А.И. Солонина, Д.А. Улахович, С.М. Арбузов, Е.Б. Соловьева / Изд-е 2-е испр. и перераб. – Санкт – Петербург: БХВ Петербург. – 2005. 768 с.: ил. Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 69
21. Трахтман, А.М. Основы теории дискретных сигналов на конечных интервалах [Текст] / А.М. Трахтман, В.А. Трахтман. М, «Сов. радио». 1975. 208 с. 22. Zhengguang Xu. Channel Capacity Analysis of the Multiple Orthogonal Sequence Spread Spectrum Watermarking in Audio Signals [Электронный ресурс] / Zhengguang Xu, Chenghuan Ao, and Benxiong Huang // IEEE SIGNAL PROCESSING LETTERS. 2016. 23(1). pp. 20-24 URL: https://www.researchgate.net/publication/283805432_Channel_Capacity_Analysis_of_t he_Multiple_Orthogonal_Sequence_Spread_Spectrum_Watermarking_in_Audio_Signa ls (Дата обращения 26.04.2016) 23. Илюшин, М.В. Обоснование объективного критерия качества звучания синтезированного широкополосного речевого сигнала / М.В. Илюшин , О.О. Басов, А.В. Радаев, А.В. Степанов // Рязань, Вестник РГРТУ. 2010. 4(34). 24. Белов, С.П. О методе скрытного кодирования контрольной информации в речевые данные [Текст]/ С.П. Белов, Е.Г. Жиляков, П.Г. Лихолоб, В.П. Пашинцев // Инфокоммуникационные технологии. Саратов. Поволжский государственный университет телекоммуникаций и информатики, № 13(3). 2015. С. 325-333. 25. Жиляков, Е.Г. Определение возможного объёма внедряемой информации при скрытой передаче меток в речевых данных [Текст]/ Е.Г. Жиляков, П.Г. Лихолоб, С.Н. Девицына // Научные ведомости Белгородского государственного университета № 13 (132). выпуск 23/1, серия История. Политология. Экономика. Информатика. – Белгород: ГиК – 2012г. С. 222-226. 26. Жиляков, Е.Г. Об использовании распределения долей энергии по частотным диапазонам в задачах защиты речевых данных [Текст]/ А.В. Болдышев, Е.Г. Жиляков, П.Г. Лихолоб, Е.И. Прохоренко, А.А. Фирсова // Цифровая обработка сигналов и её применение – DSPA-2013. – М.: РНТОРЭС. Вып. XV, т. 1. 2013. – С. 198. 27. Крыжевич, Л.С. Стеганографические методы сокрытия данных в звуковых файлах на основе всплесковых преобразований // Л.С. Крыжевич, Д.А. Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 70
Белобородов // государственного электронный Auditorium: электронный университета. научный – журнал Курск: научный № 2, журнал 2014г. Курского «Аудиториум» http://auditorium.kursksu.ru. URL: http://auditorium.kursksu.ru/index.php?page=6&new=2 (Дата обращения 26.04.2016) Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 71
ПРИЛОЖЕНИЕ А Таблица А.1 – Диапазоны звуков предложения 1 Буквы Звуки 2 [р] [у] [к] [а] [в] [а] [д’] [и] [т’] [и] [л’] Начальная граница 3 37694 40007 44264 46044 48581 50122 53537 56929 61344 65031 66948 Конечная граница 4 39488 43632 45320 48580 50064 53755 56120 60673 64924 66515 69546 Длительность, отсчеты 5 1794 4330 1056 2536 1670 3633 2583 3834 3580 1484 2598 Длительность, сек 6 0.937 0.076 0.022 0.053 0.035 0.076 0.054 0.080 0.075 0.031 0.054 1 р у к о в о д и т е ль пауза п о т р е б о в а л пауза п р е к р а т и ть пауза п о с а д к у [п] [а] [т] [р’] [е] [б] [а] [в] [а] [л] 71381 73009 77191 79813 82781 87111 90945 93914 95522 100964 72907 75916 79657 82472 86925 90574 93543 95460 100346 103562 1526 2907 2466 2659 4144 3463 2598 1546 4824 2598 0.032 0.061 0.051 0.055 0.086 0.072 0.054 0.032 0.101 0.054 [п] [р’] [и] [к] [р] [а] [т’] [и] [т’] 105424 107458 108943 111552 114880 116674 122586 127188 130862 105950 108757 110984 113254 116303 120694 127106 130466 134853 526 1299 2041 1702 1423 4020 4520 3278 3991 0.011 0.027 0.043 0.035 0.030 0.084 0.094 0.068 0.083 [п] [а] [с] [а] [т] [к] [у] 137436 138506 142155 148773 157333 161266 165224 138375 141660 148401 154462 159622 163085 168502 939 3154 6246 5689 2289 1819 3278 0.020 0.066 0.130 0.119 0.048 0.038 0.068 Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 72
Таблица А.2 – Диапазоны звуков предложения 2 Буквы Звуки 2 [г’] [и] [р] [о] [и] Начальная граница 3 14558 20874 25969 30306 36970 Конечная граница 4 20264 24961 28723 34141 41120 Длительность, отсчеты 5 5706 4087 2754 3855 4150 Длительность, сек 6 0.119 0.085 0.057 0.080 0.087 1 г е р о и пауза в е р н у л и сь пауза д о [в’] [и] [р] [н] [у] [л’] [и] [с’] 41708 45270 49577 51494 57342 61185 64698 68470 44659 49231 53315 56461 61177 64332 68408 73689 2951 3961 3738 4967 3835 3147 3710 5219 0.061 0.083 0.078 0.104 0.080 0.066 0.077 0.109 [д] [а] 73776 78090 77514 82743 3738 4653 0.078 0.097 м о й пауза с пауза п о б е [м] [о] [й’] 83416 89911 93683 87350 93683 95569 3934 3772 1886 0.082 0.079 0.039 [с] 96135 103743 7608 0.159 [п] [а] [б’] [е] 108270 109150 114697 118896 109150 114935 120008 126881 880 5785 5311 7985 0.018 0.121 0.111 0.167 д [д] 126894 131026 4132 0.086 о й [а] [й’] 130842 136564 134300 140147 3458 3583 0.072 0.075 Длительность, отсчеты 5 6055 2896 7286 5077 Длительность, сек 6 0.126 0.060 0.152 0.106 Таблица А.3 – Диапазоны звуков предложения 3 Буквы Звуки 1 д е ж у 2 [д’] [и] [ж] [у] Начальная граница 3 7372 13577 16653 23845 Конечная граница 4 13427 16473 23939 28922 Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 73
Окончание таблицы А.3 Буквы Звуки 2 [р] [н] [ы] [й’] Начальная граница 3 28960 30915 35692 40168 Конечная граница 4 30314 34902 40168 43289 Длительность, отсчеты 5 1354 3987 4476 3121 Длительность, сек 6 0.028 0.083 0.093 0.065 1 р н ы й пауза п р и н ё с пауза о д ё ж н у ю пауза щ ё т к у [п] [р’] [и] [н’] [о] [с] 46937 48254 49495 54685 59123 67736 48179 49532 54196 58559 67247 75747 1242 1278 4701 3874 8124 8011 0.026 0.027 0.098 0.081 0.169 0.167 [а] [д’] [о] [ж] [н] [у] [йу] 87895 93687 100382 108456 118999 123914 125178 92784 100908 108392 112411 123174 124979 126842 4889 7221 8010 3955 4175 1065 1664 0.102 0.150 0.167 0.082 0.087 0.022 0.035 [ш’] [о] [т] [к] [у] 131979 137287 146268 150227 152610 137183 144605 147998 152603 159227 5204 7318 1730 2376 6617 0.108 0.153 0.036 0.050 0.138 Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 74
ПРИЛОЖЕНИЕ Б «Слуховое восприятие искажений речевого сигнала, вызванных кодированием» Вам предлагается прослушать 3 предложения качества студийной записи (48 кГц), воспроизводимые в оригинале и при наличии искажений в определенном наборе звуков. Необходимо оценить уровень слышимости данных икажений. Каждое предложение будет воспроизведено несколько раз с изменением параметра кодирования K.В зависимости от его величины, будет меняться слышимость искажений в речевом сигнале. Оценка эксперта №1. Во взрывные звуки предложения 1 был закодирован звук «г». В речевом сигнале закодированный звук проявляется как шум в виде «потрескивания». В случае, если вы услышали данный шум в звуках, выделенных оранжевым цветом, поставьте в графе «слышимость искажений (K=…)» знак «+». Таблица Б.1 – восприятие искажений в предложении 1 экспертом №1 Буквы 1 р Наличие искажений по факту 2 Искажений нет у Искажений нет к Искажения есть о Искажений нет в Искажений нет о Искажений нет Слышимость Слышимость Слышимость искажений искажений искажений (K=0.1) (K=0.5) (K=1) 3 4 5 + + Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 75
Продолжение таблицы Б.1 Буквы 1 Наличие искажений по факту 2 Слышимость Слышимость Слышимость искажений искажений искажений (K=0.1) (K=0.5) (K=1) 3 4 5 д Искажения есть + и Искажений нет т Искажения есть е Искажений нет ль Искажений нет пауза п Искажений нет Искажения есть о Искажений нет т р Искажения есть Искажений нет е Искажений нет б Искажения есть о Искажений нет в Искажений нет а Искажений нет л Искажений нет пауза Искажений нет п Искажения есть р Искажений нет е Искажений нет к Искажения есть р Искажений нет а Искажений нет т и ть пауза Искажения есть Искажений нет Искажения есть Искажений нет п Искажения есть + + + + + + + + + + + Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 76
Окончание таблицы Б.1 Буквы 1 Наличие искажений по факту 2 о Искажений нет с а Искажений нет Искажений нет д Искажения есть к Искажения есть у Искажений нет Слышимость Слышимость Слышимость искажений искажений искажений (K=0.1) (K=0.5) (K=1) 3 4 5 + В звонкие звуки предложения 2 был закодирован звук «о». В речевом сигнале закодированный звук проявляется как шум в виде «потрескивания». В случае, если вы услышали данный шум в звуках, выделенных оранжевым цветом, поставьте в графе «слышимость искажений (K=…)» знак «+». Таблица Б.2 – восприятие искажений в предложении 2 экспертом №1 Буквы 1 г Наличие искажений по факту 2 Искажения есть Слышимость Слышимость Слышимость искажений искажений искажений (K=0.1) (K=0.5) (K=1) 3 4 5 + + + е Искажений нет р Искажения есть о Искажений нет и Искажений нет пауза Искажений нет в е Искажения есть Искажений нет + р Искажения есть + Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 77
Окончание таблицы Б.2 Буквы 1 Наличие искажений по факту 2 н Искажения есть у Искажений нет л Искажения есть и Искажений нет сь пауза д Искажений нет Искажений нет Искажения есть о м Искажений нет Искажения есть о Искажений нет й Искажения есть пауза Искажений нет с Искажений нет пауза Искажений нет п Искажений нет о Искажений нет б е д Искажения есть Искажений нет Искажения есть о Искажений нет й Искажения есть Слышимость Слышимость Слышимость искажений искажений искажений (K=0.1) (K=0.5) (K=1) 3 4 5 + + + + + + + + + + В шипящие звуки предложения 3 был закодирован звук «д». В речевом сигнале закодированный звук проявляется как шум в виде «потрескивания». В случае, если вы услышали данный шум в звуках, выделенных оранжевым цветом, поставьте в графе «слышимость искажений (K=…)» знак «+». Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 78
Таблица Б.3 – восприятие искажений в предложении 3 экспертом №1 Буквы 1 д Наличие искажений по факту 2 Искажений нет е Искажений нет ж Искажения есть у Искажений нет р Искажений нет н Искажений нет ы й Искажений нет Искажений нет пауза Искажений нет п Искажений нет р Искажений нет и Искажений нет н Искажений нет ё Искажений нет с пауза о д Искажений нет Искажений нет Искажений нет Искажений нет ё ж Искажений нет Искажения есть н Искажений нет у Искажений нет ю Искажений нет пауза Искажений нет щ Искажения есть ё Искажений нет т Искажений нет к Искажений нет у Искажений нет Слышимость Слышимость Слышимость искажений искажений искажений (K=0.1) (K=0.5) (K=1) 3 4 5 Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 79
«Слуховое восприятие искажений речевого сигнала, вызванных кодированием» Вам предлагается прослушать 3 предложения качества студийной записи (48 кГц), воспроизводимые в оригинале и при наличии искажений в определенном наборе звуков. Необходимо оценить уровень слышимости данных искажений. Каждое предложение будет воспроизведено несколько раз с изменением параметра кодирования K.В зависимости от его величины, будет меняться слышимость искажений в речевом сигнале. Оценка эксперта №2. Во взрывные звуки предложения 1 был закодирован звук «г». В речевом сигнале закодированный звук проявляется как шум в виде «потрескивания». В случае, если вы услышали данный шум в звуках, выделенных оранжевым цветом, поставьте в графе «слышимость искажений (K=…)» знак «+». Таблица Б.4 – восприятие искажений в предложении 1 экспертом №2 Буквы 1 р Наличие искажений по факту 2 Искажений нет у Искажений нет к Искажения есть о Искажений нет в Искажений нет о Искажений нет д Искажения есть и Искажений нет т Искажения есть Слышимость Слышимость Слышимость искажений искажений искажений (K=0.1) (K=0.5) (K=1) 3 4 5 + + + Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 80
Продолжение таблицы Б.4 Буквы 1 Наличие искажений по факту 2 е Искажений нет ль Искажений нет пауза п Искажений нет Искажения есть о Искажений нет т р Искажения есть Искажений нет е Искажений нет б Искажения есть о Искажений нет в Искажений нет а Искажений нет л Искажений нет пауза Искажений нет п Искажения есть р Искажений нет е Искажений нет к Искажения есть р Искажений нет а Искажений нет т и ть пауза Искажения есть Искажений нет Искажения есть Искажений нет п Искажения есть о Искажений нет с а Искажений нет Искажений нет Слышимость Слышимость Слышимость искажений искажений искажений (K=0.1) (K=0.5) (K=1) 3 4 5 + + + + + + + + + Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 81
Окончание таблицы Б.4 Буквы 1 Наличие искажений по факту 2 д Искажения есть к Искажения есть у Искажений нет Слышимость Слышимость Слышимость искажений искажений искажений (K=0.1) (K=0.5) (K=1) 3 4 5 + В звонкие звуки предложения 2 был закодирован звук «о». В речевом сигнале закодированный звук проявляется как шум в виде «потрескивания». В случае, если вы услышали данный шум в звуках, выделенных оранжевым цветом, поставьте в графе «слышимость искажений (K=…)» знак «+». Таблица Б.5 – восприятие искажений в предложении 2 экспертом №2 Буквы 1 г Наличие искажений по факту 2 Искажения есть е Искажений нет р Искажения есть о Искажений нет и Искажений нет пауза Искажений нет в е Искажения есть Искажений нет р Искажения есть н Искажения есть Слышимость Слышимость Слышимость искажений искажений искажений (K=0.1) (K=0.5) (K=1) 3 4 5 + + + + Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 82
Продолжение таблицы Б.5 Буквы 1 Наличие искажений по факту 2 у Искажений нет л Искажения есть и Искажений нет сь пауза д Искажений нет Искажений нет Искажения есть о м Искажений нет Искажения есть о Искажений нет й Искажения есть пауза Искажений нет с Искажений нет пауза Искажений нет п Искажений нет о Искажений нет б е д Искажения есть Искажений нет Искажения есть о Искажений нет й Искажения есть Слышимость Слышимость Слышимость искажений искажений искажений (K=0.1) (K=0.5) (K=1) 3 4 5 + + + + + + + + В шипящие звуки предложения 3 был закодирован звук «д». В речевом сигнале закодированный звук проявляется как шум в виде «потрескивания». В случае, если вы услышали данный шум в звуках, выделенных оранжевым цветом, поставьте в графе «слышимость искажений (K=…)» знак «+». Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 83
Таблица Б.6 – восприятие искажений в предложении 3 экспертом №2 Буквы 1 д Наличие искажений по факту 2 Искажений нет е Искажений нет ж Искажения есть у Искажений нет р Искажений нет н Искажений нет ы й Искажений нет Искажений нет пауза Искажений нет п Искажений нет р Искажений нет и Искажений нет н Искажений нет ё Искажений нет с пауза о д Искажений нет Искажений нет Искажений нет Искажений нет ё ж Искажений нет Искажения есть н Искажений нет у ю Искажений нет Искажений нет пауза Искажений нет щ Искажения есть ё Искажений нет т Искажений нет к Искажений нет у Искажений нет Слышимость Слышимость Слышимость искажений искажений искажений (K=0.1) (K=0.5) (K=1) 3 3 3 Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 84
«Слуховое восприятие искажений речевого сигнала, вызванных кодированием» Вам предлагается прослушать 3 предложения качества студийной записи (48 кГц), воспроизводимые в оригинале и при наличии искажений в определенном наборе звуков. Необходимо оценить уровень слышимости данных искажений. Каждое предложение будет воспроизведено несколько раз с изменением параметра кодирования K.В зависимости от его величины, будет меняться слышимость искажений в речевом сигнале. Оценка эксперта №3. Во взрывные звуки предложения 1 был закодирован звук «г». В речевом сигнале закодированный звук проявляется как шум в виде «потрескивания». В случае, если вы услышали данный шум в звуках, выделенных оранжевым цветом, поставьте в графе «слышимость искажений (K=…)» знак «+». Таблица Б.7 – восприятие искажений в предложении 1 экспертом №3 Буквы 1 р Наличие искажений по факту 2 Искажений нет у Искажений нет к Искажения есть о Искажений нет в Искажений нет о Искажений нет д Искажения есть и Искажений нет т Искажения есть е Искажений нет ль Искажений нет Слышимость Слышимость Слышимость искажений искажений искажений (K=0.1) (K=0.5) (K=1) 3 4 5 + + + Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 85
Окончание таблицы Б.7 Буквы 1 пауза п Наличие искажений по факту 2 Искажений нет Искажения есть о Искажений нет т р Искажения есть Искажений нет е Искажений нет б Искажения есть о Искажений нет в Искажений нет а Искажений нет л Искажений нет пауза Искажений нет п Искажения есть р Искажений нет е Искажений нет к Искажения есть р Искажений нет а Искажений нет т и ть пауза Искажения есть Искажений нет Искажения есть Искажений нет п Искажения есть о Искажений нет с а Искажений нет Искажений нет д Искажения есть к Искажения есть у Искажений нет Слышимость Слышимость Слышимость искажений искажений искажений (K=0.1) (K=0.5) (K=1) 3 4 5 + + + + + + + + + + Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 86
В звонкие звуки предложения 2 был закодирован звук «о». В речевом сигнале закодированный звук проявляется как шум в виде «потрескивания». В случае, если вы услышали данный шум в звуках, выделенных оранжевым цветом, поставьте в графе «слышимость искажений (K=…)» знак «+». Таблица Б.8 – восприятие искажений в предложении 2 экспертом №3 Буквы 1 г Наличие искажений по факту 2 Искажения есть е Искажений нет р Искажения есть о Искажений нет и Искажений нет пауза Искажений нет в е Искажения есть Искажений нет р Искажения есть н Искажения есть у Искажений нет л Искажения есть и Искажений нет сь пауза д Искажений нет Искажений нет Искажения есть о м Искажений нет Искажения есть о Искажений нет й Искажения есть пауза Искажений нет с Искажений нет пауза Искажений нет Слышимость Слышимость Слышимость искажений искажений искажений (K=0.1) (K=0.5) (K=1) 3 3 3 + + + + + Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 87
Окончание таблицы Б.8 Буквы 1 п Наличие искажений по факту 2 Искажений нет о Искажений нет б е д Искажения есть Искажений нет Искажения есть о Искажений нет й Искажения есть Слышимость Слышимость Слышимость искажений искажений искажений (K=0.1) (K=0.5) (K=1) 3 3 3 + + + + + + + В шипящие звуки предложения 3 был закодирован звук «д». В речевом сигнале закодированный звук проявляется как шум в виде «потрескивания». В случае, если вы услышали данный шум в звуках, выделенных оранжевым цветом, поставьте в графе «слышимость искажений (K=…)» знак «+». Таблица Б.9 – восприятие искажений в предложении 3 экспертом №3 Буквы 1 д Наличие искажений по факту 2 Искажений нет е Искажений нет ж Искажения есть у Искажений нет р Искажений нет н Искажений нет ы й Искажений нет Искажений нет пауза Искажений нет п Искажений нет Слышимость Слышимость Слышимость искажений искажений искажений (K=0.1) (K=0.5) (K=1) 3 3 3 Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 88
Окончание таблицы Б.9 Буквы 1 р Наличие искажений по факту 2 Искажений нет и Искажений нет н Искажений нет ё Искажений нет с Искажений нет пауза Искажений нет о Искажений нет д Искажений нет ё Искажений нет ж Искажения есть н Искажений нет у Искажений нет ю Искажений нет пауза Искажений нет щ Искажения есть ё Искажений нет т Искажений нет к Искажений нет у Искажений нет Слышимость Слышимость Слышимость искажений искажений искажений (K=0.1) (K=0.5) (K=1) 3 3 3 Лист Изм. Лист № докум Подпись Дата 11070006.11.03.02.093.ПЗВКР 89
Отзывы:
Авторизуйтесь, чтобы оставить отзыв