Сохрани и опубликуйсвоё исследование
О проекте | Cоглашение | Партнёры
Выпускная квалификационная работа студента 11.03.02. Инфокоммуникационные технологии и системы связи
Источник: Белгородский государственный университет - национальный исследовательский университет (НИУ «БелГУ»)
Комментировать 0
Рецензировать 0
Скачать - 1,9 МБ
Enter the password to open this PDF file:
-
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ «БЕЛГОРОДСКИЙ ГОСУДАРСТВЕННЫЙ НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ» ( Н И У « Б е л Г У » ) ИНСТИТУТ ИНЖЕНЕРНЫХ ТЕХНОЛОГИЙ И ЕСТЕСТВЕННЫХ НАУК Кафедра информационно-телекоммуникационных систем и технологий РАЗРАБОТКА АЛГОРИТМА СЖАТИЯ ЗВУКОВЫХ СИГНАЛОВ НА ОСНОВЕ МЕТОДОВ СУБПОЛОСНОГО АНАЛИЗА Выпускная квалификационная работа студента очной формы обучения направления подготовки 11.03.02 Инфокоммуникационные технологии и системы связи 4 курса группы 07001208 Бакале Нчама Кинтилино Меланио Бакале Научный руководитель канд. техн. наук, доцент кафедры Информационнотелекоммуникационных систем и технологий НИУ «БелГУ» Прохоренко Е.И. Рецензент канд. техн. наук, проф. кафедры Прикладной информатики и информационных технологий НИУ «БелГУ» Черноморец А.А. БЕЛГОРОД 2016
СОДЕРЖАНИЕ ВВЕДЕНИЕ…………………………………………………………………………..3 1 АЛГОРИТМЫ И МЕТОДЫ СЖАТИЯ РЕЧЕВЫХ СИГНАЛОВ…...…….5 1.1 Фильтрация на основе КИХ-фильтров …………………………………...…7 1.2 Субполосное преобразование на основе использования банков КИХ- фильтров…………………………………………………………………………….13 ИССЛЕДОВАНИЕ СУБПОЛОСНОГО АЛГОРИТМА СЖАТИЯ 2 ЗВУКОВЫХ СИГНАЛОВ ……………………………………………………...…18 2.1 Расчёт вектора субполосного преобразования отрезка речево-го сигнала на основе КИХ-фильтров…………………………………………………………..18 2.2 Субполосное преобразование со сжатием…………………………………22 3 АНАЛИЗ РЕЗУЛЬТАТОВ РАБОТЫ АЛГОРИТМОВ СЖАТИЯ ЗВУКОВЫХ СИГНАЛОВ…………………………………………………………27 3.1 Частотный анализ восстановленных звуковых сигналов…………………27 3.2 Оценка погрешности восстановления, коэффициента сжатия и качества воспроизведения сигналов…………………………………………………………35 ЭКОНОМИЧЕСКАЯ ОЦЕНКА РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЯ..…39 4 ЗАКЛЮЧЕНИЕ……………………………………………………………………..45 СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ………………………………47 ПРИЛОЖЕНИЯ…………………………………………………………………….50 Изм. Лист Разраб. Провер. Рецензент Н. контр. Утв. № докум. Бакале Нчама К. М.Б. Прохоренко Е.И. Черноморец А.А. Прохоренко Е.И. Жиляков Е.Г. Подпись Дата 11070006.11.03.02.171.ПЗВКР Разработка алгоритма сжатия звуковых сигналов на основе методов субполосного анализа Лит. Лист Листов 2 54 НИУ «БелГУ», гр. 07001208
ВВЕДЕНИЕ В последние годы можно наблюдать взрывной рост в использовании сети Интернет и мобильных телефонов, а сближение двух этих технологий открывает широкий диапазон новых возможностей на уже процветающем рынке мультимедиа. Важной составляющей мультимедийного трафика является аудиоинформация [9]. Таким образом, актуальной является задача сжатия (кодирование) звуковых сигналов. Сжатие - одна из задач, решаемых в отрасли телекоммуникаций [8]. Необходимость сжатия присутствует как в коммуникациях, так и в самой информатике. Оказывается, немыслимым реализовывать переносы на высоких скоростях через сеть компьютеров без использования какой-то тип сжатия, которое позволяло бы уменьшить время передачи. То же самое происходит с устройствами хранения, которые, несмотря на то, что их объем постоянно увеличивается, позволяют гораздо более эффективно использовать вышеупомянутую технику. При передаче сигналов различных типов, необходимо оптимизировать характеристики сигнала с целью трансляции большего количества информации. Обычно это осуществляется посредством какого-либо метода сжатия, который обеспечивал бы минимум ошибок при восстановлении. Согласно общей теореме передачи информации [8] всегда возможно передавать информацию на скорости меньшей, чем способность канала с относительно маленькой ошибкой, даже в присутствии шума. Понятие пропускной способности канала также, как и размер информации и кодификации изучаются в теории информации. Средства передачи сигналов, которые используются ежедневно: электромагнитные волны, проводные металлические линии передачи и оптоволокна. Место, которое занимает кодифицированная информация (данные, цифровой сигнал, и т.д.) без сжатия – частное (отношение) между частотой отсчеЛист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 3
тов и разрешением. Следовательно, чем больше количество использованных бит, тем больше будет размер файла. Сжатие используется для того, чтобы передавать то же количество исходной информации, меньшим количеством бит [6]. Сжатие аудиосигналов (АС) может быть осуществлено как без потерь (архивация), так и с потерями, причем к последнему случаю относится субполосное преобразование. Цель данной работы является разработка алгоритма сжатия звуковых сигналов с использованием метода субполосного преобразования для уменьшения объема данных, сохраняемых на внешних носителях информации. Для достижения поставленной цели были определены следующие задачи: 1. Исследование методов сжатия звукового сигнала на основе субполосного кодирования; 2. Разработка алгоритмов сжатия речевого сигнала с использованием субполосного преобразования на основе КИХ-фильтрации; 3. Экономическая оценка результатов исследования. Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 4
АЛГОРИТМЫ И МЕТОДЫ СЖАТИЯ ЗВУКОВЫХ 1 СИГНАЛОВ Сжатие аудио (звука) – это форма сжатия данных, основанная на сокращении размера файлов аудио. Алгоритмы сжатия аудио обычно названы «кодекс» аудио. Существуют два типа сжатия, основанных на алгоритме сжатия без потери и на алгоритме сжатия с потерей [10]. Звук – это упругое колебание среды, которое распространяется в среде с помощью волн посредством колебания атомов и молекул. Как и любая волна, звук характеризуется скоростью, амплитудой и частотой [16]. Когда мы говорим об аудио, мы говорим о корректировании звука к другому способу, шагу к опоре. Существуют различные опоры аудио, как это может быть винил, магнитные ленты или цифровой формат как WAV, MP3 или OGG [10]. Сжатие аудио - процесс, из-за которого сокращается ставка бит цифрового сигнала аудио и как конец сокращение его веса к диску. Самое близкое или надежное аудио относительно реального звука - обычно WAV 32 бит и 192 кГц. По мере того, как сжимается аудио сокращается эта стоимость, с чем теряется верность относительно физического звука. Во время того, чтобы говорить о сжатии нужно учитывать две концепции: 1. Избыточность: повторные данные или легко предсказуемые; 2. Энтропия: новая или существенная информация, которая определяется как разность между полным количеством данных сообщения и его избыточностью. Информация, которую передают данные, может быть трех типов: 1. Избыточная: повторная или предсказуемая информация. Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 5
2. Неуместная (нерелевантная): информация, которую мы не можем оценивать, и устранение которого, следовательно, не касается содержание сообщения. 3. Основная: значимая (релевантная). Та, которая не является ни избыточной, ни неуместной. Та, которая должна быть переданной для того, чтобы было возможно восстанавливать сигнал. Имея в виду эти три типа информации, устанавливаются три типа типологии сжатия информации: 1. Без реальных потерь: то есть, передавая всю энтропию сообщения (вся основная и неуместная информация, но удаляя избыточную). 2. Субъективно без потерь (архивация): то есть, кроме удаления избыточной информации, удаляется также неуместная. 3. Субъективно с потерями: удаляется некое количество основной информации, следовательно, сообщение будет восстановлено воспринимаемыми, но терпимыми ошибками (например, видеоконференция). С ранее вышеупомянутым, для сжатия звуковых сигналов с потерями используют следующие кодификаторы, которые делятся на три класса: формы волны (waveform coders), источника (source coders) и гибриды (hybrid coders): 1. Кодификаторы формы волны (кодирование формы сигнала) пробуют производить сигнал, который был бы самым похожим на оригинал, и алгоритмы, которые они используют, обычно низкой комплексности. Так, например, ИКМ, дельта модуляция, ДИКМ, АДИКМ, дискретное косинусное преобразование, субполосное кодирование и т.д.; 2. Кодификаторы параметров речевого сигнала (вокодеры) – они работают, используя модель формы, в которой был произведен сигнал, и присоединяют с кодифицированным сигналом параметр вышеупомянутой модели, которая передана декодеру; 3. Гибридные кодификаторы - полувокодеры сочетают двух предыдущих, чтобы использовать их характеристики. Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 6
Наиболее эффективные методы сжатия речевых сигналов основаны на декомпозиции исходного сигнала на компоненты и кодировании этих компонент. Речевые сигналы относятся к классу нестационарных сигналов, что во многом затрудняет их корректную декомпозицию, т.к. большинство методов разложения сигналов, построены на предположении о стационарности разлагаемого сигнала [3]. Одним из основных методов обработки сигналов является линейное преобразование. Субполосное кодирование (применяются также термины «субполосная фильтрация», «субполосное преобразование», «подполосное кодирование») является частным случаем линейного преобразования и имеет многочисленные полезные свойства. 1.1 Фильтрация на основе КИХ-фильтров Цифровая фильтрация является одним из наиболее мощных инструментальных средств цифровой обработки сигналов. Цифровые фильтры способны удовлетворять таким техническим требованиям по своим параметрам, которых, в лучшем случае, было бы чрезвычайно трудно или даже невозможно достичь в аналоговом исполнении. Кроме того, характеристики цифрового фильтра могут быть легко изменены программно. Поэтому они широко используются в телекоммуникациях, в приложениях адаптивной фильтрации, таких как подавление эха в модемах, подавление шума и распознавание речи [1-3]. Процесс проектирования цифровых фильтров состоит из тех же этапов, что и процесс проектирования аналоговых фильтров. Сначала формулируются требования к желаемым характеристикам фильтра, по которым затем рассчитываются параметры фильтра. Амплитудная и фазовая характеристики формируются аналогично аналоговым фильтрам. Ключевое различие между аналоговым и цифровым фильтрами заключается в том, что, вместо вычисления величин сопротивлений, емкостей и индуктивностей для аналогового фильтра, рассчиЛист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 7
тываются значения коэффициентов для цифрового фильтра. Иными словами, в цифровом фильтре числа заменяют физические сопротивления и емкости аналогового фильтра. Эти числа являются коэффициентами фильтра, они постоянно находятся в памяти и используются для обработки (фильтрации) дискретных данных, поступающих от АЦП. Цифровой фильтр, работающий в реальном масштабе времени, оперирует с дискретными по времени данными в противоположность непрерывному сигналу, обрабатываемому аналоговым фильтром. При этом очередной отсчет, соответствующий отклику фильтра, формируется по окончании каждого периода дискретизации. Существует два основных типа цифровых фильтров: фильтры с конечной импульсной характеристикой (КИХ) и фильтры с бесконечной импульсной характеристикой (БИХ). Как следует из терминологии, эта классификация относится к импульсным характеристикам фильтров. Изменяя веса коэффициентов и число звеньев КИХ-фильтра, можно реализовать практически любую частотную характеристику. КИХ-фильтры могут иметь такие свойства, которые невозможно достичь методами аналоговой фильтрации (в частности, совершенную линейную фазовую характеристику). Но высокоэффективные КИХфильтры строятся с большим числом операций умножения с накоплением и поэтому требуют использования быстрых и эффективных процессоров DSP. Другим способом реализации КИХ или БИХ фильтрации являются решетчатые фильтры, которые часто используются в задачах обработки речи. Цифровые фильтры применяются в приложениях адаптивной фильтрации, благодаря своему быстродействию и простоте изменения характеристик воздействием на его коэффициенты. Элементарной формой КИХ-фильтра является фильтр скользящего среднего (moving average), показанный на рис. 1.1. Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 8
Рисунок 1.1 - КИХ-фильтр скользящего среднего Фильтры скользящего среднего популярны для сглаживания данных. Входные отсчеты x(n) пропускаются через ряд регистров памяти (помеченных z–1 в соответствии с представлением элемента задержки при z- преобразовании). В приведенном примере имеется четыре каскада, соответствующих 4-точечному фильтру скользящего среднего. Каждый отсчет умножается на 0,25, и результаты умножения суммируются для получения значения скользящего среднего, которое подается на выход y(n). На рисунке также представлено общее уравнение фильтра, скользящего среднего на N точек. Вновь обращаем внимание, что N относится к числу точек при вычислении фильтра, а не к разрешающей способности АЦП или ЦАП, как в предыдущих разделах. Обобщенная форма КИХ-фильтра с числом звеньев N представлена на рисунке 1.2. Рисунок 1.2 - Обобщенная форма КИХ-фильтра Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 9
Как было сказано, КИХ-фильтр должен работать в соответствии с уравнением, задающим свертку: N 1 Y ( n) h( k ) x ( n) h( k ) x ( n k ) (1.1) k 0 где h(k) – массив коэффициентов фильтра и x(n-k) – входной массив данных фильтра. Число N в уравнении представляет собой число звеньев и определяет эффективность фильтра, как было сказано выше. КИХ-фильтр с числом звеньев N требует N циклов (операций) умножения с накоплением. Проектирование КИХ-фильтров базируется, в первую очередь, на том, что частотная характеристика фильтра определяется импульсной характеристикой, а во-вторых, на том, что коэффициенты фильтра определяются его квантованной импульсной характеристикой. Рисунок 1.3 – Импульсная характеристика КИХ-фильтра На вход КИХ-фильтра подается одиночный импульс, и по мере прохождения этого импульса через элементы задержки, на выходе поочередно формируются коэффициенты фильтра. Таким образом, процесс проектирования КИХфильтра состоит в определении его импульсной характеристики по желаемой частотной характеристике с последующим квантованием импульсной характеристики в ходе генерации коэффициентов фильтра. Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 10
В дискретной системе операция свертки может быть представлена рядом операций умножения с накоплением. Операция свертки во временной или частотной области эквивалентна умножению "точки на точку" в соответствующей дуальной области. Например, свертка во временной области эквивалентна умножению в частотной области. Очевидно, что фильтрация в частотной области может быть выполнена умножением на 1 всех частотных компонентов в полосе пропускания и умножением на 0 всех частотных компонентов в полосе задержки. И наоборот, свертка в частотной области эквивалентна умножению "точки на точку" во временной области. Рисунок 1.4 - Цифровая фильтрация Функция передачи в частотной области (1 или 0) может быть отображена во временную область с использованием дискретного преобразованием Фурье (ДПФ) (на практике используется БПФ). Во временной области это дает импульсную характеристику фильтра. Так как умножение в частотной области (спектр сигнала умножается на функцию передачи фильтра) эквивалентно свертке во временной области (сигнал свернут с импульсной характеристикой), то сигнал может быть отфильтрован путем вычисления его свертки с импульсной характеристикой фильтра. Задача фильтрации с использованием КИХфильтра является в точности таким процессом. Так как мы имеем дело с дисЛист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 11
кретной системой, сигнал и импульсная характеристика квантуются по времени и амплитуде, давая в результате набор дискретных отсчетов. Дискретные отсчеты, включающие желаемую импульсную характеристику, являются коэффициентами КИХ-фильтра [3]. Математический аппарат, применяемый при проектировании фильтров, в основном базируется на преобразованиях Фурье. В непрерывных по времени системах в качестве обобщенного преобразования Фурье может рассматриваться преобразование Лапласа. Подобным способом можно обобщить преобразование Фурье для дискретных по времени систем, и результат такого обобщения известен как z-преобразование. Необходимо подчеркнуть, что используемый в настоящее время подход к частотной фильтрации на основе применения КИХ-фильтров не позволяет осуществить выделение составляющей, которая определяется только энергией смеси, сосредоточенной в заданной частотной полосе. Кроме того, при построении КИХ-фильтров используются критерии, гарантирующие оптимальность только с точки зрения минимума погрешности приближения к прямоугольному виду трансформанты Фурье их импульсной характеристики. При этом не рассматривается оптимальность выходных последовательностей КИХ-фильтров с позиций погрешности приближения в заданном частотном интервале трансформанты Фурье исходного отрезка данных. Однако, трансформанта Фурье выделяемой аддитивной компоненты должна быть оптимальной в смысле наилучшего среднеквадратического приближения трансформанты Фурье смеси в заданном частотном интервале и нулевого значения вне его (частотного интервала). Таким образом, необходимо разработать математические основы метода линейной частотной фильтрации, позволяющего выделить из обрабатываемой последовательности данных аддитивную составляющую, оптимальную в указанном выше смысле, и зависящую только от доли энергии исходной смеси, сосредоточенной в заданном частотном интервале. Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 12
Разработка математических основ такой линейной частотной фильтрации и составляет основное содержание следующих параграфов раздела. 1.2 Субполосное преобразование на основе использования банков КИХ-фильтров Существенную долю объема трафика в информационно- телекоммуникационных системах составляет обмен звуковыми данными. В связи с этим интенсивно развиваются методы сокращения объемов битовых представлений звуковых файлов (сжатия данных), что привело к созданию ряда форматов кодирования данных с потерями, например, MP3. Для сохранения приемлемого уровня качества воспроизведения звука при кодировании данных с целью сжатия принято учитывать свойства человеческого слуха, которые описываются с помощью так называемой психоакустической модели. Основу психоакустической модели составляют частотные представления, что приводит к необходимости избирательно преобразовывать спектральные компоненты из различных частотных диапазонов. В настоящее время все большее распространение получает подход на основе так называемого субполосного кодирования Традиционно кодеры, основанные на линейном преобразовании, делятся на две группы: кодеры с преобразованием и субполосные кодеры. Субполосное кодирование реализуется путем свертки сигнала с несколькими полосовыми фильтрами и децимацией результата. Совокупность набора фильтров с дециматорами называется банком или блоком фильтров. Каждый получившийся в результате преобразования сигнал несет в себе информацию о спектральной составляющей исходного сигнала при некотором пространственном (временном) масштабе. Так происходит анализ сигнала. Для обратного синтеза сигнала (его реконструкции) выполняется операция интерполяции субполосных сигналов, фильтрация и их сложени [2, 10]. Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 13
При субполосном кодировании исходный вектор значений сигнала x заменяется вектором такой же размерности y ( y '1 , y '2 ,..., y ' R )T , (1.2) где R – количество интервалов, на которые разбивается ось нормированных частот; yr ( yk1 ,..., ykM )T – подвектор, который отражает частотные свойства исk ходного сигнала в некотором частотном интервале Vk [ k 2 , k1 ) [ k1 , k 2 ) ; (1.3) k = 1, 2, … , R; R M k 1 k N ; M 2 ; M 2 . Представляется естественным вектор y r называть субполосным преобра зованием исходного вектора x . В известных подходах к субполосному кодированию используется разбиение оси частот на интервалы одинаковой длины, так что k 2 k1 const , R (1.4) и поэтому выполняются равенства k1 (k 1) ; R k 2 k R . (1.5) При этом размерности подвекторов в (3.1) выбираются одинаковыми и равными Mk M N , R (1.6) так что общая размерность N выбирается кратной количеству частотных интервалов R. Для получения компонент подвекторов субполосного преобразования (3.1) в настоящее время используется КИХ-фильтрация с прореживанием выходных последовательностей КИХ-фильтров, так что N yki h1k (i 1) L n X n , n 1 i 1, ..., M , (1.7) Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 14
где hrk – импульсная характеристика k-того КИХ-фильтра с полосой пропускания вида (1.4), границы которой определяются из соотношений (1.5); r=1, 2, … , R; L – длительность импульсных характеристик. Большинство методов синтеза фильтров направлено на устранение наложения спектров («элайзинга»), возникающего при децимации. Идеальный банк фильтров должен включать фильтры с прямоугольной характеристикой, предотвращающие вместе с тем элайзинг. На рис. 1.5 показана система, осуществляющая такое преобразование при помощи банков фильтров анализа-синтеза. Рисунок 1.5 - Банк фильтров анализа-синтеза Обозначения на рисунке являются стандартными для цифровой обработки сигналов. H 1 ( ) означает операцию круговой свертки входного сигнала длиной N с импульсной характеристикой КИХ-фильтра h(n) и Фурьепреобразование результата: H i ( ) hi ne jn (1.8) n Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 15
Блоки ki означают децимацию в ki раз, блоки ki - интерполяцию в ki раз. Децимация означает оставление лишь каждого ki отсчета, интерполяция означает вставку ki -1 нулей между этими отсчетами. Предполагается, что ki целые числа и делят N. Такая система называется системой А-С. Секция анализа системы А-С выполняет линейное преобразование над входным сигналом х(n) длиной n. В результате получается М последовательностей уi (n) длиной N/ki. Операции, выполняемые секцией синтеза, являются обратными операциям секции анализа. В результате получается сигнал xˆ (n) . Точно так же строится система А-С и для многомерного сигнала. Таким образом, коэффициенты преобразования вычисляются через свертку и различные участки сигнала будут обрабатываться одинаковым образом. Далее, формулирование проблемы в частотной области позволяет легко разделить ошибку реконструкции (n) xˆ (n) x(n) на две части: элайзинговую составляющую и составляющую, инвариантную к сдвигу. Для этого запишем выходной сигнал схемы анализа в частотной области: Yi ( ) 1 k 1 2j 2j Hi k X k k , k j 0 k (1.9) Тогда выходной сигнал схемы А-С 1 X ( ) k M 1 Y (k )G ( ) , i 0 i i (1.10) С учетом эффекта интерполяции и децимации в частотной области. Объединяя выражения (1.8) и (1.9), получаем 1 M 1 1 k 1 2j M 1 2j X ( ) H i Gi X X Hi Gi , k i 0 k j 1 k i 0 k (1.11) Здесь первое слагаемое соответствует отклику линейной время независимой системе, а второе соответствует элайзингу системы. Относительная среднеквадратичная погрешность аппроксимации спектров исходного вектора в соответствующем частотном интервале, в основном, обусловлена малым количеством используемых прореженных данных, что соЛист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 16
гласно теории Найквиста, приводит к наложению частот (элайзингу), а также зависит от степени подавления спектральных компонент в полосах непропускания и ширины переходных полос КИХ-фильтров. Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 17
ИССЛЕДОВАНИЕ СУБПОЛОСНОГО АЛГОРИТМА 2 СЖАТИЯ ЗВУКОВЫХ СИГНАЛОВ В данном разделе работы представлены алгоритмы сжатия звуковых сигналов субполосными методами. В качестве исходных данных для исследований использовались речевые сигналы. 2.1 Расчёт вектора субполосного преобразования отрезка речевого сигнала на основе КИХ-фильтров В этой части работы выполним сжатие речевого сигнала с использованием субполосного преобразования методом, основанным на использовании банков КИХ-фильтров. Алгоритм задается следующей последовательностью действий: 1. создать и (или) загрузить звуковой файл формата *.wav, содержащий речевые данные с частотой дискретизации 8 кГц; 2. рассчитать импульсные характеристики для R – количество частотных интервалов; 3. получить выходные последовательности фильтров; 4. рассчитать вектор субполосного преобразования, осуществив децимацию полученных выходных последовательностей (секция анализа рис. 1.5); 5. выполнить обратное субполосное преобразование (синтез или интерполяция), добавив нули на место удаленных отсчетов; 6. фильтрация; 7. сложить все отфильтрованные отрезки и каждый отсчет умножить на число равное количеству фильтров. В данной работе для расчета импульсной характеристики можно использовать стандартную функцию MatLab cremez. Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 18
Пример расчета импульсных характеристик полосового КИХ-фильтра с длиной импульсной характеристики 512: L =512; % длина импульсной характиристики фильтра le=le/2; c=0.005; % переходная полоса фильтра v1=0.5; % нижняя нормированная частота среза фильтра v2=0.5625; % верхняя нормированная частота среза фильтра V=[0 (v1-c) v1 v2 (v2+c) 1]; % задание полос задержки и пропускания фильтра h=cremez(L,V,'bandpass'); % расчет характеристики фильтра figure(1), freqz(h,1, L); % построение графиков АЧХ и ФЧХ фильтра Рисунок 2.1 - АЧХ и ФЧХ полосового фильтра Банка фильтров (0.5000 - 0. 5625) Для расчета ФНЧ в функции cremez используется параметр lowpass, а для расчета ФВЧ – параметр highpass. Например: h=cremez(L,[0 (v1) (v1+c) 1],'lowpass'); или h=cremez(L,[0 (v1-c) (v1) 1],'highpass'). Листинг программы сжатия звукового сигнала вложен в приложение А. Для иллюстрации результата привезли следующие графики: Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 19
1) Исходный сигнал. Рисунок 2.3 соответствует представлению первого сигнала, соответствующего звуку «ТРАМВАЙ». Рисунок 2.2 – Исходный речевой сигнал, соответствующий звуку «ТРАМВАЙ» 2) Восстановленный сигнал. Рисунок 2.3 – Восстановленный речевой сигнал 1 по первому методу Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 20
3) Графики сравнения: исходный и восстановленный сигналы и их спектры. Рисунок 2.4 – График исходного сигнала (сплошная линия) и восстановленного сигнала (пунктирная линия) На рисунке 2.4 прослеживается восстановление формы исходного сигнала с некоторым уменьшением мощности и увеличение погрешности (накопление ошибки). На рисунке 2.5 представлены спектры одного выбранного отрезка исходного и восстановленного сигналов. Спектры построили с помощью программы GUI SPTool (Signal Processing Toolbox — средства обработки сигнала). Она разработана на основе пакета расширения Signal Processing Toolbox и предназначена для решения следующих задач, связанных с моделированием цифровой фильтрации [13]: • синтез и анализ ЦФ; • импорт входного сигнала; • моделирование цифровой фильтрации; • анализ сигналов во временной и в частотной областях; • экспорт данных из GUI SPTool. Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 21
Рисунок 2.5 – Спектры отрезка исходного (сплошная линия) и восстановленного сигналов (пунктирная линия), соответствующие звуку «Т» слова «ТРАМВАЙ» 2.2 Субполосное преобразование со сжатием Сжатие при субполосном преобразовании звукового сигнала может быть достигнуто за счет различного коэффициента децимации для разных выходных последовательностей КИХ-фильтров. Чем более низкочастотный диапазон полосы пропускания КИХ-фильтра, тем в большее количество раз можно осуществить децимацию. Значение коэффициента децимации определяется по формуле: n R 1 ; k ; i = 1, 2, … , R; k i R (2.1) где п - коэффициент децимации; R – количество частотных интервалов. Результат децимации имеет следующий вид (рис. 2.6): Рисунок 2.6 – Результат децимации при различных коэффициентах децимации Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 22
Алгоритм задается следующей последовательностью действий: 1. создать и (или) загрузить звуковой файл формата *.wav, содержащий речевые данные с частотой дискретизации 8 кГц; 2. рассчитать импульсные характеристики для R – количество частотных интервалов; 3. получить выходные последовательности фильтров; 4. осуществить децимацию выходных последовательностей выбрав различный коэффициент децимации; 5. рассчитать вектор субполосного преобразования, осуществив децимацию полученных выходных последовательностей (секция анализа рис. 1.5); 6. выполнить обратное субполосное преобразование (синтез или интерполяция), добавив нули на место удаленных отсчетов; 7. фильтрация; 8. сложить все отфильтрованные отрезки и каждый отсчет умножить на число равное количеству фильтров. На рисунках 2.7-2.8 приведены полученные результаты. Графики восстановленного сигнала (рис. 2.6) и сравнительный график исходного сигнала с восстановленным (рис. 2.7) (второй метод). Рисунок 2.7 – Восстановленный сигнал 1 при втором методе Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 23
На рисунке 2.7 очевидно сильнее уменьшение мощности и увеличение погрешности восстановления исходного сигнала (рис. 2.2) по сравнению с восстановленным сигналом по первому методу (рис. 2.3). Это отражается на качестве воспроизведения сигнала. Рисунок 2.8 – Исходный (сплошная линия) и восстановленный (пунктирная линия) сигналы На рисунке 2.8 можно видеть большие искажения у восстановленного сигнала. Погрешность восстановления увеличилась. Рисунок 2.9 – Спектры отрезка исходного (сплошная линия) и восстановленного сигналов (пунктирная линия), соответствующие звуку «Т» слова «ТРАМВАЙ» Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 24
На рисунке 2.10 приведены графики трех сигналов (исходный сигнал и сигналы, восстановленные двумя методами). На рисунке 2.10 прослеживается восстановление формы исходного сигнала с некоторым уменьшением мощности и увеличение погрешности (накопление ошибки). Рисунок 2.10 – Исходный и восстановленные сигналы На рисунках 2.11-2.12 представлены осциллограммы и спектры отрезка исходного и восстановленных сигналов, соответствующие звуку «Т» слова «ТРАМВАЙ». Рисунок 2.11 – Осциллограммы отрезка исходного (сплошная линия) и восстановленного сигналов (пунктирная линия), соответствующие звуку «Т» слова «ТРАМВАЙ» Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 25
Рисунок 2.12 – Спектры отрезка исходного (сплошная линия) и восстановленных сигналов (пунктирные линии), соответствующие звуку «Т» слова «ТРАМВАЙ»: Спектр 1 – Спектр исходного сигнала; Спектр 2 – Спектр восстановленного сигнала по первому методу; Спектр 3 – Спектр восстановленного сигнала по второму методу Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 26
АНАЛИЗ РЕЗУЛЬТАТОВ РАБОТЫ АЛГОРИТМОВ 3 СЖАТИЯ ЗВУКОВЫХ СИГНАЛОВ 3.1 Частотный анализ восстановленных звуковых сигналов Ниже приведены результаты, полученные при исследовании различных речевых сигналов при их обработке двумя методами. Исходные данные: звуковые файлы формата *.wav, содержащие речевые данные с частотой дискретизации 8 кГц и расширение 16 бит. Результаты исследования второго сигнала «ЧЕРЕПАХА». Рисунок 3.1 – Исходный сигнал, соответствующий звуку «ЧЕРЕПАХА» а б Рисунок 3.2 – Восстановленные сигналы а) по первому методу; б) по второму методу Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 27
Подробное представление исходного сигнала с восстановленными сигналами. На рисунке 3.3 прослеживается восстановление формы исходного сигнала с некоторым уменьшением мощности и увеличение погрешности. Рисунок 3.3 – Исходный (сплошная линия) и восстановленные сигналы (пунктирная линия и линия с точками) На рисунке 3.4 представлены типичные спектры исходного и восстановленных сигналов, соответствующие звуку «Ч» слова «ЧЕРЕПАХА». Рисунок 3.4 – Спектры отрезка исходного (сплошная линия) и восстановленных сигналов (пунктирные линии), соответствующие звуку «Ч» слова «ЧЕРЕПАХА»: Спектр 1 – Спектр исходного сигнала; Спектр 2 – Спектр восстановленного сигнала по первому методу; Спектр 3 – Спектр восстановленного сигнала по второму методу Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 28
Результаты исследования третьего сигнала «РЯДОМ». Рисунок 3.5 – Исходный сигнал, соответствующий звуку «РЯДОМ» б а Рисунок 3.6 – Восстановленные сжатые сигналы а) по первому методу; б) по второму методу Подробное представление исходного сигнала с восстановленными сигналами (рисунки 2.17-2.18). На рисунке 2.17 прослеживается восстановление формы исходного сигнала с некоторым уменьшением мощности и увеличение погрешности. На рисунке 2.18 представлены типичные спектры типичные спектры исходного и восстановленных сигналов, соответствующие звуку «О» слова «РЯДОМ». Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 29
Рисунок 3.7 – Исходный (сплошная линия) и восстановленные сигналы (пунктирная линия и линия с точками) Рисунок 3.8 – Спектры отрезка исходного (сплошная линия) и восстановленных сигналов (пунктирные линии), соответствующие звуку «Ч» слова «ЧЕРЕПАХА»: Спектр 1 – Спектр исходного сигнала; Спектр 2 – Спектр восстановленного сигнала по первому методу; Спектр 3 – Спектр восстановленного сигнала по второму методу Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 30
Результаты исследования четвертого сигнала «БЕЛГОРОД». Рисунок 3.9 – Исходный сигнал, соответствующий звуку «БЕЛГОРОД» а б Рисунок 3.10 – Восстановленные сжатые сигналы а) по первому методу б) по второму методу Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 31
Подробное представление исходного сигнала с восстановленными сигналами. На рисунке 3.11 прослеживается восстановление формы исходного сигнала с некоторым уменьшением мощности и увеличение погрешности. На рисунке 2.22 представлены типичные спектры исходного и восстановленных сигналов, соответствующие звуку «Е» слова «БЕЛГОРОД». Рисунок 3.11 – Исходный (сплошная линия) и восстановленные сигналы (пунктирная линия и линия с точками) Рисунок 3.12 – Спектры отрезка исходного (сплошная линия) и восстановленных сигналов (пунктирные линии), соответствующие звуку «Е» слова «БЕЛГОРОД»: спектр 1 – спектр исходного сигнала; спектр 2 – спектр восстановленного сигнала по первому методу; спектр 3 – спектр восстановленного сигнала по второму методу Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 32
Результаты исследования пятого сигнала «КОМПЬЮТЕР». Этот сигнал был записан при наличии внешнего шума. Рисунок 3.13 – Исходный сигнал, соответствующий звуку «КОМПЬЮТЕР» б а Рисунок 3.14 – Восстановленные сжатые сигналы а) по первому методу б) по второму методу Подробное представление исходного сигнала с восстановленными сигналами (рисунки 3.15-3.16). На рисунке 2.26 прослеживается восстановление Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 33
формы исходного сигнала с некоторым уменьшением мощности и увеличение погрешности. На рисунке 3.15 представлены спектры типичные спектры исходного и восстановленных сигналов, соответствующие звуку «О» слова «КОМПЬЮТЕР». Рисунок 3.15 – Исходный (сплошная линия) и восстановленные сигналы (пунктирная линия и линия с точками) Рисунок 3.16 – Спектры отрезка исходного (сплошная линия) и восстановленных сигналов (пунктирные линии), соответствующие звуку «Ю» слова «КОМПЬЮТЕР»: спектр 1 – спектр исходного сигнала; спектр 2 – спектр восстановленного сигнала по первому методу; спектр 3 – спектр восстановленного сигнала по второму методу Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 34
3.2 Оценка погрешности восстановления, коэффициента сжатия и качества воспроизведения сигналов Оценка эффективности работы алгоритма подобного рода достаточно сложна. Один из подходов к решению данной задачи состоит в вычислении погрешности восстановления РС и коэффициента сжатия. 1. Погрешность восстановления отрезков речевого сигнала. Для вычисления погрешности восстановления можно воспользоваться формулой для вычисления среднеквадратической погрешности: ( x xˆ ) x i i 2 i 2 , (3.1) где x(n) – исходный сигнал, xˆ (n) – восстановленный сигнал. 0,3423 . 2. Коэффициент сжатия. Коэффициент сжатия — основная характеристика алгоритма сжатия. Она определяется как отношение объёма исходных несжатых данных к объёму сжатых [11-12]. Ксж = VП/VИС, (3.2) где VИС – объём исходных данных, VП – объём отчетов после субполосного преобразования. Таким образом, чем выше коэффициент сжатия, тем алгоритм эффективнее. Следует отметить: если k = 1, то алгоритм не производит сжатия, то есть выходное сообщение оказывается по объёму равным входному; если k <1, то алгоритм порождает сообщение большего размера, нежели несжатое, то есть, совершает «вредную» работу. К СЖ 8000 8000 1,0081. 256 31 7936 Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 35
При этом коэффициенте сжатия, можно сказать, что сжатие не происходит. 3. Оценка качества воспроизведения. Сжатие аудиосигналов с потерями основывается полностью на характеристиках человеческого слушания [16]. Поэтому чтобы оценить качества сжатых сигналов необходимо определить качество воспроизведения на слух. В таблице 3.1 приведены оценки качества воспроизведения, исследованных сигналов на слух несколько людей. В этой таблице сигналы 1-5, сигналы, использованные при эксперименте. Таблица 3.1 - Оценки воспроизведения на слух людей Сигналы 1 2 3 4 5 4 5 5 4 5 5 5 4 4 5 Оценки воспроизведения на слух (пятибалльная шкала) 5 4 5 4 5 4 5 5 5 5 5 5 5 5 5 5 4 5 3 4 5 5 4 3 5 5 5 5 5 5 Средняя 5 5 5 4 5 4 5 5 4 5 4,5 5 4,8 4,0 5 Полученные результаты оценки работы алгоритма сжатия звуковых сигналов на основе использования банков КИХ-фильтров при одинаковых частотных интервалах децимации внесены в таблицу 3.2, где: Сигналы 1-5 – использованные сигналы в эксперименте; V1 – количество отчетов в исходном сигнале; V2 – количество отчетов после субполосного преобразования (до восстановления); Ɛ – погрешность восстановления (среднеквадратическая погрешность); КСЖ – коэффициент сжатия сигнала; ОК – оценка качества воспроизведения звука (пятибалльная шкала). Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 36
Таблица 3.2 - Оценка эффективности работы алгоритма сжатия Сигнал 1 2 3 4 5 V1 8000 6656 4780 8187 10703 Ɛ 0,3423 0,3574 0,4021 0,4771 0,3467 V2 7936 6656 4608 7936 10496 КСЖ 1,0081 1 1,0373 1,0316 1,0197 Средняя ОК 4,5 5 4,8 4,0 5 По полученным результатам можно сделать вывод, что по первому методу сжатие не происходить или происходить, удаляя неуместную (нерелевантную) информацию (речь). Все сигналы воспринимаются очень хорошо на слух. Для второго метода получены следующие результаты: 1. Вычислили погрешность восстановления: 0,8874 . 2. Коэффициент сжатия равен: К СЖ 8000 8000 1,8046 . 143 31 4433 3. Оценка качества воспроизведения. В таблице 3.3 приведены оценки качества воспроизведения, исследованных сигналов на слух несколько людей. Полученные результаты оценки работы алгоритма сжатия звуковых сигналов на основе использования банков КИХ-фильтров при различных коэффициентах децимации внесены в таблицы 3.3 и 3.4. Таблица 3.3 - Оценки воспроизведения на слух людей Сигналы 1 2 3 4 5 2 4 2 1 2 3 3 2 2 3 Оценки воспроизведения на слух (пятибалльная шкала) 3 2 2 3 2 3 4 4 3 4 4 4 3 1 3 2 2 3 1 1 2 1 2 2 2 2 3 1 2 1 Средняя 2 4 1 1 3 2 3 2 1 2 2,4 3,7 2,1 1,4 2,1 Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 37
Таблица 3.4 - Оценка эффективности работы алгоритма сжатия Сигнал 1 2 3 4 5 V1 8000 6656 4780 8187 10703 V2 4433 3718 2574 4433 5863 Ɛ 0,8874 0,8732 0,9014 0,9322 0,9068 КСЖ 1,8046 1,7902 1,8570 1,8468 1,8255 Средняя ОК 2,4 3,7 2,1 1,4 2,1 По полученным результатам можно сделать вывод, что по второму методу сжатие происходить так как коэффициент сжатия и погрешность восстановления сжатых сигналов большие. Восстановленные сигналы воспринимаются на слух с воспринимаемыми, но терпимыми ошибками. В таблице приведена сводная таблица результатов, полученных двумя методами. Таблица 3.5 - Сводная таблица для двух методов Сигнал V1 1 2 3 4 5 8000 6656 4780 8187 10703 1 2 3 4 5 8000 6656 4780 8187 10703 V2 Ɛ Первый метод 7936 0,3423 6656 0,3574 4608 0,4021 7936 0,4771 10496 0,3467 Второй метод 4433 0,8874 3718 0,8732 2574 0,9014 4433 0,9322 5863 0,9068 КСЖ Средняя ОК 1,0081 1 1,0373 1,0316 1,0197 4,5 5 4,8 4,0 5 1,8046 1,7902 1,8570 1,8468 1,8255 2,4 3,7 2,1 1,4 2,1 Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 38
ЭКОНОМИЧЕСКАЯ 4 ОЦЕНКА РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЯ Основной целью научно-исследовательской или опытно-конструкторской работы является проведение работ, направленных на анализ, проектирование или разработку каких-либо устройств. Результатом таких работ могут являться разработанный прототип прибора или программный продукт, выполняющий определенные функции, рекомендации по эксплуатации прибора или технологии, нормативные акты и т.д. [20-21]. Планирование работ по исследованию 4.1 В реализации исследования заняты следующие специалисты: - главный инженер или старший научный сотрудник (заведующий лабораторией), осуществляющий общее руководство исследованием; - инженер І категории или младший научный сотрудник, проводящий разработку, исследование, необходимые расчеты, составляющий техническую документацию на исследование; - экономист, дающий экономическую оценку исследования [20]. Расчет сроков проведения и трудоемкости представлен в таблице 4.1. Таблица 4.1 - Планирование работ по исследованию Наименование этапов Исполнитель работ 1 2 1.Подготовительный 1.1.Сбор информации Младший научный сотрудник 1.2.Выработка идеи Старший научный сотрудник 1.3.Определение объ- Младший научный сотрудник ема исследовательских работ Трудоемкость, час 3 Продолжи тельность, дней 4 40 40 24 5 5 3 Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 39
Продолжение таблицы 4.1 1 2 3 1.4.Формирование Младший научный сотрудник 16 исследовательской работы 1.5.Обработка и анализ Младший научный сотрудник 80 информации 240 Итого: 2.Основной (экономический анализ) 2.1.Обоснование Старший научный сотрудник 32 целесообразности работы 2.2.Выполнение работы Младший научный сотрудник 112 Итого: 3.1.Техникоэкономическое обоснование 3.2.Оформление и утверждение документации Итого: 4 2 10 30 4 14 144 18 3.Заключительный Экономист 40 5 Младший научный сотрудник 40 5 80 10 Результатом планирования является расчет трудоемкости исследования по часам и количеству дней. Определена численность штата производственного персонала, необходимого для проведения исследования. 4.2 Расчет расходов на оплату труда на исследование Расчет расходов на оплату труда разработки исследования представлен в таблице 4.2. Таблица 4.2 - Расчет расходов на оплату труда Должность исполнителей Трудоемкость, час Оклад, руб 1 Младший научный сотрудник 2 312 3 13000 Старший научный сотрудник 72 15000 Экономист 40 10000 Итого: 424 Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 40
Часовая тарифная ставка (ЧТС) рассчитывается по формуле: Ч ТС Р F (4.1) мес где Fмес – фонд рабочего времени месяца, составляет 176 часов (22 рабочих дня по 8 часов в день); Р – оклад сотрудника. Расход на оплату труда (РОТ) находится следующим образом: (4.2) Р Ч * Т сум ОТ ТС где ТСУМ – суммарная трудоемкость каждого из исполнителей. Результаты расчетов сведены в таблицу 4.3. Таблица 4.3 - Расчет расходов на оплату труда Должность Трудоемкость, Оклад, ЧТС, РОТ, Исполнителей час руб руб/час руб 1 Младший научный сотрудник 2 312 3 13000 4 73,86 5 23044,32 Старший научный сотрудник 72 15000 85,23 6136,56 Экономист 40 10000 56,82 2272,80 Итого: 424 4.3 31453,68 Расчет продолжительности исследования Согласно расчетам, трудоемкость исследования составила 424 часа. Продолжительность исследования составит: Т иссл Т сум / Т РД (4.3) где ТСУМ = 472 часа суммарная трудоемкость исследования ТРД = 8 часов – продолжительность рабочего дня ТИССЛ = 424/8 = 53 дней. Продолжительность исследования составляет 53 дня, расчет производится без учета выходных и праздничных дней. Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 41
4.4 Расчет стоимости расходных материалов В разделе стоимости расходных материалов учитываются расходы на приобретение основных материалов необходимых для проведения исследования, оформления соответствующей документации, а также учитывается стоимость картриджа. Расчет стоимости расходных материалов приведен в таблице 4.4 [20-21]. Таблица 4.4 - Стоимость расходных материалов Наименование расходных Цена за единицу, материалов руб. 1 2 Бумага 120 Канцтовары 160 Расходные материалы для 3500 принтера (картридж) Ватман 10 Итого: Количество, шт. 3 2 1 1 10 Сумма, руб. 4 240 160 3500 100 4000 Определили, что для проведения исследования затраты на приобретение расходных материалов потребуется 4000 рублей. 4.5 Расчет сметы расходов на исследование С учетом часового тарифной ставки рассчитаем общие расходы на разработку и проведение исследования. В данную статью расходов включаются премиальные выплаты, районный коэффициент и страховые взносы. Для оценки затрат на исследование составляем смету на разработку и проведение исследования [20]. Произведем расчет расходов: Премиальные выплаты рассчитываются по формуле: ПВ Р К ОТ ПВ (4.4) Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 42
где КПВ - коэффициент премиальных выплат, составляет 20 %, в случае если премии не предусмотрены КПВ=1. ПВ = 31453,68∙0,2=6290,74 руб. Дополнительные затраты на проведение исследования можно определить, как: З ДОП Р К ОТ (4.5) где К - коэффициент дополнительных затрат (К=14%). ЗДОП = РОТ · 14 %. ЗДОП =31453,68·0,14=4403,52 В заработной плате может быть предусмотрен районный коэффициент, которых характеризует доплату при работе в трудных условиях. Величина коэффициента определяется в зависимости от характера производства. РК Р К ОТ РВ (4.6) где КРВ – коэффициент районных выплат, для примера составляет 15 % от суммы. РК = (31453,68) ·0,15 =4718,05 руб. Общие расходы на оплату труда вычисляются по формуле: Р Р ПВ РК З общ ОТ ДОП (4.7) где РОТ - основная заработная плата; ПВ - премиальные выплаты; ЗДОП - дополнительные затраты; РК - районный коэффициент. Σ РОТ =31453,68+6290,74+4718,05+4403,52 Σ РОТ =46865,99 руб. Из таблицы 10 берется итоговая сумма стоимости расходных материалов по статье расходных материалов. Σ РРМ =4000 руб. Страховые взносы рассчитываются по формуле: СВ Р 0,3 ОТ (4.8) СВ =31453,68·0,30=11952,40 Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 43
Амортизационные исчисления на использование компьютера вычисляются аналогично выражению (6). В данном примере они составляют 25% от стоимости компьютера. АО С ПК (4.9) 0,25 АО = 30000 ·0,25=7500 руб. Расходы на использование Интернета берутся из расчета месячной абонентской платы для предприятия. Пусть: РИНТ=1000 руб. Административно-хозяйственые расходы составляют 50% от основной заработной платы (РОТ). Р АХ (4.10) Р 0,5 ОТ РАХ=31453,68·0,5=15726,84 руб. Результаты расчета расходов сведем в таблицу. Смета расходов на разработку и проведение исследования представлена в таблице 5. Таблица 4.5 - Смета расходов на разработку и проведение исследования Наименование статей расходов 1 1.Стоимость расходных материалов 2. Расходы на оплату труда 2.1. Основная заработная плата 2.2. Дополнительные затраты 2.3. Премиальные выплаты 2.4. Районный коэффициент 3. Единый социальный налог 4. Амортизационные исчисления на использование компьютера 5. Расходы на использование Интернет 6.Административно-хозяйственные расходы Итого: Сумма, руб. 2 4000 46865,99 31453,68 4403,52 6290,74 4718,05 11952,40 7500 Удельный вес статей, % 3 4,59 1000 15726,84 87045,23 1,15 18,07 100 36,13 5,06 7,23 5,4 13,73 8,62 Результатом экономической оценки исследования является определение затрат на разработку и реализацию исследования: - продолжительность исследовательских работ составила 53 дней; - сметы расходов на исследование – 87045 рублей. Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 44
ЗАКЛЮЧЕНИЕ Всегда возможно передавать информацию на скорости меньшей, чем способность канала с относительно маленькой ошибкой, даже в присутствии шума. Этого добиваются посредством кодирования информации, которая поставляет единообразный формат для различных типов сигналов. Одним из способов эффективного кодирования речевых сигналов является субполосное кодирование (субполосное преобразование). Он классифицируется в кодификаторы формы волны (кодирование формы сигнала), которые пытаются произвести сигнал как можно ближе к оригиналу. Основной интерес в применении к цифровой телефонии. Практическое применение этого метода сжатия позволит ускорить процесс обмена информацией (речь) в обществе, а также уменьшить объем памяти, необходимой для хранения речевых данных. При выполнении данной выпускной квалификационной работы было исследовано сжатие звуковых сигналов субполосным анализом, основанным на использовании КИХ-филтров. Недостатком такого подхода является наличие эффекта элайзинга, то есть наложения частот, и как следствие, ухудшение качества воспроизводимой речи. Структура работы состоит из введения с актуальностью выбранной темы, указаны цель и задачи исследования; четырех глав, каждая из которых последовательно отражает логический анализ нормативного, практического и научного материала. Первая глава посвящена общим сведениям о алгоритмах и методах сжатия звуковых сигналов. Вторая глава посвящена исследованию выбранного субполосного метода сжатия звуковых сигналов, пишется алгоритмы и приведены результаты работы алгоритмов. Третья глава посвящена анализу результатов работы алгоритмов сжатия звуковых сигналов. В четвёртой главе дается экономическая оценка результатов исследования (продолжительность исследо- Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 45
вательских работ составила 53 дней, сметы расходов на исследование – 87045 рублей). В практической части работы выполнили сжатие речевого сигнала с учетом два аспекта децимации выходных последовательностей КИХ-фильтров: - В первом случае рассматривается сжатие сигнала с одинаковым количеством частотных интервалов R при децимации. Качество воспроизведения сигнала сохраняется. Получили коэффициент сжатия приблизителен 1. Можно и сказать, что сжатие не происходит. - Во втором случае рассматривается сжатие сигнала с различным количеством частотных интервалов R при децимации (учитывается коэффициент децимации). Погрешность восстановления увеличивается почти в 2 раза, чем в первом случае. Коэффициент сжатия достигает значения свыше 1,5. Качество воспроизведения сигнала теряется при сжатии. Сигналы восстановляются воспринимаемыми после их сжатия, но с терпимыми ошибками. Листинги программы для сжатия звуковых сигналов, написаны в MATLAB, есть в приложениях и все шаги выполнения работы в пояснительной записке. При выполнении работы проходили исследование методов сжатия звукового сигнала на основе субполосного кодирования, выполнили разработку алгоритмов сжатия речевого сигнала с использованием субполосного преобразования на основе КИХ-фильтрации, и дали экономическую оценку результатов исследования. Таким образом можно сделать вывод, что цели выпускной квалификационной работы достигнуты и все поставленные задачи выполнены. Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 46
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ О субполосном преобразовании звуковых сигналов [Текст] / Е.Г. 1. Жиляков, С.П. Белов, Е.И. Прохоренко // Труды Российского научнотехнического общества радиотехники, электроники и связи имени А.С. Попова. – М., 2006. – Выпуск VIII-1. – С. 167–169. – (Серия: цифровая обработка сигналов и ее применение). Субполосное 2. кодирование [Электронный ресурс] / http://lib.sernam.ru/ - Научная библиотека избранных естественно-научных изданий / URL: http://lib.sernam.ru/book_gvwt.php?id=3 (дата обращения 15.05.2016). 3. Уолт, К. Цифровая обработка сигналов [Электронный ресурс] / URL: http://getfr.no-ip.org/pub/dc/doc/Физика/Книги_разные/Кестер У_Цифровая обработка сигналов.pdf (дата обращения 15.05.2016). 4. Жиляков, Е.Г. О сжатии речевых сигналов [Текст] / Е.Г. Жиляков, С.П. Белов // Вестник НТУ "Харьковский политехнический институт". Тематический выпуск: Информатика и моделирование. – Харьков: НТУ "ХПИ". – 2005. № 56. С. 32–40. 5. Шелухин, О.И. Цифровая обработка и передача речи [Текст] / О.И. Шелухин, Н.Ф. Лукьянцев. – М.: Радио и связь, 2000. – 208 с. 6. Ковалгин, Ю.А. Цифровое кодирование звуковых сигналов [Текст] / Ю.А. Ковалгин, Э.И. Вологдин. – СПб.: КОРОНА-принт, 2004. – 240 с., ил. 7. Рафинер, Л.Р. Цифровая обработка речевых сигналов [Текст] / Л.Р. Рафинер, Л.В. Шафер. – М.: Радио и связь, 1981. – 496с., ил. 8. Jhon G. Proakis, McGraw Hill Digital Communications, 1995 [Элек- тронный ресурс] / www.books.google.ru - официальный сайт Гугл / URL: https://books.google.ru/books/about/Digital_Communications.html?id=cIqYQgAAC AAJ&redir _esc=y (дата обращения 30.04.2016) Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 47
9. Pan, D. A Tutorial on MPEG/Audio Compression [Текст] / D. Pan. - IEEE Multimedia Journal, Summer 1995. 10. Жиляков Е.Г. УМКД по дисциплине «Обработка речевых данных в ИТС» [Электронный ресурс] / www.studfiles.ru - Файловый архив для студентов. StudFiles / URL: http://www.studfiles.ru/preview/1424391 (дата обращения 05.05.2016). 11. териал Сжатие данных [Электронный ресурс] / ru.wikipedia.org/wiki - Маиз Википедии свободной - энциклопедии / URL: https://ru.wikipedia.org/wiki/Сжатие_данных (дата обращения 10.05.2016). 12. Материал Сжатие аудиоданных [Электронный ресурс] / ru.wikipedia.org/wiki из Википедии - свободной энциклопедии / URL: https://es.wikipedia.org/wiki/Compresión_de_audio (дата обращения 15.05.2016). 13. Солонина, А. Моделирование цифровой обработки сигналов в MATLAB [Электронный ресурс] http://www.kit-e.ru – Журнал «Компоненты и технологии» / URL: http://www.kit-e.ru/assets/files/pdf/2009_06_128.pdf (дата обращения 20.05.2016). 14. Шелухин, О.И. Сжатие аудио и видео информации: Учеб. пособие / О.И. Шелухин, А.В. Гузеев. - М.: МТУСИ, 2012. 15. Методы сжатия данных [Текст] / Д. Ватолин, А. Раушняк, М. Смир- нов, Юкин В. - М.: Диалог-МИФИ, 2003. 16. Ковалгин, Ю.А. Цифровое кодирование звуковых сигналов [Текст] / Ковалгин, Ю.А., Вологдин Э.И. - СПб.: Корона-Принт, 2004. 17. Сергиенко, В.С. Сжатие данных, речи, звука и изображений в теле- коммуникационных системах: Учебное пособие / Сергиенко В.С., Баранов В.В– М.: ИП «РадиоСофт», 2011 – 360 с. 18. Пиуновский, Е.В. Современные технологии сжатия аудиосигналов: Учеб. пособие / Е.В. Пиуновский, А.А. Тропченко // Научно-технический вестник СПбГУ ИТМО, выпуск №1 (65), январь-февраль 2010 – СПб, 2010, с.46-52. Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 48
19. Тропченко, А.Ю. Методы сжатия изображений, аудиосигналов и видео: Учебное пособие / А.Ю. Тропченко, А.А Тропченко. – СПб: СПбГУ ИТМО, 2009. – 108 с. 20. Методические рекомендации по выполнению технико- экономического обоснования выпускных квалификационных работ: Методические указания / А.В. Болдышев. – Белгород: БелГУ, 2013. 21. Организация производства и предпринимательства в АПК: Учебное пособие / Ф.Я. Начитов, О.Ю. Патласов, Ф.К. Шакиров и др. – Омск: Изд-во ОмГАУ, 2004. -596 с. 22. Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 49
ПРИЛОЖЕНИЯ А Приведен листинг алгоритма сжатия речевого сигнала с использованием субполосного преобразования на основе КИХ-фильтров при одинаковых коэффициентах децимации. clc clear all L=512; % длина импульсной характиристики фильтра le=L/2; R=16; % количество частотных интервалов V=[0:1/R:1]; % задание полос задержки и пропускания фильтра c=0.001; % переходная полоса фильтра %Фильтры %фнч h(1,:)=cremez(L,[0 (V(2)) (V(2)+c) 1],'lowpass'); % расчет характеристики фильтра figure(1), freqz(h(1,:),1,L); % построение графиков АЧХ и ФЧХ фильтра % ПФ count=2; for i=2:length(V)-2 temp_V=[0 (V(i)-c) V(i) V(i+1) (V(i+1)+c) 1]; h(count,:)=cremez(L,temp_V,'bandpass'); % расчет характеристики фильтра figure(count), freqz(h(count,:),1,L); % построение графиков АЧХ и ФЧХ фильтра count=count+1; end % ФВЧ h(R,:)=cremez(L,[0 (V((length(V))-1)-c) (V((length(V))-1)) 1],'highpass');% расчет характеристики фильтра figure(R), freqz(h(R,:),1,L); % построение графиков АЧХ и ФЧХ фильтра % % исходный сигнал [X_ish,Fs,bits]=wavread('01.wav'); X_ish=X_ish'; % X_ish – вектор отсчетов исходного сигнала % Fs - частота дискретизации % bits - количество бит на один отсчет сигнала No=le; Lx=length(X_ish); % длина исходного сигнала Nx=floor(Lx/No); X_vost(1:Lx)=0; for nx=1:Nx X=X_ish((nx-1)*No+1:nx*No); %отрезок сигнала, соответствующий звуку zer=zeros(1,le); % добавляем нулей слева и справа Z=[zer,X,zer]; % Вых. последовательность фильтров for j=1:R for i=1:le y(j,i)=0; for k=1:(2*le+1) y(j,i)=y(j,i)+h(j,k)*Z(i+k-1); % Вых. пос-ть end; end; end %Децимация de_y=zeros(R,size(y,2)/R); for i =1:R count=1; for j = 1:16:size(y,2) de_y(i,count)=y(i,j); %Децимация count=count+1; Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 50
end end % %восстановление vo_y = zeros(R,size(y,2)); for k =1:size(de_y,1) count=1; for j =1:16:size(y,2) vo_y(k,j) = de_y(k,count); % вектор восстановления count=count+1; end end for j=1:R Z2=[zer,vo_y(j,:),zer]; for i=1:le y2(j,i)=0; for k=1:(2*le+1) y2(j,i)=y2(j,i)+h(j,k)*Z2(i+k-1); % Интерполяция end end end vo_X = zeros(1,length(X)); % Восстановленный отрезок сигнала for i = 1:size(vo_y,1) for j=1:size(vo_y,2) vo_X(1,j)=vo_X(1,j)+y2(i,j); % сложить все отфильтрованные отрезки end end vo_X=vo_X.*R; %каждый отсчет умножить на число равное количеству фильтров X_vost((nx-1)*No+1:nx*No)=vo_X; nx end % %строим графики figure(20) plot(X_ish),xlabel('Количество отчетов'), ylabel('Амплитуда') figure(30) plot(X_vost),xlabel('Количество отчетов'), ylabel('Амплитуда') figure(22) hold on plot(X,'-b') plot(vo_X,'--r'),xlabel('Количество отчетов'), ylabel('Амплитуда') legend('Исходный отрезок сигнала','Восстановленный отрезок сигнала') hold off figure(33) hold on plot(X_ish,'-b') plot(X_vost,'--r'),xlabel('Количество отчетов'), ylabel('Амплитуда') legend('Исходный сигнал','Восстановленный сигнал') hold off % Сохранение восст. сигнала wavwrite(X_vost,'vost1_01.wav'); %среднеквадр погрешность sum1=0; sum2=0; for i=1:length(X_ish) sum1=sum1+(X_ish(i)-X_vost(i))^2; sum2=sum2+(X_ish(i))^2; end Ee=sqrt(sum1/sum2); Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 51
ПРИЛОЖЕНИЕ Б Листинг второго способа алгоритма сжатия звуковых сигналов на основе использования КИХ-фильтров при различных коэффициентах децимации. clc clear all L=512; % длина импульсной характиристики фильтра le=L/2; R=16; % количество частотных интервалов V=[0:1/R:1]; % задание полос задержки и пропускания фильтра c=0.001; % переходная полоса фильтра %Фильтры %фнч h(1,:)=cremez(L,[0 (V(2)) (V(2)+c) 1],'lowpass'); % расчет характеристики фильтра figure(1), freqz(h(1,:),1,L); % построение графиков АЧХ и ФЧХ фильтра % ПФ count=2; for i=2:length(V)-2 temp_V=[0 (V(i)-c) V(i) V(i+1) (V(i+1)+c) 1]; h(count,:)=cremez(L,temp_V,'bandpass'); % расчет характеристики фильтра figure(count), freqz(h(count,:),1,L); % построение графиков АЧХ и ФЧХ фильтра count=count+1; end % ФВЧ h(R,:)=cremez(L,[0 (V((length(V))-1)-c) (V((length(V))-1)) 1],'highpass');% расчет характеристики фильтра figure(R), freqz(h(R,:),1,L); % построение графиков АЧХ и ФЧХ фильтра % % исходный сигнал [X_ish,Fs,bits]=wavread('01.wav'); X_ish=X_ish'; % X_ish – вектор отсчетов исходного сигнала % Fs - частота дискретизации % bits - количество бит на один отсчет сигнала No=le; Lx=length(X_ish); Nx=floor(Lx/No); X_vost(1:Lx)=0; for nx=1:Nx X=X_ish((nx-1)*No+1:nx*No); %отрезок сигнала, соответствующий звуку zer=zeros(1,le); % добавляем нулей слева и справа Z=[zer,X,zer]; % Вых. последовательность фильтров for j=1:R for i=1:le y(j,i)=0; for k=1:(2*le+1) y(j,i)=y(j,i)+h(j,k)*Z(i+k-1); % Вых. пос-ть end; end; end % %Децимация k=1/R; for i=1:R count=1; n=round(R/(k*i)); for j=1:n:size(y,2) de_y(i,count)=y(i,j); count=count+1; end; end clear n % %восстановление vo_y=zeros(R,size(y,2)); Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 52
for i=1:R nn=round(R./(k*i)); m=de_y(i,:); clear w for j=1:R if m(j)~=0 w(j)=m(j); end; end count=0; for ww=1:nn:size(y,2) count=count+1; vo_y(i,ww)=w(count); end end for j=1:R Z2=[zer,vo_y(j,:),zer]; for i=1:le y2(j,i)=0; for k=1:(2*le+1) y2(j,i)=y2(j,i)+h(j,k)*Z2(i+k-1); % Интерполяция end end end vo_X = zeros(1,length(X)); for i = 1:size(vo_y,1) for j=1:size(vo_y,2) vo_X(1,j)=vo_X(1,j)+y2(i,j); % сложить все отфильтрованные отрезки end end vo_X=vo_X.*R; %каждый отсчет умножить на число равное количеству фильтров X_vost((nx-1)*No+1:nx*No)=vo_X; nx end % %строим графики figure(20) plot(X_ish),xlabel('Количество отчетов'), ylabel('Амплитуда') figure(30) plot(X_vost),xlabel('Количество отчетов'), ylabel('Амплитуда') figure(22) hold on plot(X,'-b') plot(vo_X,'--r'),xlabel('Количество отчетов'), ylabel('Амплитуда') legend('Исходный отрезок сигнала','Восстановленный отрезок сигнала') hold off figure(33) hold on plot(X_ish,'-b') plot(X_vost,'--r'),xlabel('Количество отчетов'), ylabel('Амплитуда') legend('Исходный сигнал','Восстановленный сигнал'); hold off % Сохранение восст. сигнала wavwrite(X_vost,'vost2_01.wav'); %среднеквадр погрешность sum1=0; sum2=0; for i=1:length(X_ish) sum1=sum1+(X_vost(i)-X_ish(i))^2; sum2=sum2+(X_ish(i))^2; end Ee=sqrt(sum1/sum2); Лист Изм. Лист № докум. Подпись Дата 11070006.11.03.02.171.ПЗВКР 53
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ БЕЛГОРОДСКИЙ ГОСУДАРСТВЕННЫЙ НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ (НИУ «БелГУ») ИНСТИТУТ ИНЖЕНЕРНЫХ ТЕХНОЛОГИЙ И ЕСТЕСТВЕННЫХ НАУК КАФЕДРА ИНФОРМАЦИОННО-ТЕЛЕКОММУНИКАЦИОННЫХ СИСТЕМ И ТЕХНОЛОГИЙ Направление подготовки 11.03.02 Инфокоммуникационные технологии и системы связи Профиль: «Сети связи и системы коммутации» Утверждаю Зав. кафедрой «____» ____________________ 201_ г. ЗАДАНИЕ НА ВЫПУСКНУЮ КВАЛИФИКАЦИОННУЮ РАБОТУ Бакале Нчама Кинтилино Меланио Бакале (фамилия, имя, отчество) 1. Тема ВКР «Разработка алгоритма сжатия звуковых сигналов на основе методов субполосного анализа» Утверждена приказом по университету от «____» __________________ 201_ г. № _____ 2. Срок сдачи студентом законченной работы ___.______ 3. Исходные данные: Основанием для проведения работ является «Разработка алгоритма сжатия звуковых сигналов на основе методов субполосного анализа» 4. Содержание расчетно-пояснительной записки (перечень подлежащих разработке вопросов): 4.1. Алгоритмы и методы сжатия звуковых сигналов; 4.1.1. Фильтрация на основе КИХ-фильтров; 4.1.2. Субполосное преобразование на основе использования банков ких-фильтров; 4.2. Исследование субполосного алгоритма сжатия звуковых сигналов; 4.3. Анализ результатов работы алгоритмов сжатия звуковых сигналов (Графическая часть работы); 4.4. Экономическая оценка результатов исследования;
5. Консультанты по работе с указанием относящихся к ним разделов Раздел 4.1 – 4.3 4.4 Подпись, дата Задание выдал Задание принял Консультант канд. техн. наук, доцент каф. ИТСиТ Прохоренко Е.И. канд. техн. наук старший преподаватель каф. ИТСиТ Болдышев А.В. 6. Дата выдачи задания 25.04.2016г Руководитель канд. техн. наук, доцент доцент кафедры Информационно-телекоммуникационных систем и технологий» НИУ «БелГУ» _________________________________________ Е.И. Прохоренко (подпись) Задание принял к исполнению ________________________________________ (подпись)
Отзывы:
Авторизуйтесь, чтобы оставить отзыв