Министерство образования и науки Российской Федерации
Федеральное государственное автономное образовательное учреждение
высшего образования
«КАЗАНСКИЙ (ПРИВОЛЖСКИЙ) ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ»
ИНСТИТУТ ФИЗИКИ
КАФЕДРА РАДИОЭЛЕКТРОНИКИ
Направление: 03.04.03 — Радиофизика
Профиль: Радиофизические методы по областям применения
МАГИСТЕРСКАЯ ДИССЕРТАЦИЯ
ИНТЕЛЛЕКТУАЛЬНАЯ СИСТЕМА ДЛЯ ОБРАБОТКИ И
ИНТЕРПРЕТАЦИИ АКУСТИЧЕСКИХ ДАННЫХ В ЗАДАЧАХ
ГЕОФИЗИЧЕСКОГО ИССЛЕДОВАНИЯ СКВАЖИН
Работа завершена:
"___"________2020 г. _____________________________________ (А.В. Абрамов)
Работа допущена к защите:
Научный руководитель
к.ф.-м.н., доцент кафедры радиофизики
"___"___________2020 г. ____________________________ (Ю. С. Масленникова)
Заведующий кафедрой
д.ф.-м.н., доцент кафедры радиоэлектроники
"___"___________2020 г. _______________________________(М.Н. Овчинников)
Казань — 2020
ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ ................................................................................................................. 4
ГЛАВА 1. СКВАЖИННАЯ СПЕКТРАЛЬНАЯ ШУМОМЕТРИЯ ................... 6
Физика возникновения акустических шумов ...................................................... 6
Методика скважинных исследований ................................................................... 7
Технические детали скважинных шумомеров .................................................... 8
Интерпретация данных шумометрии ................................................................... 9
Приложения решений задачи классификации аудиосигналов ...................... 12
Применение в программно-аппаратных комплексах ...................................... 12
Категоризация задач классификации аудиосигналов ...................................... 14
Признаки для представления аудиосигналов .................................................... 16
Модели распознавания и классификации аудиосигналов .............................. 22
Выводы к главе 1 ..................................................................................................... 27
ГЛАВА 2. РАЗРАБОТКА АВТОМАТИЧЕСКОЙ СИСТЕМЫ ОБРАБОТКИ
ДАННЫХ СКВАЖИННОЙ СПЕКТРАЛЬНОЙ ШУМОМЕТРИИ .............. 28
Создание базы данных записей акустических сигналов для фильтрации
приборных шумов.................................................................................................... 28
Создание базы данных записей акустических сигналов для определения зон
выноса мелкого песка ............................................................................................. 30
Выбор алгоритма для классификации акустических сигналов, содержащих
приборные шумы ..................................................................................................... 35
Разработка алгоритма распознавания акустических сигналов, вызванных
соударениями частиц и элементов шумомеров ................................................. 37
Выводы к главе 2 ..................................................................................................... 40
2
ГЛАВА 3. ПРИМЕНЕНИЕ АВТОМАТИЧЕСКОЙ СИСТЕМЫ
ОБРАБОТКИ ДАННЫХ СКВАЖИННОЙ ШУМОМЕТРИИ ДЛЯ
УДАЛЕНИЯ АКУСТИЧЕСКИХ ШУМОВ ........................................................ 41
Обработка акустических данных спектральной скважинной шумометрии
скважины №1 ........................................................................................................... 41
Обработка акустических данных спектральной скважинной шумометрии
скважины №2 ........................................................................................................... 44
Обработка акустических данных спектральной скважинной шумометрии
скважины №3 ........................................................................................................... 45
Сравнение
качества
работы
алгоритмов
автоматического
удаления
акустических шумов ............................................................................................... 49
Выводы к главе 3 ..................................................................................................... 52
ГЛАВА 4. ПРИМЕНЕНИЕ АВТОМАТИЧЕСКОЙ СИСТЕМЫ
ОБРАБОТКИ ДАННЫХ СКВАЖИННОЙ ШУМОМЕТРИИ ДЛЯ
ОПРЕДЕЛЕНИЯ ЗОН ВЫНОСА ПЕСКА ......................................................... 53
Тестирование на лабораторных данных ............................................................. 53
Тестирование на скважинных акустических данных ...................................... 56
Выводы к главе 4 ..................................................................................................... 59
ЗАКЛЮЧЕНИЕ ....................................................................................................... 60
СПИСОК ЛИТЕРАТУРЫ ...................................................................................... 62
3
ВВЕДЕНИЕ
Проведение качественного анализа состояния скважины при нефте- и
газодобыче является задачей, актуальность которой только возрастает со
временем. Постепенное исчерпание легкоизвлекаемых запасов углеводородов, а
также наличие используемых скважин с большим сроком службы приводит к
необходимости тщательного мониторинга состояния насосно-компрессорной
трубы(НКТ) и обсадных колонн. Одним из важных и эффективных методов
исследования является спектральная скважинная шумометрия, использующая
акустические данные для
анализа скважинных
процессов.
Параметры
акустического шума, возникающего при движении флюида по пласту или
скважине, определяются как его типом, так и окружающей средой. Наиболее
удобной формой для анализа и визуализации сигнала является его частотное
представление,
позволяющее
проводить
идентификацию
источников
акустических шумов на основе спектров. Так, широкополосные локализованные
по глубине шумы могут соответствовать как зонам активной работы пласта, так
и участкам скважины с дефектами; спектральные особенности, локализованные
в области низких частот, соответствуют турбулентным шумам от потока
транспортируемого газа или жидкости.
Среди шумов геофизической или технической природы могут также
содержаться посторонние шумы, вызванные соударениями приборной связки с
элементами конструкции скважины, например, с НКТ, а также с посторонними
частицами, такими как, мелкие песчинки, пропант и пузырьки газа. Подобные
соударения создают акустические шумы, способные помешать корректному
анализу состояния скважины. Текущие алгоритмы, используемые для решения
подобных задач, либо не показывают достаточно высокого качества работы в
отдельных случаях, либо не обладают достаточно широким функционалом,
способным помочь в распознавании посторонних шумов. Таким образом,
создание подобной системы остаётся актуальной задачей.
Целью данной работы является разработка интеллектуальной системы для
4
обработки
и
интерпретации
акустических
данных,
которая
способна
обнаруживать моменты соударения приборной связки и элементов конструкции
скважины и определять зоны выноса мелкого песка.
Для достижения
поставленной цели требуется решить следующие задачи:
1.
Провести обзор текущих методов по обработке акустических сигналов
различной природы;
2.
Собрать и предобработать акустические данные, вызванные соударениями
приборной связки с элементами конструкции скважины или частицами песка;
3.
Разработать алгоритмы, способные решать задачи определения моментов
соударения приборной связки с элементами конструкции скважины и детекции
зон выноса мелкого песка по отдельности;
4.
Провести проверку качества работы разработанных и обученных
алгоритмов на отложенных лабораторных и реальных акустических данных.
5
ГЛАВА 1. СКВАЖИННАЯ СПЕКТРАЛЬНАЯ ШУМОМЕТРИЯ
Физика возникновения акустических шумов
Причины возникновения акустического шума в геологической среде
изучены сравнительно подробно. В работе [1] изучена теория генерации
акустических шумов в трубе, вызванных движением жидкости или газа. Теория
возникновения акустических шумов, вызванных движением флюида в пласте,
содержит несколько различных предположений об их природе.
В статье [2] рассматривается зависимость спектра акустического сигнала от
типа породы – авторами были рассмотрены шумы фильтрации в трещиноватом,
трещиновато-пористом и пористом песчаном коллекторах. Полученные спектры
имели амплитудные максимумы, которые соответствовали различным значениям
частоты – зависимость положения максимума на частотной шкале имеет
обратный характер относительно размера поры в коллекторе. В работе приведён
итоговый механизм образования акустического шума – пористый упругий
коллектор фильтрует частоты из широкополосного акустического шума,
возникающего из-за движения флюида по пласту, оставляя только те частоты,
которые являются резонансными для окружающего упругого скелета. В свою
очередь, тип самого флюида и скорость фильтрации не влияют на положение
максимумов спектра, изменяя только значения амплитуды.
В работе [5] предложен следующий механизм образования шума – автором
рассматривается
образец
твёрдой
породы
с
«открытыми»
порами,
направленными преимущественно одинаково. Подобное внутреннее строение
пласта обеспечивает возможность сквозного протекания газа или жидкости.
Через каждую пору прокачивается газ, причём стенки пор и соединяющих
капилляров смачиваются жидкостью, которая при отсутствии внешнего давления
с стороны газа полностью перекрывает капилляр. Как только давление газа
достигает критического значения, происходит прорыв капли, закрывающей
капилляр, и образованный резкий скачок давления вызывает акустический шум.
Возникновение акустического шума при фильтрации флюида через
6
пористый пласт может быть также объяснено с помощью модели, принимающей
перколяционное движение флюида как основную причину. В статье [6]
экспериментально продемонстрирован данный механизм.
Методика скважинных исследований
Многие виды исследовательских работ внутри скважины, таких как
дефектометрия,
термометрия,
исследования
с
применением
методов
электрического каротажа, возможно проводить с использованием связки
приборов, закреплённой на геофизическом кабеле и непрерывно перемещаемой
вверх или вниз вдоль скважины [3]. Однако, при акустических исследованиях
непрерывное перемещение связки приборов приведёт к записи посторонних
шумов, вызванных трением и соударениями приборной связки об элементы
конструкции
скважины.
Записанный
посторонний
шум
является
широкополосным и его мощность значительно превышает мощность полезного
сигнала, исходящего из пласта-коллектора. Поэтому процедура скважинных
измерений изменяется – спуск прибора осуществляется непрерывно, измерения
акустических сигналов из этого временного интервала в исследованиях не
используются. Подъём прибора происходит с периодическими перерывами на
стоянки, длительность которых типично составляет от 40 до 60 секунд. Запись
акустических данных производится в течение 8.7 мс с частотой дискретизации
120 кГц каждую секунду, что даёт 1024 отсчёта. Для каждой записи на стоянке
вычисляется спектр, и после усреднения получается итоговый спектр
акустического сигнала на стоянке. Усреднение по 40-60 записям делается для
получения статистически верных измерений, поскольку излучаемый из пластаколлектора акустический сигнал является стационарным процессом. Для
получения более статистически достоверных измерений спектра сигнала можно
производить запись в течение удвоенного интервала времени каждую секунду.
Типичным шагом между стоянками является расстояние в 1 м; при
необходимости провести исследование всего ствола скважины шаг может быть
увеличен до 3 м.
7
Рис. 1. Примеры акустического шума, записанного последовательно на одной стоянке
Технические детали скважинных шумомеров
Для регистрации акустических шумов внутри скважины используются
скважинные шумомеры, способные выдерживать условия агрессивной среды
внутри скважин. Устройство скважинного шумомера можно разделить на 3
основных блока – гидрофон с пьезоэлектрическим кристаллом внутри, блок
памяти и блок с батареями.
Гидрофон с пьезоэлектрическим кристаллом является ключевым блоком
шумомера и представляет собой камеру, заполненную маслом с кристаллом
внутри. Масло внутри камеры помогает уменьшить разницу между плотностями
флюида внутри скважины и средой, окружающей сенсор. Уменьшение разницы
плотностей сред помогает уменьшить отражение акустических волн на границе
раздела
сред
и
обеспечить
максимальную
чувствительность
пьезокристаллического сенсора.
Блок электроники отвечает за предоработку сигнала – например, аналогоцифровое преобразование – и сохранение предобработанных данных в
внутреннюю flash-память. Значение битности АЦП внутри блока электроники
составляет 12 или 16 бит, в зависимости от рассматриваемого прибора, что
позволяет качественно записывать акустические сигналы в широком частотном
диапазоне от 8 Гц до 60 кГц и динамическом диапазоне от 68 до 90 дБ.
Зарегистрированные акустические сигналы записываются непосредственно в
8
память, а перевод в частотную область производится после извлечения прибора
из скважины и считывания данных.
Использование внутреннего блока памяти и внутреннего блока батарей
позволяет использовать прибор автономно и производить измерений с помощью
обычной скребковой проволоки. Питание от блока батарей рассчитано на 48
часов непрерывной работы, однако, при записи данных в двойном режиме
полезное время работы прибора может сократиться из-за заполнения внутренней
памяти. Передача данных на поверхность затруднена из-за относительно
большого объёма регистрируемых данных – от 200 Мб до 2 Гб.
Рис. 2. Скважинный шумомер в разрезе
Интерпретация данных шумометрии
Различные источники шумов в скважине производят акустические сигналы
с разными спектрами. После объединения всех усреднённых спектров для
каждой стоянки в спектральную панель, построенную в размерности «глубиначастота», можно проводить визуальный анализ источников. Ниже приведён ряд
примеров интерпретации данных.
9
Вертикальный поток жидкости по стволу скважины
Шум, вызванный движением жидкости по стволу скважины, образуется как
за счёт вибрации в межколонном пространстве, так и самим турбулентным
потоком жидкости. В частотном представлении основная мощность спектра
сосредоточена в низкочастотной полосе до 1 кГц, и, следовательно, шум может
восприниматься человеческим ухом. По глубине шум не имеет чёткой
локализации, поскольку генерация сигнала происходит по всей глубине ствола
скважины.
Шум, производимый элементами конструкции скважины
В отличие от шума, вызванного движением жидкости по стволу скважины,
данный шум является хорошо локализованным по глубине, поскольку
вызывается конкретными элементами или нарушениями конструкции скважины.
К таким элементам относятся: перфорационные отверстия, проходные ниппели,
циркуляционные клапаны, башмаки НКТ, газовые мандрели, пакеры и
нарушения в обсадной колонне. В зависимости от конкретного элемента
конструкции скважины, спектр акустического шума будет иметь свою форму –
например, шум, вызванный пакером - это широкополосный сигнал от 0.1 кГц, с
пиком в области низких частот и постепенным уменьшением мощности при
увеличении частоты.
Заколонный переток
Шум,
генерируемый
заколонными
перетоками,
является
чётко
локализуемым по глубине, поскольку генерируется при движении жидкости
через каналы и зазоры в цементном кольце. Верхняя и нижняя граница явно
обозначаются на спектральной панели и соответствуют двум близким рабочим
пластам, соединённым перетоком. На качество регистрации шума влияет
структура трещины, по которой протекает флюид – низкочастотный спектр шума
может отклоняться от вертикальной линии, соединяющей границы перетока, в
зависимости от диаметра трещины. Также, сигнал от перетока может быть
замаскирован шумом, вызванным движением потока жидкости по стволу
10
скважины, если диаметр трещины достаточно велик и спектр смещён в ту же
частотную область.
Движение жидкости по пласту
Шум, генерируемый движением жидкости по пласту, возникает из-за
вибрации горловин пор, трещин и частиц породы. Спектр частот типично
находится выше 2 кГц и имеет локализованные пики мощности из-за
зависимости формы спектра от состава породы пласта-коллектора. Поскольку
распределение размеров пор и трещин может быть неоднородным, то и спектр
генерируемого шума может иметь набор пиков, относящихся к различным
частотным диапазонам. Тип жидкости, фильтрующейся через пласт-коллектор,
не влияет сам по себе на форму итогового спектра. Однако, при смене типа
флюида с жидкости на газ может произойти активация пор меньшего размера,
что приведёт к добавлению высокочастотного шума.
Методы классификации акустических сигналов
Проблема решения задачи классификации аудиосигналов различной
природы не является новой. Возникновение данной задачи связано в первую
очередь с способностью людей качественно воспринимать звук без видимых
усилий - определение рода источника звука, направления излучения звуковой
волны, выявление требуемого источника среди множества посторонних остаются
сложными для качественного решения задачами – и, как следствие, желанием
подробно
изучить
механизм
распознавания
акустических
сигналов
и
воспроизвести его при помощи некоего программно-аппаратного комплекса. В
целом, мотивацию к решению данной задачи можно разделить на три основных
области.
Во-первых, тщательное изучение механизмов распознавания аудиосигналов
может привести к более глубокому понимаю того, как это делают люди. Несмотря
на то, что исследования, направленные на понимание подобных механизмов,
будут
являться
более
физиологическими,
чем
вычислительными
или
физическими, тем не менее, подобный подход может дать хорошую начальную
11
позицию для дальнейшего изучения.
Во-вторых, важным применением системы, созданной на основе решений
частных случаев задачи классификации акустических сигналов, может быть
частичная или полная замена живого специалиста в ряде задач. Примером может
служить быстрая диагностика состояния двигателя автомобиля по звуку во время
его работы или удалённая диагностика состояния больных респираторными
заболеваниями.
Наконец, с развитием возможностей используемых программно-аппаратных
комплексов,
а
также
применяемых
подходов,
система
классификации
аудиосигналов может демонстрировать более высокое качество работы, чем
человек. Данная мотивация приобретает дополнительную актуальность, если
рассматривать применение подобных систем к распознаванию акустических
сигналов, лежащих в частотной области с более широким диапазоном, чем тот,
который доступен для восприятия людям. Примером области, содержащей в себе
изучение подобных сигналов, является анализ состояния скважин и изучение
свойств окружающего их пласта с помощью скважинной спектральной
шумометрии – частотный диапазон достигает 60 кГц, что превышает
возможности человеческого восприятия. Более того, дальнейшее развитие
методов классификации аудиосигналов может помочь в решении задач удаления
шумов, отделения полезного сигнала от неинформативного фонового шума и т.д.
Приложения решений задачи классификации аудиосигналов
Подобный широкий спектр мотивации приводит к тому, что программноаппаратные комплексы для решения задачи классификации аудиосигналов могут
быть потенциально эффективно использованы в большом наборе областей.
Рассмотрим некоторые из них:
Применение в программно-аппаратных комплексах
Применение алгоритмов распознавания аудиосигналов и, в частности, их
классификации, достаточно широко в программных комплексах. Один из самых
распространённых
случаев
применения
12
анализа
аудиосигналов
–
это
распознавание речи голосовыми помощниками. Выделяя значимые признаки для
речи из аудиозаписи, такие как: длительность пауз между словами, высота и тон
голоса, эмоциональная окраска, интонация, можно сделать подробный вывод о
семантике предложения, произнесённого человеком.
Другим примером могут служить комплексы для обработки или
распознавания музыкальных аудиозаписей. Анализ аудиозаписей на основе
специфичных для музыки признаков может помочь в классификации записей по
жанру, исполнителю и т.д. Отдельно стоит выделить область распознавания
примерной записи для нахождения эталонной аналогичной аудиозаписи в
имеющейся обширной музыкальной базе [13].
Отдельно стоит выделить применение распознавания и классификации
аудиосигналов в программно-аппаратных комплексах. Подобные комплексы
зачастую включают в себя аппаратную предобработку входящего аудиосигнала,
что помогает более точно проводить его классификацию. Примером таких
комплексов служат системы
умного
дома, способные гораздо
лучше
распознавать, например, человеческую речь, благодаря использованию массива
чувствительных микрофонов, что помогает получить аудиозапись с пониженным
влиянием затухания голоса, переотражений от поверхностей, фонового шума и
т.п. Похожим примером являются системы на ПЛИС, реализующие вычитание
спектра, использующие идею о том, что ожидаемый полезный сигнал можно
выделить из зашумлённого сигнала путём вычитания спектра фонового шума из
спектра зашумлённого сигнала [18]. Подобная предобработка также позволяет
получить более «чистую» аудиозапись для дальнейшей обработки.
Другим хорошим примером являются системы классификации научноприкладного толка. Одной из перспективных областей применения подобных
систем являются системы медицинского мониторинга. Например, при помощи
носимых устройств для записи звука можно определить периоды и характер
использования ингалятора больными астмой, путём классификации коротких
пересекающихся участков записи на моменты использования ингалятора и
13
обычного дыхания.
Другой областью, использующей анализ акустических данных, является
исследование нефтяных и газовых скважин. Автоматизированный анализ
данных, полученных методом скважинной спектральной шумометрии, может
помочь в определении типа флюида, протекающего по стволу скважины,
нахождении факта и участков выноса песка из пласта, удалении посторонних
шумов, возникающих при исследовании глубоких скважин и т.д.
Категоризация задач классификации аудиосигналов
Задача классификации аудиосигнала внутри себя может подразделяться на
ряд более специфичных задач, формулировка которых зависит от имеющихся
данных и желаемых результатов работы классификатора. В общем случае,
данные задачи можно расположить по двум осям – на одной оси стоит отложить
количество участков, для которых требуется сделать предсказание, а на другой
оси расположены типы предсказаний.
Рис. 3. Категоризация задач классификации аудиосигналов по двум признакам
Предсказание общей метки для всего входного аудиосигнала вне
зависимости от его длины является задачей классификации последовательности.
Примерами подобных задач служат: предсказание языка записанной речи;
14
определение жанра музыки; выявление наличия/отсутствия заболевания.
Если же входному аудиосигналу возможно поставить в соответствие сразу
несколько меток, то в таком случае говорят о многоклассовой классификации
последовательности. Хорошим примером является набор данных AudioSet,
содержащий в себе 623 класса, объединённых в иерархическое дерево с
максимальной глубиной 6 (Пример – «Звуки предметов» → «Средства
передвижения» → «Средства передвижения с двигателем» → «Средства
передвижения для чрезвычайной помощи» → «Сирены» → «Скорая
помощь(сирена)») [8]. Наиболее хорошо задача многоклассовой классификации
решается, если в данных заложена ненулевая совместная вероятность появления
нескольких событий, вынесенных в различные классы.
Наконец, если для целого входного сигнала необходимо предсказать некое
числовое
значение,
то
данная
задача
формулируется
как
регрессия
последовательности. Несмотря на то, что задача регрессии в общем случае
отличается от задачи классификации и решается с помощью немного других
подходов – например, выбирается другой функционал для оптимизации в
алгоритмах машинного обучения – её можно свести к задаче классификации,
если перевести непрерывный диапазон предсказываемых значений в дискретный
набор значений. Хорошим примером для подобного приведения задачи регрессии
к
задаче
классификации
служит
предсказание
следующего
сэмпла
в
последовательности. Если в качестве входного сигнала служит квантованный
аудиосигнал с разрядностью 8 бит, то задача предсказания, следующего сэмпла
сводится к классификации на 256 взаимоисключающих классов.
В том случае, когда входной сигнал можно разбить на равные участки,
требующие отдельных взаимоисключающих предсказаний для каждого, говорят
о разметке последовательности. Примером служит разметка аккордов в
музыкальном отрывке или определение наличия речи в выбранном отрывке.
Задачу многоклассовой классификации для отрывков аудиосигнала называют
обнаружением событий – требуется определить присутствует ли в данный
15
момент какое-либо событие или нет, причём события могут происходить
одновременно
(Пример
–
звуки
работы
различных
инструментов
на
строительной площадке). Задача регрессии в данном случае формулируется для
генерации набора предсказаний из непрерывного интервала, соответствующих
отрезкам сигнала. Очевидно, что после квантизации целевой переменной,
данную задачу можно также свести к задаче классификации. Примером служит
задача определения расстояния до источника акустического сигнала при
исследовании нефтедобывающей скважины.
В переводе последовательности, когда количество рассматриваемых
фрагментов не является функцией от длины всей аудиозаписи, пока что нет
устоявшихся
рамок
для
различения
одноклассовой/многоклассовой
классификации и регрессии. Иллюстрациями служат задачи перевода речи в
текст, перевод языков и т.д. [11].
Признаки для представления аудиосигналов
Перед построением предсказательной модели на данных любой природы –
табличных данных, аудиосигналах, изображениях – зачастую необходимо
произвести подбор эффективного компактного представления с помощью
алгоритмов, способных выделить некие информативные признаки. Аналогично
тому, как в классическом компьютерном зрении для описания изображений
используются такие признаки как: точки интереса [21]; области интереса [22];
края [16]; прямые линии [19], для аудиосигналов также существует набор
признаков, которые можно использовать для их представления. Работа с
аудиосигналом в исходном виде в данный момент не так распространена, в
отличие от работы с изображениями после появления свёрточной сети AlexNet
[17], однако, в настоящее время начинают появляться подходы, как правило,
основанные
на
нейронных
сетях,
воспринимающие
аудиосигнал
как
последовательность или вектор с заранее заданной размерностью. Ниже
перечислены некоторые эффективные преставления аудиосигналов, которые
зарекомендовали себя на практике.
16
Спектральные признаки
Перевод аудиосигнала из временной области в частотную позволяет
выделить значимые компоненты сигнала из амплитудного спектра. Простейшим
способом
получения
спектральных
признаков
является
дискретное
преобразование Фурье:
𝑁−1
𝑖2𝜋
X k = ∑ 𝑥𝑛 ⋅ 𝑒 − 𝑁
𝑘𝑛
.
𝑛=0
Поэлементное умножение исходной временной последовательности на
подобранную весовую функцию (оконные функции Ханна, Хемминга, Блэкмана,
Наталла и т.д.) позволяет получить более качественный спектр сигнала с
уменьшенными боковыми лепестками.
Использование обычного дискретного преобразования Фурье не позволяет
отследить
изменение
спектральных
признаков
во
времени,
поскольку
вычисление спектра производится для всей временной последовательности.
Применение дискретного преобразования Фурье с оконной (весовой) функцией
к небольшим, возможно пересекающимся, участкам сигнала, помогает отследить
изменение в спектре сигнала со временем. Оконное преобразование Фурье
определяется следующим образом:
∞
𝑋(𝑚, 𝑤) = ∑ 𝑥[𝑛]𝑤[𝑛 − 𝑚]𝑒
−
𝑖2𝜋
𝑘𝑛
𝑁
.
𝑛=−∞
Здесь индекс m – сдвиг оконной функции относительно всей временной
последовательности; w – оконная функция.
Если от каждого полученного спектра произвести вычисление спектральной
плотности мощности и составить из полученных значений прямоугольную
матрицу, в которой каждый столбец будет соответствовать начальной точке
времени, с которой начинается сэмпл из основного сигнала, а каждая строка
будет соответствовать значению частоты из спектра, тогда получится
17
спектрограмма. В первую очередь спектрограмма является удобным средством
визуализации изменения спектра сигнала во времени, однако спектрограмму
можно также воспринимать как изображение, на котором геометрические
признаки соответствуют частотно-временным характеристикам сигнала.
В некоторых задачах, связанных с распознаванием аудиосигналов – например,
записей речи – использование спектральных коэффициентов, расположенных на
равном расстоянии друг от друга на частотной шкале, может быть не самым
оптимальным. Если обратиться к задачам распознавания речи, то лучшим
вариантом является нелинейное преобразование частотной шкалы в мел шкалу,
что позволяет получить более высокое разрешение в нижних частотах и низкое
разрешение
в
высоких
частотах.
Из
преобразованных
спектральных
коэффициентов можно аналогичным образом составить мел-спектрограмму.
Преобразование в мел-шкалу происходит по следующей формуле:
m = 1127 ln (1 +
𝑓
𝑓
) = 2595𝑙𝑜𝑔10 (1 +
)
700
700
Ниже приведены примеры спектрограммы и мел-спектрограммы для одной
записи акустического шума из скважины. Видно, что на обычной спектрограмме
все составляющие спектра отображены равномерно, в то время как на мелспектрограмме содержится больше деталей от нижних частот.
18
Рис. 4. Спектрограмма акустического сигнала
19
Рис. 5. Мел-спектрограмма акустического сигнала
Полученный спектр, как в линейной частотной шкале, так и в
логарифмической мел-шкале, может содержать малоинформативные для
распознавания компоненты. Для создания небольшого количества полезных
признаков в распознавании речи часто используется дискретное косинусное
преобразование [7]. Прямое применение ДКП к прологарифмированным мелкоэффициентам значительно уменьшает их количество – обычно используют 1213 первых коэффициентов. Для обработки аудио применяется ДКП 2-го типа,
определяемое следующим выражением:
20
𝑁−1
𝐷𝐶𝑇𝑘 = 2 ∑ 𝑥(𝑛) cos [
𝑛=0
𝜋𝑘
(2𝑛 + 1)] , 𝑘 = 0. . 𝑁 − 1
2𝑁
В приведенном выражении x(n) – исходная последовательность мелкоэффициентов, k – номер кепстральной компоненты. Набор полученных
компонент называется мел-частотными кепстральными коэффициентами
[9,20].
Временные признаки
Несмотря на то, что частотные признаки предоставляют большое
количество полезной информации о сигнале, они обладают существенным
недостатком – высокой вычислительной сложностью. В противовес им,
временные признаки извлекаются напрямую из аудиосигнала без сложных
преобразований. Все временные признаки можно разделить на 3 больших группы
в соответствии с извлекаемыми физическими свойствами сигнала: признаки
перехода через ноль, амплитудные признаки и признаки, основанные на
мощности сигнала.
Признаки перехода через ноль позволяют грубо оценить доминантную
частоту в сигнале. Самым простым признаком является прямой подсчёт
количества пересечений нуля временным сигналом. Существуют также
расширения данного метода – отношение количества переходов через ноль
линейного предсказания сигнала к количеству переходов через ноль самого
сигнала описывает степень автокоррелированности сигнала; метод подсчёт
количества переходов через ноль с пиковыми амплитудами позволяет оценить
форму спектра сигнала [12].
Амплитудные
признаки
предназначены
для
компактного
описания
огибающей сигнала. Извлечённые признаки можно использовать либо для
дальнейшей классификации, либо для визуализации и сравнения. Например, для
визуализации исходного сигнала можно воспользоваться дескриптором формы
сигнала, который вычисляет минимальные и максимальные значения среди
21
сэмплов внутри непересекающихся участков. В свою очередь, амплитудный
дескриптор создаёт новые признаки из исходного сигнала путём порогового
разделения сигнала на тихие и громкие участки и вычисления длительности
каждого участка, изменчивости в длительности участков, их энергии и т.д.
Данные признаки использовались для распознавания звуков животных в работе
[15].
Признаки, основанные на изучении мощности сигнала, во многом схожи с
амплитудными характеристиками, т.е. могут быть использованы для компактного
описания огибающей сигнала путём изучения распределения его мощности во
времени. К таким признакам можно отнести кратковременную энергию,
позволяющую
описать
аппроксимируемую
как
огибающую
сигнала;
среднеквадратичное
громкость
значение
сигнала,
амплитуды
и
используемую для задач сегментации речи или музыки; логарифм «времени
атаки сигнала», определяемый как логарифм разности отсчётов времени,
соответствующих началу сигнала и достижению первого значимого максимума
[14].
Модели распознавания и классификации аудиосигналов
Модели, используемые для распознавания и классификации аудиосигналов,
зачастую тесно связаны с представлением аудиосигнала после преобразований,
направленных
на
выделение
качественных
признаков.
Например,
при
использовании спектрограмм для представления сигнала, представляющих
собой прямоугольную матрицу, применение нейронных сетей может сразу
показать достаточно приемлемый результат. Рассмотрим некоторые модели,
используемые для распознавания аудиоданных.
Модели для обработки табличных данных
Табличными данными называют такой набор данных, который удобно
представить в виде таблицы или матрицы, причём каждый столбец отвечает за
отдельный признак, а каждая строка – за отдельный объект выборки. Таким
образом, в виде таблицы удобно представить выборку, в которой каждый пример
22
описывается неким вектором признаков. Такой вектор можно составить из
фиксированного набора коэффициентов, описывающих сигнал, например, мелкепстральных частотных коэффициентов, амплитудных признаков, мощностных
признаков.
Модели, предназначенные для обработки табличных данных, можно
разделить на 5 групп: линейные модели, метрические модели, решающие
деревья, ансамбли алгоритмов и нейронные сети.
Линейные модели
К
линейным
моделям
относится
большое
семейство
алгоритмов,
объединённых главным свойством гиперплоскости, разделяющей классы в
многомерном пространстве, - линейностью. Для задач классификации наиболее
широко используются 2 модели: логистическая регрессия и метод опорных
векторов. Данные алгоритмы отличаются видом решающей функции, что
приводит к различным преимуществам: логистическая регрессия позволяет
оценивать апостериорную вероятность принадлежности произвольного объекта
к имеющимся классам; метод опорных векторов строит оптимальную
разделяющую гиперплоскость, что может дать более высокое качество работы
алгоритма на неизвестных данных. Для метода опорных векторов существует
расширение на случай линейно неразделимой выборки – перевод пространства
признаков, т.е. значений каждого вектора признаков, в пространство более
высокой размерности, что позволяет проводить разделяющую гиперплоскость
для уверенной классификации объектов с сложной взаимосвязью.
Метрические модели
Метрические методы классификации основываются на следующих
предположениях – на пространстве признаков задана некая функция расстояния
(метрика Минковского, косинусное расстояние и т.д.), близкие объекты
относительно выбранной метрики принадлежат одному классу. Тогда, для
неизвестного объекта можно будет отранжировать известные объекты по
возрастанию расстояния и сделать вывод о принадлежности объекта к
23
определенному классу по степени близости остальных объектов. Известным
методом из данного семейства является метод k ближайших соседей,
выбирающий в пространстве объектов k ближайших и находящий наиболее часто
встречающийся класс среди меток этих объектов.
Решающие деревья и ансамбли алгоритмов
Линейные и метрические методы обладают заметными преимуществами –
они быстро обучаются, а также легко интерпретируются. Однако, им также
свойственны
существенные недостатки
–
линейные методы
способны
восстановить только линейные зависимости в данных, а метрические методы
чувствительны к выбросам и шумам в данных. Решающие деревья, а также
ансамбли, составленные из них, также обладают свойством интерпретируемости,
но при этом способны восстанавливать сложные нелинейные зависимости.
Решающее дерево можно представить в виде ориентированного связного графа,
в узлах которого находятся предикаты, разделяющие данные по какому-либо
признаку, который определяется выбранным информационным критерием.
Важным гиперпараметром при обучении является глубина дерева, выбор
которого позволяет предотвратить переобучение алгоритма. Объединение
решающих деревьев в ансамбль позволяет ещё сильнее улучшить качество
работы алгоритма. Существует два основных вида ансамблей – случайный лес и
градиентный бустинг. Случайный лес состоит из N решающих деревьев,
обученных на произвольном наборе данных для того, чтобы сделать эти деревья
максимально различными. Итоговый прогноз от деревьев получается простым
голосованием. В градиентном бустинге деревья строятся целенаправленно,
таким образом, чтобы с каждым обученным решающим деревом, ошибка
целевой функции уменьшалась. Итоговый прогноз получается аналогично.
Нейронные сети
Использование нейронных сетей в задачах с табличными данным не нашло
широкого применения ввиду большой длительности обучения, а также высокой
степени параметризированности итоговой модели. Тем не менее, использовать
24
их возможно – для таких задач используются многослойные полносвязные сети.
Подобные сети можно представить, как последовательное применение
нелинейной функции к линейной комбинации признаков с обучаемыми весами.
В качестве таких функций выбираются нелинейные функции для восстановления
сложных зависимостей – сигмоида, гиперболический тангенс, ReLU. Итоговый
прогноз осуществляется выбором компоненты с максимальным значением из
выходного вектора с длиной, равной количеству классов в задаче.
Гораздо лучше нейронные сети показывают себя в решении специфических
задач
–
классификации
изображений,
последовательностей,
генерации
синтетических данных. Применительно к задаче распознавания и классификации
аудиосигналов можно выделить 3 основных вида моделей.
Свёрточные нейронные сети
При работе с признаками, представленными в виде прямоугольных
матрицы, удобно использовать свёрточные нейронные сети, способные
качественно распознавать геометрические признаки на изображении и на их
основе делать вывод о классе данных. К такому типу данных можно отнести
спектрограммы в частотной или мел шкале. Работу свёрточных сетей можно
представить,
как
последовательную
свёртку
входного
изображения
с
обучаемыми фильтрами. Фильтры могут реализовывать как двумерную свёртку
при работе с изображениями, так и одномерную свёртку, если в качестве входных
данных используется некая последовательность, например, непосредственно
аудиосигнал. Для того, чтобы произвести классификацию последовательности,
в последнем слое сети необходимо использовать полносвязный слой для
получения вектора фиксированной длины, равной количеству классов. Для
решения задачи разметки последовательности в архитектуре сети можно
избавиться от полносвязных слоёв – таким образом, длина выходной
последовательности будет зависеть от длины входной последовательности и
количество
меток
классификации
будет
длительности сигнала.
25
меняться
пропорционально
Рекуррентные нейронные сети
Рекуррентные нейронные сети можно рассматривать как развитие скрытых
марковских моделей, имитирующих марковский процесс с неизвестными
внутренними параметрами. В отличие от марковского процесса, в котором
следующее состояние зависит только от текущего, в рекуррентных сетях будущее
состояние может зависеть в том числе от нескольких состояний в прошлом. Из
этого также следует и преимущество рекуррентных сетей относительно
свёрточных в обработке последовательностей – свёрточные сети не способны
полностью учесть зависимость от предыдущих состояний сигнала. В анализе
текстов, речи и аудиосигналов в целом, широко используются 2 архитектуры –
LSTM (долгая краткосрочная память) и GRU (управляемый рекуррентный блок).
Обе архитектуры используют вентильный механизм – на каждом шаге обработки
последовательности набор вентилей решает какую долю информации из
прошлого стоит сохранить и какую долю новой информации стоит добавить.
GRU использует меньшее количество регулирующих вентилей, чем LSTM, что
уменьшает количество требуемых параметров. Кроме прямого моделирования
временных последовательностей, рекуррентные сети можно использовать для
анализа сигналов в частотной или временно-частотной областях. Кроме того,
возможно совмещение свёрточных и рекуррентных сетей в свёрточную
рекуррентную нейронную сеть, способную обрабатывать последовательности
изображений и учитывать их порядок. Рекуррентные сети возможно применить
для решения задачи классификации последовательности, поскольку результатом
их
работы
является
вектор
фиксированной
величины.
Разметку
последовательности можно удобнее и качественнее решить с помощью
Sequence-to-Sequence моделями.
Sequence-to-Sequence модели
Модели подобного рода способны напрямую переводить исходную
последовательность в желаемую без явного указания вида промежуточного
состояния. Это сильно упрощает решение задачи разметки последовательности,
26
поскольку достаточно только задать пару векторов (входной сигнал-выходные
метки), а сеть самостоятельно построит их внутреннее представление.
Перевод последовательности в последовательность выполняется с помощью
Connectionist Temporal Classification (CTC). CTC подход позволяет избежать
ручного разбиения большого аудиосигнала на отдельные участки и ручной
аннотации каждого из них – вместо этого, кроме имеющихся меток классов,
добавляется пробельный символ, показывающий отсутствие какого-либо класса.
Таким образом, при разметке можно будет промаркировать каждый сигнал
отдельной большой последовательностью меток с длиной, меньшей или равной
количеству сегментов в сигнале. CTC блок в схеме распознавания сигнала
располагается сразу после рекуррентной сети, которая занимается извлечением
информативных признаков из сегментов сигнала.
Выводы к главе 1
В главе 1 приведено краткое описание метода спектральной скважинной
шумометрии, позволяющей проводить качественные исследования на основе
интерпретации акустических данных. Проведён обзор существующих способов
представления акустических сигналов и алгоритмов, способных автоматически
обрабатывать и распознавать их.
На основе изученных источников были определены наиболее полные и
информативные представления акустических сигналов – расчёт спектрограммы
с помощью оконного преобразования Фурье с возможным переводом в мелшкалу для получения мел-спектрограммы. Также, при использовании достаточно
больших моделей, представляется возможным использовать акустический
сигнал в исходном представлении.
Интерпретация данных скважинной шумометрии остаётся сложной задачей
из-за наличия множества возможных причин возникновения сигнала. Поэтому
задача разработки интеллектуальной системы для анализа акустических данных
сохраняет свою актуальность.
27
ГЛАВА 2. РАЗРАБОТКА АВТОМАТИЧЕСКОЙ СИСТЕМЫ ОБРАБОТКИ
ДАННЫХ СКВАЖИННОЙ СПЕКТРАЛЬНОЙ ШУМОМЕТРИИ
Создание базы данных записей акустических сигналов для фильтрации
приборных шумов
Задача классификации для многих алгоритмов машинного обучения требует
большого количества обучающих примеров, составляющих репрезентативную
выборку, позволяющую выявить обобщающие закономерности в данных. Для
обнаружения акустических сигналов, вызванных соударениями приборной
связки об элементы конструкции скважины, были собраны данные с 3
вертикальных скважин, расположенных в регионе стран Персидского залива.
Максимальная
глубина
исследования
в
данных
скважинах
составляет
соответственно 2.07 км (6800 футов), 3.37 км (11060 футов), 2.1 км (6880 футов).
Из-за достаточно большой глубины скважин небольшие колебания подвеса, на
котором закреплена приборная связка, приводят к высокоамплитудным
колебаниям в нижней части скважины. Так, для выбранных скважин интервалы,
на которых связка шумомеров регистрирует шум от соударений, расположены в
следующих пределах соответственно: 1.46 – 2.07 км; 2.42 – 3.37 км; 1.79 – 2.1 км.
При исследовании скважин, в приборную связку были включены по 2 шумомера
для каждого исследования. Данные для обучающей и тестовой выборки были
составлены из разных шумомеров, находившихся в одной приборной связке, для
каждого
исследования,
чтобы
исключить
возможность
«запоминания»
обучающих примеров алгоритмом.
Поскольку типичный шаг, с которым поднимается приборная связка,
составляет от 1 до 3 метров, а глубина исследования составляет несколько
километров, итоговое количество записанных аудиосигналов крайне велико для
ручной обработки. Поэтому, перед вычислением качественных признаков, была
проведена автоматическая предобработка всего набора данных. Так как
длительность стоянки составляет от 40 до 60 секунд, а колебания прибора со
временем затухают, для поиска нестабильных стоянок выбирались первые 20
28
записей акустических сигналов на стоянке. Основная мощность шума,
вызванного соударениями прибора, сосредоточена в частотных составляющих до
10 кГц, что делает форму неравномерной с выраженным пиком в области низких
частот. Следовательно, полезной эвристикой может служить пороговая
фильтрация – если разница между минимальным значением амплитуды
гармоники в спектре и максимальным значением составляла 30 дБ, то такая
стоянка признавалась нестабильной. Для большей надёжности, автоматический
поиск нестабильных стоянок проводился в заранее указанном интервале,
приведённом выше. Ввиду стохастической природы сигнала, значения отдельных
амплитуд гармоник сигнала случайны и положение максимума может меняться,
поэтому перед пороговой фильтрацией было произведено сглаживание спектра
медианным фильтром с ядром, равным 11.
Наиболее информативным представлением сигнала является совместное
частотно-временное представление, которое удобно получить с помощью
оконного преобразования Фурье. Полученные спектрограммы или мелспектрограммы после нормализации можно использовать для обучения
свёрточных нейронных сетей. Спектрограммы рассчитывались с длиной окна
равной 256 отсчётам и шагом равным 8 отсчётам. Каждая спектрограмма была
переведена в децибелы – в качестве значения опорной амплитуды было принято
максимальное значение амплитуды в спектре. Каждая спектрограмма была
сохранена как изображение, то есть переведена в диапазон от 0 до 255.
Нормализация
рассчитанных
полученных
статистик
по
изображений
выборке,
проводилась
причём
каждое
при
помощи
изображение
предварительно было переведено в диапазон от 0 до 1. Среднее значение для
компонент RGB составили соответственно 0.96, 0.58, 0.45, а значение
стандартного отклонения составили соответственно 0.09, 0.18, 0.08.
Разбиение на тренировочную и валидационную выборки проводилось в
пропорции 80/20. Таким образом, количество примеров в тренировочной
выборке составило 83 151, количество примеров в валидационной выборке 29
20 789. Поскольку интервал, в котором шумомеры зарегистрировали шумы от
соударений приборной связки, значительно меньше, чем общая глубина
исследования, и в течение стоянки только часть записей акустических сигналов
соответствует соударениям, итоговая выборка была несбалансированной – в
тренировочной выборке 72673 примера относились к «полезным» шумам, а
10478 – к шумам, вызванным соударениями.
Создание базы данных записей акустических сигналов для определения зон
выноса мелкого песка
Для обучения алгоритма классификации потребовалось собрать наборы
данных, содержащих как примеры соударений песчинок с прибором и
элементами лабораторного стенда, имитирующего скважину, так и примеры
соударений пузырьков газа. Для составления подобных наборов данных были
проведены эксперименты на лабораторном стенде LDS-2. Для создания базы
данных соударений песчинок была проведена серия экспериментов, в которых
песчинки различных размеров подавались в стенд через перфорацию в стенке
обсадной колонны и НКТ (насосно-компрессорной трубы) с некоторой
фиксированной
скоростью,
значение
которой
изменялось
в
каждом
эксперименте. Таким образом были смоделированы случаи выноса песчинок с
различной
энергией
из
перфорации
в
скважине.
Размеры
песчинок,
использованных в экспериментах, были следующими:
50 – 70 мкм;
100 мкм;
200 мкм;
400 мкм.
Также ниже приведены скорости, с которыми песчинки поступали в стенд в
различных экспериментах:
10 м/мин;
20 м/мин;
40 м/мин;
30
50 м/мин;
100 м/мин.
Как видно из приведенных списков диаметров песчинок и их скоростей,
набор данных включал в себя разнообразные типы соударений. На рис.6 и рис. 7
приведены контрастированные изображения песчинок, из которых видно
насколько мелкий песок был использован:
Рис. 6 Песчинки с диаметром 0.08-0.16 мм
Рис. 7. Песчинки с диаметром 0.3-0.5 мм
Аналогичным образом была создана база акустических данных от
соударений пузырьков газа с прибором и элементами стенда. На рис. 8 приведена
31
схема использованного лабораторного стенда LDS-2:
Рис. 8. Схема лабораторного стенда LDS-2
Устройство данного стенда можно разделить на 2 основные части –
раздатчик смеси песка и воды и набор барьеров с прибором внутри,
имитирующий устройство реальной скважины. В раздатчике песка содержится
специальная ёмкость, заранее наполненная песчинками заданного диаметра;
мотор, отвечающий за равномерную подачу песка в воду; отдельный канал, по
которому прокачивается поток воды с заданной скоростью. Таким образом, к
прибору поступает смесь песка и воды с фиксированными параметрами,
обеспечивающими точность проводимого эксперимента. Набор барьеров
32
включает в себя обсадную колонну и НКТ; внутри НКТ располагается прибор
для измерения акустических сигналов – шумомер. Прибор располагается таким
образом, чтобы его часть, содержащая внутри себя высокочувствительный
пьезоэлектрический элемент, располагалась напротив перфорации в барьерах.
Подобное расположение прибора в стенде обеспечивает наиболее высокую
чувствительность при детектировании соударений, что особенно критично в
случае мелких песчинок.
Предобработка обучающей выборки
Из данных, собранных в ходе экспериментов, была составлена выборка
соударений песчинок и пузырьков газа. Размер выборки, соответствующий
соударениям песчинок, был равен 3126 векторам длиной 1024; размер выборки
соударений пузырьков газа составил приблизительно 402000 векторов с
аналогичной длиной. Как видно, получившаяся выборка была крайне
несбалансированной, что позже отразилось на процессе обучения алгоритма.
Каждый вектор из выборки был стандартизирован по следующей формуле:
𝒙− 𝜇
𝒛=
,
𝜎
в которой x – исходный вектор акустических данных, μ – его среднее, σ – его
стандартное отклонение, z – итоговый стандартизированный вектор. Данная
операция не изменяет вид распределения элементов исходного вектора, но
приводит все вектора в единый интервал с средним = 0 и стандартным
отклонением = 1, что способствует более качественному обучению алгоритма. На
рис. 9 и рис. 10 приведены графики не стандартизированных акустических
сигналов. Из данных графиков видно, что акустические сигналы от соударений
одной природы могут иметь существенные различия в форме, а также, что
графики акустических сигналов от соударений песчинок отличаются от графиков
соударений пузырьков газа, что дало основание предположить о наличии
некоторых признаков, заложенных в сигнал, позволяющих различить их с
помощью классифицирующего алгоритма.
33
Рис. 9. Акустические сигналы от соударений песчинок
Рис. 10. Акустические сигналы от соударений пузырьков газа
Перед обучением алгоритма вся выборка была перемешена и разбита на 3
части в соотношении 80:10:10, таким образом, чтобы сохранить соотношение
примеров соударений различной природы в исходном несбалансированном
отношении. Наибольшую часть составила обучающая выборка, на основе
которой классифицирующий алгоритм должен был извлечь значимые признаки
34
для автоматического разделения соударений от разных источников. Равные по
размерам части составили валидационная и тестовая выборки. Первая
использовалась для независимой оценки качества работы алгоритма на
определенном этапе его обучения, а также для подбора гиперпараметров
алгоритма, т.е. параметров, которые невозможно настроить автоматически в
течение обучения. Тестовая часть использовалась после обучения алгоритма для
окончательного определения качества работы алгоритма с помощью выбранных
метрик.
Выбор алгоритма для классификации акустических сигналов, содержащих
приборные шумы
Наиболее высокое качество работы при решении задач распознавания
изображений показывают свёрточные нейронные сети, способные на основе
данных выучивать наборы фильтров для поэтапного выделения геометрических
признаков на изображении и построении выводов на их основе. Начиная с 2012
года после публикации статьи, описывающей нейронную сеть AlexNet,
исследователями создано множество архитектур сетей, решающих широкий круг
задач компьютерного зрения – классификацию изображений, локализацию и
детектирование объектов, сегментацию участков изображения и даже генерацию
синтетических. Качество работы сетей определяется не только структурой
внутренних слоёв, но и количеством обучаемых параметров – другими словами,
количеством свёрточных фильтров. Современные сети с высоким качеством
работы, такие как ResNet, ResNext, Wide-ResNet, NasNet, EfficientNet, содержат в
себе десятки миллионов параметров и, следовательно, не могут обеспечить
высокое быстродействие для проведения частых экспериментов [23-27].
Хорошим
соотношением
точность/скорость
обладают
современные
свёрточные сети, заточенные под работу на платформах с низкой мощностью –
одноплатных
компьютерах,
мобильных
устройствах,
энергоэффективных
платформах для нейросетевых вычислений (Intel Movidius, NVidia Jetson Nano).
В 2018 году группа исследователей из компании Megvii и Университета Цинхуа
35
представила свёрточную сеть ShuffleNetV2. Авторы смогли сохранить
быстродействие сети благодаря качественному анализу принципов построения
сети.
Таблица 1. Архитектура сети ShuffleNetV2
Выходной
Размер
размер
фильтра
310x302
Свёртка
Слой
Выходные
Сдвиг
Повторения
-
-
-
155x151
3x3
2
1
Пулинг
77x75
3x3
2
1
Свёрточный
38x37
2
1
блок
38x37
1
3
Свёрточный
19x18
1x1
2
1
блок
19x18
3x3
1
7
Свёрточный
9x9
1x1
2
1
блок
9x9
1
3
Свёртка
9x9
1x1
1
1024
Пулинг
1x1
9x9
1
-
-
2
Входное
изображение
Полносвязный
слой
-
каналы
3
24
48
96
192
Для классификации акустических приборных шумов использовалась
оригинальная архитектура сети ShuffleNetV2 c изменённым последним
полносвязным слоем таким образом, чтобы длина выходного вектора равнялась
требуемому количеству классов [28]. В Таблице 1 приведена полная архитектура
сети.
Свёрточные блоки в сети являются последовательностью 3 двумерных
свёрток с размерами фильтров 1x1, 3x3 и 1x1 соответственно. Каждый блок
отличается от предыдущего только количеством каналов или карт признаков в
36
входном тензоре.
В качестве функции потерь выбрана перекрёстная энтропия, что
соответствует постановке задачи классификации – минимизации расстояния
Кульбака-Лейблера между известным условным распределением данных и
условным распределением значений предсказаний сети. Для регуляризации в
функцию потерь было добавлено штрафное слагаемое в виде суммы квадратов
значений параметров сети – L2-регуляризация. Кроме того, дополнительный
эффект регуляризации оказывала пакетная нормализация внутри слоёв сети и
набор случайных преобразований исходных тренировочных изображений. В
качестве алгоритма оптимизации был выбран Adam с параметрами по
умолчанию, рекомендуемыми авторами оригинальной статьи [32].
Разработка алгоритма распознавания акустических сигналов, вызванных
соударениями частиц и элементов шумомеров
Ввиду современных успехов в области глубокого обучения нейронных
сетей, в качестве классифицирующего алгоритма была выбрана свёрточная
нейронная сеть с одномерными свёрточными слоями [29, 30]. Для качественного
различия сигналов требуется учитывать большое количество гармоник,
составляющих сигнал, а также разнообразие их фаз в зависимости от
рассматриваемого сигнала. Данные признаки тяжело подобрать вручную, а более
простые алгоритмы машинного обучения могут не справиться достаточно
качественно с их выделением. Свёрточная нейронная сеть успешно учитывает
разнообразие признаков, а также способна самостоятельно выучить их из данных
в обучающей выборке. Рис. 11 иллюстрирует работу использованной свёрточной
сети, а в Таблице 2 приведено краткое описание каждого слоя.
37
Рис. 11. Свёрточная нейронная сеть
38
Таблица 2. Архитектура свёрточной нейронной сети
Номер
Описание слоя
слоя
1
Входной слой, [1x1024]
2
Свёрточный слой, [128х1х80], сдвиг=4
Слой пулинга, [1x4]
3
Свёрточный слой, [128x128x3], сдвиг=1
Слой пулинга, [1x4]
4
Свёрточный слой, [256x128x3], сдвиг=1
Слой пулинга, [1x4]
5
Свёрточный слой, [512x256x3], сдвиг=1
Слой пулинга, [1x4]
6
Свёрточный слой, [1024x512x3], сдвиг=1
Слой пулинга, [1x4]
7
Слой глобального пулинга
8
Полносвязный слой, [1x1024]
9
Выходной слой, [1x2]
Входной слой свёрточной сети имеет длину в 1024 нейрона, что
соответствует длине использованных акустических сигналов. Данные с входного
слоя подаются на первый свёрточный слой. Данный слой содержит 128 наборов
одномерных свёрточных фильтров длиной 80. Поскольку в входном сигнале
имеется только 1 канал, то и в каждом наборе содержится только по 1
свёрточному фильтру. Данные фильтры проходят вдоль вектора входного слоя с
шагом 4, т.е. смещаясь после каждой свёртки на 4 элемента. Особенностью
данного слоя является большая длина свёрточного фильтра – 80 элементов.
Благодаря набору подобных длинных фильтров первый свёрточный слой может
имитировать набор полосовых фильтров, которые эффективно выделяют
различные гармоники, составляющие сигнал. Кроме того, свёрточные фильтры
39
инварианты к фазе сигнала.
После свёрточного слоя располагается слой пулинга, работа которого
заключается в понижении размерности сигнала после свёртки следующим
способом – каждый полученный вектор разделяется на меньшие вектора длиной
4, из которых образуются элементы для входного вектора, следующего
свёрточного слоя. В данной сети использовалось усреднение в качестве операции
для понижения размерности, т.е. входной вектор следующего слоя был составлен
из средних значений каждого вектора длиной 4 из вектора предыдущего слоя.
После нескольких наборов свёрточных слоёв и слоёв пулинга находится
слой глобального пулинга, который сильно понижает размерность данных путем
усреднения каждого канала выходного сигнала [31]. Так как после 6 свёрточного
слоя выходной сигнал имел 1024 канала, то после применения глобального
пулинга он был преобразован в вектор длиной 1024 элемента. Данный вектор был
подан в полносвязный слой сети, в котором все нейроны текущего слоя связаны
со всеми нейронами последующего слоя. Последним слоем был полносвязный
слой
длиной
в
2
элемента,
поскольку
исходная
задача
требовала
классифицировать аудиосигналы на 2 непересекающихся класса.
Выводы к главе 2
В главе 2 описаны выбранные представления акустических данных для
решения задач распознавания приборных шумов и детектирования зон выноса
песка. Для распознавания приборных шумов на основе акустических сигналов
были рассчитаны спектрограммы, а для детектирования зон выноса песка были
использованы
стандартизированные
акустические
сигналы.
Исходя
из
полученных данных, были разработаны 2 модели – классическая свёрточная сеть
для обработки спектрограмм как изображений и свёрточная сеть с одномерными
свёртками для обработки исходных акустических сигналов.
40
ГЛАВА 3. ПРИМЕНЕНИЕ АВТОМАТИЧЕСКОЙ СИСТЕМЫ ОБРАБОТКИ
ДАННЫХ
СКВАЖИННОЙ
ШУМОМЕТРИИ
ДЛЯ
УДАЛЕНИЯ
АКУСТИЧЕСКИХ ШУМОВ
Обработка акустических данных спектральной скважинной шумометрии
скважины №1
Тестирование качества работы алгоритма проводилось на данных с
скважины, не входивших в обучающую выборку. Данные были записаны с
помощью прибора, который находился в одной приборной связке с ещё одним
шумомером. Особенностью данных со скважины является то, что на протяжении
всего интервала исследования приборная связка создавала посторонние шумы,
вызванные соударениями об элементы конструкции скважины. Глубина
исследования составила 2.42 – 3. 37 км, в ходе исследования шумы, вызванные
работой пласта, заколонными перетоками или повреждениями элементов
конструкции скважины, обнаружены не были. Таким образом, автоматической
системе требовалось отличить фоновые шумы от посторонних.
Результаты работы автоматической системы представлены на рис. 6 и рис. 7.
На рис. 12 представлена спектральная панель скважины до очистки от
посторонних шумов. Спектральная панель построена в координатах глубиначастота. По данным скважинной спектральной шумометрии видно множество
шумов, расположенных преимущественно в полосе до 10 кГц и быстро
затухающих с ростом частоты. Также, на спектральной панели присутствует
постоянная частотная компонента на частоте 50 кГц, вызванная работой блока
электроники внутри прибора. Спектральная панель построена только по данным
с высокочастотного канала шумомера, поэтому в итоговом спектре отсутствует
информация о частотах ниже 4 кГц – эта деталь представлена в виде сплошной
фиолетовой полосы в левой части спектров.
На рис. 13 представлена спектральная панель скважины после очистки от
посторонних шумов. Видно, что автоматическая система позволяет снизить
уровень сигнала от шумов в среднем на 15 дБ, однако не способна полностью
41
устранить эти шумы.
Рис. 12. Спектральная панель до удаления шумов
42
Рис. 13. Спектральная панель после удаления шумов
43
Обработка акустических данных спектральной скважинной шумометрии
скважины №2
Интервал исследования на данной скважине составил 1.46 – 2.07 км. На рис.
14 и рис. 15 представлены результаты работы нейронной сети. Видно, что на
данных скважины не получилось добиться заметного снижения уровня шума от
соударений приборной связки.
Рис. 14. Спектральная панель до удаления шумов
44
Рис. 15. Спектральная панель после удаления шумов
Обработка акустических данных спектральной скважинной шумометрии
скважины №3
Основным отличием данных с рассматриваемой скважины от данных с
предыдущих скважин является наличие мощного широкополосного сигнала,
вызванного повреждением конструкции скважины и протеканием флюида через
него. На практике алгоритм не справляется достаточно качественно с
разделением сигналов, вызванных приборным шумом или протеканием флюида
через повреждения конструкции скважины, что может привести к потере
информации о «полезном» сигнале в месте повреждения скважины. Для
устранения данного недостатка новый алгоритм удаления приборных шумов был
использован совместно с предыдущим алгоритмом – для тех стоянок, на которых
новый алгоритм признал все акустические записи вызванными соударениями
приборной связки, рассчитывается мощность для каждого акустического сигнала
и находятся 3 самых слабых по мощности. Далее, на основе 3 выбранных
45
«тихих» акустических записей производится расчёт усреднённого спектра,
который далее используется при визуализации в спектральной панели.
Результаты работы алгоритма представлены на рис. 16 и рис. 17.
Как видно из сравнения спектральных панелей, алгоритм позволяет
незначительно снизить уровень приборного шума. Благодаря пост-обработке
предсказаний алгоритма с помощью нахождения 3 самых «тихих» акустических
записей, получилось полностью сохранить информацию о широкополосном
сигнале. Однако, поскольку для расчёта усреднённого спектра использовалось
сравнительно небольшое количество сигналов, в области широкополосного
сигнала появились помехи, отображённые на спектральной панели. Данные
помехи на вносят существенного влияния на итоговый вид визуализации и,
следовательно, не могут помешать при последующем анализе состояния
скважины.
46
Рис. 16. Спектральная панель до удаления шумов
47
Рис. 17. Спектральная панель после удаления шумов
48
Сравнение
качества
работы
алгоритмов
автоматического
удаления
акустических шумов
Предложенная автоматическая система обработки данных скважинной
шумометрии способна распознать и удалить акустические шумы, вызванные
соударениями приборной связки, только на части рассмотренных скважин.
Наиболее ярко приборные шумы наблюдаются на спектральной панели
скважины №2. Предыдущий алгоритм удаления приборных шумов не способен
обнаружить стоянку, содержащую акустические приборные шумы, однако
гораздо эффективнее удаляет их с спектральной панели. Ниже представлены
результаты работы алгоритма на всех рассмотренных выше скважинах с
использованием записей акустических сигналов с тех же самых приборов.
Рис. 18. Спектральная панель после удаления шумов
49
Рис. 19. Спектральная панель после удаления шумов
50
Рис. 20. Спектральная панель после удаления шумов
51
Выводы к главе 3
На основе созданной обучающей выборки была обучена модель для
распознавания и фильтрации приборных шумов, проведено тестирование на
отложенных данных и проведено сравнение с предыдущим алгоритмом
фильтрации. Из сравнения полученных данных видно, что предложенная система
не справляется достаточно хорошо с фильтрацией приборных шумов, в отличие
от прежнего алгоритма. Однако, разработанный алгоритм обладает заметным
преимуществом – поскольку для удаления шумов производится распознавание
каждого акустического сигнала, то его можно использовать в качестве
индикаторной системы для обнаружения интервалов, содержащих приборные
шумы, например, при обработке данных скважинной спектральной шумометрии
в реальном времени. Пополнение базы данных акустических записей примерами
с других скважин может помочь повысить качество работы предложенной
модели, в частности, исключить ошибочную интерпретацию широкополосных
сигналов, достигших по мощности максимума динамического диапазона
прибора.
52
ГЛАВА 4. ПРИМЕНЕНИЕ АВТОМАТИЧЕСКОЙ СИСТЕМЫ ОБРАБОТКИ
ДАННЫХ СКВАЖИННОЙ ШУМОМЕТРИИ ДЛЯ ОПРЕДЕЛЕНИЯ ЗОН
ВЫНОСА ПЕСКА
Тестирование на лабораторных данных
Для
оценки
качества
работы
системы
также
были
проведены
дополнительные эксперименты с водой, насыщенной пузырьками газа. Таким
образом, система должна была выделить соударения песчинок с прибором или
элементами скважины несмотря на присутствие пузырьков газа в воде. Были
проведены 4 эксперимента:
Текущий поток воды через стенд без песка со скоростью 25 л/мин;
Текущий поток воды через стенд со скоростью 25 л/мин и поток воды
через перфорацию со скоростью 3 л/мин без песка;
Текущий поток воды через стенд со скоростью 25 л/мин и поток воды
через перфорацию со скоростью 3 л/мин с мелким песком;
Поток воды через перфорацию в стенде со скоростью 3 л/мин с
мелким песком.
В ходе эксперимента шумомер протягивался по лабораторному стенду
таким образом, чтобы имитировать его движение в реальной скважине в
уменьшенном масштабе – каждые 20 сантиметров шумомер движение шумомера
прекращалось для записи не зашумлённых движением акустических данных. В
качестве индикатора наличия или отсутствия песка было выбрано процентное
соотношение количества сигналов, классифицированных как сигналы от
соударений песчинок, к общему количеству сигналов, записанных на стоянке.
Рассчитанные значения далее объединялись в непрерывный лог данных,
отображающий изменение процентного соотношения сигналов, полученных от
соударений песчинок. Рис. 21 и рис. 22 иллюстрируют полученные результаты.
На рис. 7 изображены результаты экспериментов с водой без песчинок.
Панель WELL SKETCH содержит схематичное изображение лабораторного
стенда; синими стрелками показаны потоки воды внутри стенда. В соседней
53
панели SNL находится спектрограмма акустических данных, записанных внутри
стенда. Вертикальные, локализованные по частоте, полосы соответствуют
шумам
от
потока
жидкости
внутри
стенда;
узкие
горизонтальные,
локализованные по глубине, полосы соответствуют шумам от потока воды через
перфорацию в стенде. Видно, что как при наличии, так и при отсутствии потока
воды через перфорацию алгоритм корректно показывает отсутствие песка в воде,
ошибочно классифицируя лишь небольшую долю сигналов на каждой стоянке.
Данным результатам соответствуют панели SMALL GRAIN INDICATOR.
Рис. 21. Эксперименты без песка
54
Рис. 22. Эксперименты с песком
На рис.8 изображены результаты экспериментов с водой, содержащей
мелкий песок. В обоих экспериментах песчинки подавались вместе с потоком
воды через перфорацию в стенде, однако в одном из экспериментов отсутствовал
поток воды внутри самого стенда. На логах на панелях SAND INDICATOR
отчетливо видны пики, соответствующие инжекции песка в лабораторный стенд.
Важной деталью на данных логах являются некоторые «колебания» индикатора
после перфорации, сообщающие об остаточном наличии песка. Подобная
ситуация, соответствует вторичным соударениям песчинок с шумомером, как
показано на рис. 23 (б).
55
Рис. 23. а). Первичные соударения песчинок
б). Вторичные соударения песчинок
Тестирование на скважинных акустических данных
Несмотря на то, что конструкция лабораторного стенда имитирует
конструкцию реальной скважины, создание аналогичные условий в лаборатории
является трудоемкой задачей. Поэтому было принято решение провести
тестирование системы на реальный скважинных акустических данных, для
которых были заранее известны зоны выноса мелкого песка. Полученный
индикатор можно сравнить с значениями индикатора от предыдущего алгоритма,
настроенного на детектирование более крупных песчинок.
На рис. 24 и рис. 25 представлены результаты работы системы на реальных
скважинных данных. На панели WELL SKETCH небольшими зелеными
треугольниками на схематичном изображении НКТ отмечены перфорации, через
которые поступает флюид. На панели SNL SAND COUNT изображены
результаты идентификации зон выноса песка предыдущим алгоритмом.
Поскольку соударения от крупных песчинок достаточно хорошо различимы, то в
качестве единиц оценки наличия песка было выбрано отношение количества
задетектированных песчинок за секунду.
56
Рис. 24. Детектирование мелкого песка на скважинных данных
57
Рис. 25. Детектирование мелкого песка на скважинных данных
На
приведенных
рисунках
видно,
что
алгоритм
смог
успешно
идентифицировать зоны выноса мелкого песка на глубинах X480 и X730 (первая
цифра глубины скрыта), несмотря на наличие множества перфораций в НКТ.
Также видно, что предсказания предыдущего алгоритма не позволяют
достоверно сделать вывод о наличии песка в имеющихся перфорациях,
58
поскольку количество песчинок, выносимых из перфорации в секунду, крайне
мало, что может быть следствием ошибок первого рода, допускаемых
предыдущим алгоритмом.
Рис. 26. Детектирование мелкого песка на скважинных данных
На Рис.26 показаны результаты гранулометрического анализа проб песка,
взятых из добываемого флюида на поверхности скважины. Из гистограммы
видно, что более 70% песчинок имело размер менее 100 микрон.
Выводы к главе 4
На основе представленных результатов видно, что обученная модель
успешно справляется с распознаванием акустических сигналов, вызванных
соударениями песчинок и пузырьков воды об элементы конструкции шумомера.
Тестирование работы алгоритма на лабораторных данных продемонстрировало
его способность разделять акустические сигналы разной природы. Тестирование
на реальных скважинных данных показывает способность сети находить
интервалы, точно или близко соответствующие действительным зонам выноса
песка.
Увеличение базы акустических данных и переобучение модели на ней
способны повысить качество работы системы. Также, дополнительное изучение
и сравнение характеристик акустических сигналов, записанных в лабораторных
экспериментах и скважинных исследованиях, может помочь довести качество
работы системы на реальных данных до качества работы на лабораторных.
59
ЗАКЛЮЧЕНИЕ
В работе рассмотрен метод качественного анализа состояния скважин на
основе интерпретации характеристик акустических сигналов – скважинная
спектральная шумометрия. Рассмотрены принципы и методика проводимых
исследований скважин; возможные варианты интерпретации записанных
прибором акустических данных. Показано, что ручной анализ акустических
сигналов, получаемых в ходе исследования, остаётся непростой задачей, в
решении которой способна помочь интеллектуальная система для обработки и
интерпретации акустических данных.
Для создания подобной системы проведен обзор существующих способов
представления акустических сигналов для дальнейшей обработки. Также,
приведён краткий обзор существующих алгоритмов, способных самостоятельно
находить закономерности в данных и участвовать в построении выводов на
основе новых данных. В качестве информативных представлений были выбраны
сами акустические сигналы в исходной форме и спектрограммы.
Для решения задачи автоматической интерпретации акустических данных
была создана обучаемая
система, включающая в себя
2
алгоритма,
предназначенных для распознавания и фильтрации приборных шумов и
детектирования зон выноса мелкого песка. Для каждого алгоритма были собраны
и предобработаны соответствующие акустические данные, содержащие в себе
примеры сигналов требуемой природы, которые далее были использованы для
обучения и тестирования.
На основе подготовленных данных было проведено обучение обеих систем.
На отложенных данных была проведена оценка качества работы систем.
Алгоритм, предназначенный для удаления шумов, вызванных соударениям
приборной связки об элементы конструкции, показал более низкое качество
работы относительно уже используемого алгоритма. Однако, его можно
использовать в качестве индикатора областей, в которых «полезные»
акустические данные оказались зашумлены. Предыдущий алгоритм фильтрации
60
не имеет возможности предоставить подобную информацию и, следовательно,
не может быть использован в качестве индикаторной системы.
Алгоритм, предназначенный для определения зон выноса мелкого песка,
продемонстрировал высокое качество работы как на лабораторных данных, так и
на реальных скважинных. Разработанная модель способна достаточно точно
обнаруживать интервалы, в которых происходит вынос песка. Её качественное
отличие от предыдущих подобных моделей состоит в способности обнаруживать
зоны выноса песка размером менее 100 микрон, что подтверждается
результатами гранулометрического анализа.
61
СПИСОК ЛИТЕРАТУРЫ
1.
Hinze J. 0.(1959) Turbulence: An introduction to its mechanism and theory
//McGraw-I-I111. – 1959.
2.
Николаев С. А., Овчинников М. Н. Генерация звука фильтрационным
потоком в пористых средах //Акустический журнал. – 1992. – Т. 38. – №. 1. – С.
114-118.
3.
Сковородников И. Г. Геофизические исследования скважин: Учебное
пособие. 3-е изд., перераб. и доп. //Екатеринбург: Институт испытаний. – 2009.
4.
Асланян А. М. и др. Диагностика заколонных перетоков газа комплексом
высокоточной термометрии, спектральной шумометрии и импульсного нейтроннейтронного каротажа //Территория «НЕФТЕГАЗ». – 2016. – №. 6. – С. 52-59.
5.
Заславский Ю. М. К теории акустической эмиссии при фильтрации газа
частично флюидонасыщенной средой //Техническая акустика. – 2005. – Т. 5. –
№. 5.
6.
Wang Y. et al. Study of displacement efficiency and flow behavior of foamed
gel in non-homogeneous porous media //PloS one. – 2015. – Т. 10. – №. 6.
7.
Makhoul J. A fast cosine transform in one and two dimensions //IEEE
Transactions on Acoustics, Speech, and Signal Processing. – 1980. – Т. 28. – №. 1. –
С. 27-34.
8.
Gemmeke J. F. et al. Audio set: An ontology and human-labeled dataset for
audio events //2017 IEEE International Conference on Acoustics, Speech and Signal
Processing (ICASSP). – IEEE, 2017. – С. 776-780.
9.
Gerhard D. Audio signal classification: History and current techniques. –
Department of Computer Science, University of Regina, 2003.
10.
Szeliski R. Computer vision: algorithms and applications. – Springer Science &
Business Media, 2010.
11.
Purwins H. et al. Deep learning for audio signal processing //IEEE Journal of
Selected Topics in Signal Processing. – 2019. – Т. 13. – №. 2. – С. 206-219.
62
12.
Kim D. S. et al. Feature extraction based on zero-crossings with peak amplitudes
for robust speech recognition in noisy environments //1996 IEEE International
Conference on Acoustics, Speech, and Signal Processing Conference Proceedings. –
IEEE, 1996. – Т. 1. – С. 61-64.
13.
McKinney M., Breebaart J. Features for audio and music classification. – 2003.
14.
Mitrović D., Zeppelzauer M., Breiteneder C. Features for content-based audio
retrieval //Advances in computers. – Elsevier, 2010. – Т. 78. – С. 71-150.
15.
Mitrović D., Zeppelzauer M., Breiteneder C. Discrimination and retrieval of
animal sounds //2006 12th International Multi-Media Modelling Conference. – IEEE,
2006. – С. 5 pp.
16.
Elder J. H., Goldberg R. M. Image editing in the contour domain //Proceedings.
1998 IEEE Computer Society Conference on Computer Vision and Pattern
Recognition (Cat. No. 98CB36231). – IEEE, 1998. – С. 374-381.
17.
Krizhevsky A., Sutskever I., Hinton G. E. ImageNet classification with deep
convolutional neural networks //Advances in neural information processing systems. –
2012. – С. 1097-1105.
18.
Bahoura M., Ezzaidi H. Implementation of spectral subtraction method on
FPGA using high-level programming tool //2012 24th International Conference on
Microelectronics (ICM). – IEEE, 2012. – С. 1-4.
19.
Sinha S. N. et al. Interactive 3D architectural modeling from unordered photo
collections //ACM Transactions on Graphics (TOG). – 2008. – Т. 27. – №. 5. – С. 110.
20.
Müller M. Fundamentals of music processing: Audio, analysis, algorithms,
applications. – Springer, 2015.
21.
Brown M., Szeliski R., Winder S. Multi-image matching using multi-scale
oriented patches //2005 IEEE Computer Society Conference on Computer Vision and
Pattern Recognition (CVPR'05). – IEEE, 2005. – Т. 1. – С. 510-517.
22.
Matas J. et al. Robust wide-baseline stereo from maximally stable extremal
regions //Image and vision computing. – 2004. – Т. 22. – №. 10. – С. 761-767.
63
23.
He K. et al. Deep residual learning for image recognition //Proceedings of the
IEEE conference on computer vision and pattern recognition. – 2016. – С. 770-778.
24.
Xie S. et al. Aggregated residual transformations for deep neural networks
//Proceedings of the IEEE conference on computer vision and pattern recognition. –
2017. – С. 1492-1500.
25.
Zagoruyko S., Komodakis N. Wide residual networks //arXiv preprint
arXiv:1605.07146. – 2016.
26.
Zoph B. et al. Learning transferable architectures for scalable image recognition
//Proceedings of the IEEE conference on computer vision and pattern recognition. –
2018. – С. 8697-8710.
27.
Tan M., Le Q. V. EfficientNet: Rethinking model scaling for convolutional
neural networks //arXiv preprint arXiv:1905.11946. – 2019.
28.
Ma N. et al. Shufflenet v2: Practical guidelines for efficient cnn architecture
design //Proceedings of the European Conference on Computer Vision (ECCV). –
2018. – С. 116-131.
29.
Lee J. et al. Raw waveform-based audio classification using sample-level cnn
architectures //arXiv preprint arXiv:1712.00866. – 2017.
30.
Dai W. et al. Very deep convolutional neural networks for raw waveforms //2017
IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP).
– IEEE, 2017. – С. 421-425.
31.
Lin M., Chen Q., Yan S. Network in network //arXiv preprint arXiv:1312.4400.
– 2013
32.
Kingma D. P., Ba J. Adam: a method for stochastic optimization. CoRR
abs/1412.6980 (2014). – 2014.
64
Отзывы:
Авторизуйтесь, чтобы оставить отзыви хорошего настроения
удачи
успехов в конкурсе
Наверное было затрачено много времени и труда на работу
Продолжай свое исследование
Админам респект
И продвижения статьи в топы?
Как на счет взаимных комментариев под работами?)
Красиво написанная работа
Так держать
Молодец
Интересная работа!