Федеральное агентство связи
Федеральное государственное бюджетное образовательное учреждение
высшего образования
«ПОВОЛЖСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ТЕЛЕКОММУНИКАЦИЙ И ИНФОРМАТИКИ»
Болвашенков Иван Викторович
РАЗРАБОТКА ИНТЕЛЛЕКТУАЛЬНОГО МОДУЛЯ НА
ОСНОВЕ МЕТОДОВ МНОГОКРИТЕРИАЛЬНОГО АНАЛИЗА
И МЕТОДОВ ИИ В ЗАДАЧАХ ПОСТАНОВКИ ДИАГНОЗА И
НАЗНАЧЕНИЯ ЛЕЧЕНИЯ БОЛЬНЫМ ТЭЛА
Диссертация на соискание степени
магистра по направлению
«Прикладная информатика (в медицине)»
Самара 2019
Работа выполнена на кафедре прикладной информатики.
Магистрант __________ Болвашенков И.В.
«___» ____________
2019 г.
подпись
дата
Научный руководитель
профессор ___________ Краснов С.В.
«___» ____________ 2019 г.
подпись
дата
Работа допущена к защите.
Зав. кафедрой ПИ
профессор ____________ Маслов О.Н.
«___» ____________ 2019 г.
подпись
Нормоконтролер
______________
дата
_______
__________
П одпись
ВКР прошла проверку на объем
заимствований
% заимствований Руководитель ВКР
Электронная версия ВКР получена
Ответственный сотрудник
Дата
Инициалы Фамилия
_________
_______
______________
_________
______
______________
Подпись
Дата
Инициалы Фамилия
Содержание
Реферат…………………………………………………………………..
Введение…………………………………………………………………
1 ТЭЛА. Эффективность шкал. Методы многокритериального
анализа. Методы искусственного интеллекта ………………….….....
1.1 Эпидемиология и этиология ТЭЛА …………………….….....
1.2 Виды шкал и их эффективность в оценке риска развития
ТЭЛА ………………………………………………………………..
1.3 Методы многокритериального анализа ……………………....
1.4 Методы искусственного интеллекта в медицине …………....
2 Анализ, предварительная обработка и подготовка исходных
данных, разработка модуля постановки диагноза и назначения
лечения больным с ТЭЛА ..............………………………….…...........
2.1 Сбор и описание исходных данных ………………….….......
2.2 Выбор инструментов для обработки и работы с данными …
2.3 Формирование требований для работы с нейронными
сетями ……………………….………………………….….....……..
2.4 Построение нейронной сети, анализ результата …………......
2.5 Разработка и описание алгоритма модуля в задачах
постановки диагноза и назначения лечения больным ТЭЛА,
оценка результатов ……………………….….....…………….........
Заключение …………………………………………………………......
Список использованных источников ……………………....................
Приложение А. Часть листинга кода по инициализации сети,
тренировке нейронной сети, опросе нейронной сети ……………......
Приложение Б. Обработка данных …………………………..……......
4
5
10
10
11
16
17
24
24
33
41
43
46
50
52
57
60
Федеральное государственное бюджетное образовательное учреждение
высшего образования
«Поволжский государственный университет телекоммуникаций и
информатики»
РЕФЕРАТ
Название
Автор
Научный
руководитель
Ключевые слова
Дата публикации
Разработка интеллектуального модуля на основе
методов многокритериального анализа и методов ии в
задачах постановки диагноза и назначения лечения
больным ТЭЛА
Болвашенков Иван Викторович
Краснов Сергей Викторович
Искусственный интеллект, современная медицина,
нейронная сеть, машинное обучение, тромбоэмболия
легочных артерий, шкалы эффективности оценки
2019
Библиографическое Болвашенков И.В. Разработка интеллектуального
описание
модуля на основе методов многокритериального
анализа и методов ии в задачах постановки диагноза и
назначения
лечения
больным
ТЭЛА
[Текст]:
магистерская диссертация / Болвашенков И.В.
Поволжский
государственный
университет
телекоммуникаций и информатики (ПГУТИ). Отдел
аспирантуры и магистратуры. Кафедра прикладной
информатики: науч. рук. С.В. Краснов — Самара. 2019
Аннотация
В диссертации рассмотрены современные методы
разработки интеллектуального модуля на основе
методов многокритериального анализа и методов ИИ в
задачах постановки диагноза и назначения лечения
больным ТЭЛА
Руководитель ВКР
________________
Подпись
________________
Дата
_______________________
Инициалы Фамилия
Введение
В современной клинической практике наука достигла серьезных
успехов. Сейчас есть, как теоретическая, так и практическая базы, которые
позволяют справиться с такими заболеваниями, с которыми медицина
прошлых веков оказывалась бессильна. Однако остаются осложнения, в
клинике внутренних болезней, являющие актуальной проблемой, связанной с
высоким ростом распространения и высокой долей вероятности летального
исхода.
Патологии, которые без точной и своевременной диагностики,
приведут не только к неправильной постановке диагноза, но и к ухудшению
здоровья или даже смерти. Например, тромбоэмболия легочной артерии.
ТЭЛА является
распространенной
сердечнососудистой
болезнью
и
встречается в практике у врачей многих специальностей. Тромбоэмболия
появляется, как правило, внезапно, не имеет конкретных признаков, трудно и
во множестве случаев, несвоевременно диагностируется, приводя к высокой
смертности. Качественный сбор и проведение полного анамнеза пациента на
ранних этапах спасет жизни многим людям. Но и усложнит задачу врачам.
Не так просто принять верное решение в постановке диагноза и назначения
лечения, ведь объем медицинских данных огромен, а в некоторых случаях
совокупность сведений, полученных при медицинском обследовании, может
быть противоречива или ложна.
Чтобы быстро помочь пациенту, врачам в помощь придет, помимо
собственного, еще один интеллект — искусственный [1].
Своевременная диагностика ТЭЛА – является одной из важнейших
проблем медицины в связи с ее широкой распространенностью и высокой
летальностью. Ведь ТЭЛА — занимает второе место среди причин внезапной
смерти,
после
заболеваний,
и
остановки
третье
кровообращения
—
по
частоте
вследствие
смерти
сердечных
населения
от
сердечнососудистых заболеваний после инфаркта миокарда и инсульта [2].
Выбор темы диссертации обуславливается сложившейся проблемой,
описанной
выше.
Для
создания
искусственного
модуля
в
целях
5
прогнозирования риска возникновения ТЭЛА у поступающих в стационар
пациентов, были изучены современные методы оценки постановки диагноза
и назначения лечения больным тромбоэмболии легочных артерий и изучены
методы многокритериального анализа и методы искусственного интеллекта
в медицине. Была сконструирована
нейронная сеть с использованием
различных инструментов. После обучения нейронной сети был получен и
составлен перечень критериев, которые в ходе анализа нейронной сети
показали себя важными и оказывали «большое» влияние на прогноз
вероятного риска заболевания пациентом ТЭЛА. Из полученных результатов
могут быть составлены новые шкалы или методы оценки постановки
диагноза и назначения лечения больным тромбоэмболии легочных артерий.
Объект исследования – интеллектуальный модуль на основе методов
многокритериального анализа и методов искусственного интеллекта, система
сбора и обработки медицинских данных для постановки диагноза и
назначения лечения больным ТЭЛА в ГБУЗ Самарский областной
клинический кардиологический диспансер им. В.П. Полякова.
Предмет исследования - повышения точности прогнозирования в
задачах постановки диагноза и назначения лечения и повышение точности
диагностики на входе у пациента с заболеванием тромбоэмболии легочной
артерии.
Целью
работы
является
разработка
модуля
прогнозирования
заболевания, с последующим сбором медицинских данных и самообучением
с помощью языка программирования Python и библиотеки Pandas и
использованием алгоритмов машинного обучения для повышения точности
диагностики и оптимизации тактики лечения патологии тромбоэмболии
легочной
артерии
при
сопоставлении
клинико-диагностических
и
лабораторно-инструментальных данных.
Для достижения цели поставленной в данной работе были определены
следующие задачи:
6
- изучить этиологию и патогенез тромбоэмболии легочных артерий и
эффективность шкал оценки клинической вероятности
- рассмотреть теоретические основы систем сбора и обработки данных,
методы многокритериального анализа;
- изучить системы искусственного
интеллекта
и программное
обеспечение систем искусственного интеллекта;
-
проанализировать
базу
медицинских
данных,
составленную
сотрудниками ГБУЗ Самарский областной клинический кардиологический
диспансер им. В.П.
Полякова
и предоставить решение
для более
эффективной работы в задачах постановки диагноза и назначения лечения
больным ТЭЛА;
-
разработать
модуль
на
языке
программирования
Python
с
использованием алгоритмов машинного обучения в задачах постановки
диагноза и назначения лечения больным ТЭЛА;
- определить эффективность модуля в задачах постановки диагноза и
назначения лечения больным ТЭЛА для приемного и кардиологического
отделений ГБУЗ Самарский областной клинический кардиологический
диспансер им. В.П. Полякова.
Структура магистерской диссертации представлена введением, двумя
разделами, заключением и списком использованной литературы.
Используемые методы исследования
- накопление и сбор фактов;
- анализ;
- обобщение;
- классификация;
- измерение;
- эксперимент.
Проблема
множестве
автоматизации
научных
работах
обработки
многих
данных
известных
представлена
во
специалистов.
Но
автоматизация медицинских данных и разработка интеллектуального модуля
7
на основе искусственного интеллекта в задачах постановки диагноза и
назначения лечения больным ТЭЛА является научной новизной и примером
решения не только обрисованной проблемы и конкретной задачи, но и
решением
множества
других
проблем,
связанных
с
разработкой
искусственного интеллекта в сфере медицины.
Основным пунктом научной/методологической новизны диссертации
является
проведенный
анализ
литературы
и
нормативно-справочной
документации, по результатам исследования которой был написан модуль,
который прогнозирует клиническую вероятность ТЭЛА для заполненной
медицинской карты: будет ли этому пациенту поставлен правильный диагноз
и определена верная тактика лечения.
Практическая значимость исследования состоит в процессе сбора
медицинских данных с подозрением на ТЭЛА, оптимизации тактики лечения
ведения пациента на основании данных по клинической картине заболевания.
Разработка модуля, безусловно, полезна врачам профильных отделений, ведь
она снизит время на диагностику ТЭЛА, выявив взаимосвязь между
показателями на основе больших массивов данных, станет эффективным
диагностическим этапом. Итоги диссертационной работы могут применяться
в
клинической
практике
в
многопрофильных,
кардиологических
стационарах.
Диссертация состоит из введения, теоретической и практической
частей, заключения и списка литературы.
Первая глава является теоретической базой магистерской работы, в ней
представлены и рассмотрены этиология и патогенез тромбоэмболии
легочных артерий, рассмотрена эффективность существующих шкал оценки
клинической вероятности ТЭЛА. Изучены теоретические основы систем
сбора и обработки данных, методы многокритериального анализа, системы
искусственного
интеллекта
и
программное
обеспечение
систем
искусственного интеллекта. Проведен анализ деятельности приемного и
кардиологического отделений ГБУЗ Самарский областной клинический
8
кардиологический диспансер им. В.П. Полякова и предоставлено решение
для более эффективной работы в задачах постановки диагноза и назначения
лечения
больным
ТЭЛА.
Во
второй
главе
представлен
анализ,
предварительная обработка и подготовка исходных данных, разработка
модуля постановки диагноза и назначения лечения больным с ТЭЛА.
Рассмотрены различные инструменты для обработки и работы с данными.
Сформированы требования для работы с будущей нейронной сетью.
Приведен процесс
построения
нейронной сети,
анализ
полученного
результата. Описывается алгоритм модуля в задачах постановки диагноза и
назначения лечения больным ТЭЛА, оценка результатов.
В процессе выполнения работы были использованы следующие
инструменты: Python – язык программирования высокого уровня, Pandas это из популярных библиотек Python,
статистический функционал
функционал MS Exsel и IBMSPSSv25.
9
1 ТЭЛА. Эффективность шкал. Методы многокритериального
анализа. Методы искусственного интеллекта
1.1 Эпидемиология и этиология ТЭЛА
Тромбоэмболия легочной артерии (ТЭЛА) — окклюзия ствола или
основных ветвей легочной артерии частичками тромба, сформировавшимися
в венах большого круга кровообращения или правых камерах сердца и
занесенными в легочную артерию с током крови. ТЭЛА является одной из
основных причин госпитализации, смертности и потери трудоспособности.
ТЭЛА занимает третье место в ряду наиболее частых причин смерти, второе
— в ряду причин внезапной смерти и является наиболее частой причиной
госпитальной летальности. Ежегодно от ТЭЛА умирает 0,1 % населения
[3,4,5].
Истинная распространенность ТЭЛА неизвестна, так как диагностика
заболевания затруднена и часто ТЭЛА выявляется при вскрытии. Диагноз
ставится в 1–2 случаях на 1000 человек в год, при возрасте старше 75 лет —
до 10 случаев на 1000 человек в год. Согласно имеющимся статистическим
данным,
частота
выявления
новых
случаев
ТЭЛА
среди
госпитализированных пациентов в США превышает до 160 000 случаев в
год, а распространенность по Англии и Шотландии — 90 000 случаев, во
Франции регистрируется чуть больше, около 100 000 случаев ТЭЛА в год [6].
При этом точно статистики по России нет, но по неподтвержденным данным,
частота случаев колеблется от 23 до 250 случаев на 100 000 населения в год,
что соответствует около 168 000 случаев в год [7].
Бессимптомная ТЭЛА диагностируется у 50% больных с доказанным
тромбозом глубоких вен.
Большинство случаев ТЭЛА возникает в
стационарах, при этом 70–80 % приходится на долю терапевтических
пациентов [8]. Смертность от тромбоэмболии составляет около 14 % в
реальной клинической практике, а при несвоевременной диагностике и
отсутствии терапии риск возрастает до 31 %. При жизни патология
10
диагностируется в 50–70 % случаев, а гипердиагностика имеет место в 65 %
случаев. Клиническая картина заболевания неспецифична и характеризуется
множеством признаков — от выраженных гемодинамических нарушений и
развития острой правожелудочковой недостаточности до бессимптомного
течения. Важную роль в своевременной диагностике ТЭЛА играет решение
врача, основанное на клинической симптоматике и оценке факторов риска
заболевания.
Основным в подозрении на ТЭЛА является знание факторов риска ее
развития. В настоящее время принято рассматривать ТЭЛА и тромбоз
глубоких вен (ТГВ) как проявления одного заболевания [9,10]. Еще в 1856
году Рудольф Вирхов описал триаду факторов, которые приводят к
внутрисосудистому тромбообразованию: 1) повреждение сосудистой стенки;
2) повышенная свертываемость крови; 3) замедление кровотока. Говоря о
возможных факторах риска развития ТЭЛА, сразу необходимо провести
деление
на
первичные
(генетически
заложенные)
и
вторичные
(приобретенные при определенной патологии или ее осложнениях) факторы
риска.
Клиническая картина развития ТЭЛА в большей степени связана с
обездвижением больного — в случае травматологических или хирургических
последствий или вмешательств, так и при сердечной недостаточности,
развитии инсульта, ожирении, развития злокачественных новообразований и
просто пожилом возрасте. Для более точной диагностики ТЭЛА было
разработано множество прогностических шкал оценки риска развития
заболевания. Одной из наиболее часто используемых на сегодняшний день
шкал является шкала GRACE.
1.2 Виды шкал и их эффективность в оценке риска развития ТЭЛА
Выявление симптомов развития риска развития ТЭЛА является
чрезвычайно важным для определения индивидуальной тактики ведения
пациента
[11-14].
Для
оценки
клинической
вероятности
ТЭЛА
на
11
догоспитальном и приемном этапах оказания помощи используются
специальные шкалы, в том числе шкалы Wells, DASH, Padua, Номограмма
VIENNA, для оценки исходов ТЭЛА - Grace, индекс тяжести легочной
эмболии Pulmonary Embolis m Severity Index (PESI), а также их упрощенные
версии.
Номограмма VIENNA (рис. 1.1) рассматривает только риск повторения
тромбоза глубоких вен (ТГВ) или тромбоэмболии легочной артерии (ТЭЛА).
Оцениваются как клинические показатели (тип тромбоза, пол), так и
аналитические
антикоагулянтной
(D-димер,
определяемый
профилактики).
Должны
после
быть
прекращения
построены
перпендикулярные линии от каждого из параметров (пол, локализация
тромба, уровень D-димера) к верхнему ряду («Баллы») [15,16] . Сумма всех
трех параметров складывается на параметре «Всего баллов», далее от нее
прокладывается перпендикуляр на линии, который определит риск рецидива
тромбоза в первый год после него или риск в течении пяти лет.
Рис. 1.1 - Номограмма VIENNA оценки риска рецидива тромбоза глубоких
вен или ТЭЛА
12
Шкала DASH (рис. 1.2) (D-dimer Age Sex Hormones) оценивает
вероятность первоначального возникновения венозной тромбоэмболии и
группирует риск рецидива тромбоза глубоких вен (ТГВ) или тромбоэмболии
легочных артерий (ТЭЛА) по степеням. Согласно шкале фактор риска
определяется как низкий (ежегодная частота случаев около 3%), если сумма
баллов составляет от 0 до 1, или высокий (ежегодная частота случаевоколо
9%), если сумма баллов более 1. Шкала DASH из-за своей специфичности
рассматривает только наличие D-димера и не может гарантировать наличие
ТЭЛА у пациента [17,18].
Рис. 1.2 - шкала DASH оценки риска рецидива тромбоза глубоких вен или
ТЭЛА
Шкала WELLS (рис. 1.3) является одним из важных диагностических
инструментов и определяет риск развития ТЭЛА по совокупности
клинической картины поступающего больного. Используется в клинической
картине пациентов с преимуществом различных травматических воздействий
на
нижние
конечности.
По
сумме
полученных
баллов
пациентов
распределяют на группы с низкой, средней и высокой вероятностью ТЭЛА.
13
Рис. 1.3 - Шкала WELLS
Поскольку шкала не позволяет с уверенностью судить о наличии или
отсутствии ТЭЛА, диагностический поиск должен включать последующее
лабораторное и инструментальное обследование. В сочетании с адекватным
уровнем D-димера и/или отрицательными результатами УЗИ сосудов,
попадание пациента в группу с низким риском может относительно
безопасно исключать наличие у пациента ТЭЛА [19,20].
Шкала PADUA (рис. 1.4) прогнозирует выявление у нехирургических
больных в условиях стационара риска тромбоэмболии легочной артерии
(ТЭЛА). Большинство пациентов, поступивших в стационар с острым
нехирургическим
заболеванием
или
обострением
хронического
нехирургического заболевания, имеют как минимум один из множества
факторов риска [21]. Каждый фактор свидетельствует о повышенной
вероятности венозной тромбоэмболии. Недостаток шкалы в ее неприменении
к хирургическим больным.
14
Рис. 1.4 - Шкала PADUA оценки риска развития ТГВ и/или ТЭЛА у
госпитализированных больных нехирургического профиля
Разработанные
прогностические
на
большом
шкалы
помогают
клиническом
врачу
в
объеме
стратификации
данных,
риска
сердечнососудистых заболеваний, и позволяют сосредоточить в первую
очередь внимание на пациентах с неблагоприятным прогнозом. В то же
время каждая шкала носит сугубо специфическую область применения и не
может быть использована в общей практике для прогнозирования оценки
клинической вероятности ТЭЛА.
Так же в клинической практике применяется Global Registry of Acute
Coronary Events (GRACE) это инструмент прогностической оценки риска
смерти, используемый при остром коронарном синдроме, состоящий из
клинических, аналитических и электрокардиографических переменных.
Шкала
GRACE никогда
Не
используется
для
оценки
клинической
вероятности ТЭЛА. Впервые Paiva LV, etal. была показана эффективность
шкалы GRACE для стратификации риска смерти и сердечно сосудистых
осложнений у пациентов с ТЭЛА [22].
15
1.3 Методы многокритериального анализа
Научная
дисциплина
принятия
решений
в
условиях
многокритериального анализа является относительно молодой: первые
работы упоминаются с 1970-х годов, а статьи о применении ММПР к
решению практических задач – в 1980-х [23]. Несмотря на это, на данный
момент разработано уже более семидесяти различных методов для решения
задач многокритериального анализа [24].
В данном разделе предлагается краткий обзор существующих методов
многокритериального анализа, применяемых в решении задачи разработки
интеллектуального модуля.
Метод анализа иерархий – это математический инструмент принятия
решений, учитывающий психологические аспекты. Метод был разработан Т.
Саати [25].
Он позволяет распределить имеющиеся альтернативы, которым
необходимо дать оценку по множеству количественных и качественных
критериев. Упорядочение происходит исходя из полученной информации и
выражается численно, позволяет получить значения общей ценности
альтернатив по всем функциям. Альтернатива с наибольшим значением
общей ценности является приоритетной. Метод широко применятся в
практике.
Кооперативный
метод
–
такой
метод,
который
предполагает
объединение усилий нескольких людей или игроков. Теория кооперативных
игр рассматривает конфликты, возникающие между игроками при принятии
какого-либо совместного решения. Так как критериев для принятия такого
решения обычно несколько и часто они бывают противоречивыми, теория
используется
в
качестве
одного
из
методов
принятия
решения
в
многокритериальной среде. Теория изучает, какие результаты объединения
игроков могут быть достижимы и при каких условиях.
16
Метод смещенного идеала разработан для определения наилучших
решений в множестве допустимых значений и характеризуется следующими
особенностями:
Процедурой формирования «идеального» решения, которое задает
направление оптимизации. Обычно такое решение недостижимо, но хорошо
отражает цели ЛПР.
Исключением
решений,
которые
являются
наименее
предпочтительными, на каждой итерации. Таким образом, лучшее решение
находится за счет постепенного исключения худших решений на каждом
этапе процедуры.
При этом сравнение альтернатив с сформированным «идеальным»
решением
часто
вызывает
неудовлетворенность
существующими
альтернативами, что называется конфликтом перед решением. Конфликтом
после
решения
вызывает
неудовлетворенность,
возникающую
после
исключения некоторых альтернатив из рассмотрения. На начальных этапах
наблюдается сильный конфликт перед решением, который постепенно
уменьшается в силу приближения существующих мнений к идеальному,
конфликт после решения, напротив, увеличивается.
1.4 Методы искусственного интеллекта в медицине
Под искусственным интеллектом (ИИ) рассматривается способность
машины
симулировать
человеческие
процессы
восприятия,
умение
ориентироваться в характеристиках и связях между различными наборами
данных и принимать верные, с точки зрения человека, решения.
Согласно
используются
тенденции
две
современного
технологии
мира
ИИ —
на
данный
момент
классические экспертные
системы и нейронные сети. В то время как экспертные системы переживают
кризис из-за текстового человеко-машинного интерфейса, который в
настоящее время вытеснен графическим (GUI), нейронные сети (НС) нашли
широкое применение благодаря способности учиться.
17
Выделяют несколько видов ИИ:
1)
Узкий (narrow AI) — создан для решения определенных задач на
базе нейронных сетей;
2)
Общий (general AI, AGI) — — сможет выполнять функции и
алгоритмы, с которыми справляется человеческий интеллект;
3)
Superintelligence — — будет опережать разум людей на порядок
по совокупности и сложности решаемых задач [1].
В последнее время эксперты приходит к единому мнению, что
большинство современных и действительно реализованных проектов по ИИ
– это решения, разработанные по технологии глубокого машинного обучения
(deep learning) и технологии глубоких нейронных сетей (deep neural
networks).
Нейронные сети (neural networks) основаны на попытке воссоздать и
построить сети, основанные на принципе структуры и работы биологических
процессов в нервных клетках живого организма. У живых существ нейрон —
это электрически возбудимая клетка, которая обрабатывает, хранит и
передает информацию с помощью электрических и химических сигналов
через синаптические связи. В головном мозге человека насчитывается около
90—95 миллиардов нейронов [26,37].
Типичный нейрон (рис. 1.5) имеет сложное строение и узкую
специализацию.
Соединяясь друг с другом для передачи сигналов с
помощью синапсов, нейроны формируют сложную и многообразную
биологическую нейронную сеть. Это взаимодействие и есть основной
процесс обучения и основа мозговой деятельности живых существ,
образующий в интеллект.
18
Рис. 1.5 - Искусственный нейрон
Именно способность биологических нервных систем самообучаться,
нормализировать свою деятельность и исправлять ошибки легла в основу
исследований
в
области
искусственного
интеллекта.
В
постановке
первоначальной задачи стояло решение искусственно воспроизвести или
изменить низкоуровневую структуру мозга – т.е. создать компьютерный
«искусственный мозг». После полученных результатов была предложена
идея «искусственного нейрона» — математической функции, которая
пропускает несколько входных сигналов в один выходной, через слои
нейронов,
назначая для них веса. Главным отличием искусственного
интеллекта от обычных компьютерных программ является то, что при
создании искусственного интеллекта программисту не нужно знать всех
уровней потоков между входными данными и результатом. Работа
искусственного интеллекта состоит из непрерывного обучения на массиве
получаемых знаний, а также в поиске тех формул и алгоритмов, которые не
могут быть созданы человеческим интеллектом. Построенная из очень
большого числа нейронов, нейронная сеть показала способность в решении
сложных задач.
19
Машинное обучение (machine learning) — это анализ и обучение для
поиска решений и создания на их основе нужных алгоритмов, которые затем
будут использоваться для статистических прогнозов и позволят сделать
корректные выводы на основании предоставленных ему данных.
Различают
3
основных
подхода
к
машинному
обучению.
В методе обучения с учителем подобраны параметры и данные с уже
готовыми ответами. Нейронная сеть подстраивается для минимизирования
ошибок. В этом способе ИИ получает входную информацию, применяет
метод коррекций ошибок, метод обратного распространения ошибки,
прогоняет через имеющую базу верных ответов и затем выдает прогноз.
Например, база данных рентгенологических исследований с готовыми
заключениями будет являться базой для обучения нейронной сети и его
«учителем».
Самообучение применяется там, где нет заранее заготовленной базы
готовых решений. В этом случае ИИ самостоятельно распознает скрытые
зависимости
по
категориям,
ведет
поиск
похожих
описаний
в
представленной предметной области. Это позволяет ограничить вероятность
системной
слепоты
врача
или
исследователя.
К
примеру,
когда
разрабатывалась модель ИИ для прогноза сахарного диабета, врачи
сосредоточили внимание только на показателях глюкозы в крови или весе
пациента, при этом игнорируя полную клиническую картину из медицинской
карты, которая могла бы дополнить общую картину или же кардинально
поменять тактику лечения.
Третий способ машинного обучения, это когда испытуемая система
обучается, при этом взаимодействуя с некоторой внешней средой, а среда
воздействует на систему. При этом системе присуждается награда за
оптимальные
решения
т
правильную
последовательность
действий.
Обучение с подкреплением особенно хорошо подходит для решения задач,
связанных с выбором между долгосрочной и краткосрочной выгодой. Оно
20
успешно применяется в различных областях, таких как робототехника,
телекоммуникации, игры.
В сфере медицины в основном применяются самообучение и обучение
с учителем. Подход машинного обучения с учителем более предпочтителен в
тех случаях, когда есть накопленные и достоверные ретроспективные
исходные данные. Обучение потребует меньше затрат средств и времени и
позволит получить более эффективное решение. Наоборот, где отсутствует
возможность получить базу с характеристиками всех форм заболевания и
тактикой лечения – необходимо применять методы самообучения на основе
глубокого машинного обучения.
Кроме точности в построении диагнозов, которая сегодня может
достигать 95%, системы ИИ имеют высокую скорость обработки данных.
Неоднократно проводились эксперименты по чтение рентгенологических
снимков, в которых соревновались человек и ИИ. Когда темп показа
изображений составлял 1-2 кадра в минуту, врач, основываясь на своем
опыте, выигрывал у машины. При анализе снимков патологий вероятность
ошибки составляла не более 4%, а ИИ 8%. Но при возрастании темпа до 10
кадров в минуту и выше, у врача наступала утомляемость и ослабевала
реакция, что в комплексе давало неверное представление о клинической
картине заболевания. Компьютер же постоянно самообучался на своих
ошибках и в дальнейшем только повышал точность диагноза. Неожиданно
интересным и перспективным для дальнейших исследований оказался режим
совместной работы человека и ИИ. Точность диагностики удалось повысить
на 86%, при этом скорость демонстрации изображений осталось на
приемлемой для человека скорости.
Так что же может искусственный интеллект в медицине?
На
сегодняшний день обучение и применение нейронных сетей в медицине уже
давно
приняло
широкое
распространение.
Примером
программы
диагностики может служить пакет кардиодиагностики, разработанный
фирмой
RES
Informatica
совместно
с
Центром
кардиологических
21
исследований в Милане. А в Англии нейронные сети используются в четырех
госпиталях для предупреждения инфаркта миокарда [28].
IBM Watson – суперкомпьютер, в который загружены сотни тысяч
медицинских документов, истории болезней, энциклопедии, антологии
знаний, базы научных статей, медицинские журналы и учебники. Благодаря
обширной базе данных, он выдает максимально точный ответ на вопросу,
сформулированный
на
естественном
языке.
IBM
Watson
оказывает
своевременную диагностику таких заболеваний, как рак груди, легких,
толстой кишки и других онкологических паталогий.
Sense.ly – приложение – домашний стационар. С помощью носимых
устройств, которые ежедневно мониторируют множество показателей
состояния здоровья, приложение извещает владельца о необходимых
действиях и процедурах, которые необходимо своевременно выполнять. Как
например: принять лекарство, изменить диету или же, в случае ухудшения
показателей, связаться с врачом. Искусственный интеллект, встроенный в
приложении, распознает речь, а так же соединяет по видеосвязи с врачом, в
случае необходимости срочной онлайн-консультации.
Babylon Health – система анализирует данные, на основе полученных
тестов, загруженных параметров активности. После выдает предварительный
диагноз и рекомендации, а так же отправит информацию лечащему врачу. К
сожалению, данное приложение апробировано и используется в медицине
«западного типа», где у пациента есть постоянный, так называемый,
домашний лечащий врач. В России и в других странах, где государственная и
частная
медицина
построена
на
других
концепциях,
возможность
применения будет ограничено.
Один из сервисов компьютерного анализа медицинских изображений Zebra Medical Vision. Модель системы — нейронная сеть, обученная на
сотнях тысячах снимков пациентов с патологией легких. Схожим образом
работает и MedyMatch. В режиме реального времени нейронная сеть
MedyMatch
обрабатывает
и
сравнивает
снимки
мозга
пациента
с
22
имеющимися в ее базе данных снимками. Сеть распознает любые отклонения
от нормы, которые не всегда способен своевременно продиагностировать
врач, таким образом, сводя вероятность ошибки в постановке диагноза и
назначения правильного лечения, к минимуму.
Интересный пример нейронной сети Woebot — чат-бот для борьбы с
депрессивными
мыслями
и
состояниями.
Разработан
психологами
Стэнфордского университета в сотрудничестве с специалистами в области
искусственного интеллекта. Система работает на основе когнитивноповеденческой терапии и
способна повернуть поведение человека в
положительное русло.
Так же нейронная сеть помогает и в поиске лекарственных формул.
Система Atomwise глубокого обучения AtomNet ежедневно собирает и
обрабатывает огромное количество химических соединений, и показывая
оптимальные пути решения формулы.
Как отметил специалист по машинному обучению из Workday Антон
де Вегер (Anton de Weger):
«Индустрия здравоохранения хорошо
подготовлена к тому, чтобы принять изменения в области машинного
обучения, которые происходят в корпоративных системах сейчас и в
ближайшем будущем.
совершенствованию
Благодаря улучшению финансового управления,
цепочки
поставок
и
повышению
эффективности
управления персоналом, возможности машинного обучения продолжают
бесконечно
расширяться
для
тех,
кто
готов
воспользоваться
этим
преимуществом» [29].
Технологии искусственного интеллекта, машинного обучения и
нейронных сетей во многом упрощают работу врачей, повышают скорость и
качество лечения. Инновации в медицине позволяют точнее диагностировать
заболевания, быстрее находить лекарственные препараты, отслеживать
состояние пациентов. И это лишь малая часть возможностей, который
искусственный интеллект привнёс в медицину [1].
23
2 Анализ, предварительная обработка и подготовка исходных
данных, разработка модуля постановки диагноза и назначения
лечения больным с ТЭЛА
2.1 Сбор и описание исходных данных
В базу данных формата MS Exsel были введены результаты
обследования более 300 пациентов, последовательно госпитализированных в
период с 2002 по 2009 года в стационар "Самарского областного
клинического
кардиологического
диспансера
им.
В.П.
Полякова"
с
подозрением на риск возникновения ТЭЛА. В дальнейшем диагноз был
подтвержден у 150 человек; 117 включены в исследование, 33 пациента
отказались от участия в исследовании; 37 пациентов потеряны для контакта
на этапе оценки результатов отдаленного периода. В 2012 году заведующей
одним из отделений кардиологического профиля Е.А. Куракиной было
опубликовано первое научное исследование, посвященное увеличению
прогнозирования
риска
возникновения
пациентам
с
тромбоэмболией
легочной артерии высокого и промежуточного риска. В данной работе были
проанализированы мировые практики и проведено сравнение эффективности
инструментов для оценки клинической вероятности ТЭЛА. По итогам
проведенного
исследования
удалось
значительно
повысить
уровень
прогнозирования риска ТЭЛА на первых этапах госпитализации и снизить
госпитальную смертность.
Данное
направление
было
продолжено
специалистами
кардиодиспансера и в период до 2017 года была собрана новая клиническая
база из 1000 пациентов с неподтвержденным диагнозом тромбоэмболии
легочной артерии. Данная база состояла из двухсот одного параметра и по
возможности заполнялась клиническими данными на момент поступления
пациента. Но так как данные заполнялись постфактум, то они носили
стохастический характер.
24
В 2017 году перед специалистами встала задача по повышению
точности прогнозирования клинической вероятности ТЭЛА, поступающим
пациентам. Для этого потребовалось провести качественный анализ
информации и ответить на следующие вопросы:
1) Насколько эффективны существующие шкалы оценки клинической
вероятности риска возникновения ТЭЛА;
2) Возможно ли получить дополнительные критерии для повышения
точности прогнозирования ТЭЛА, которые не были ранее замечены и могли
бы повысить предсказательную способность.
Таким образом, обработка всего массива данных и получения более
качественного прогностического классификатора стала основанием данного
исследования. Важной составляющей, являются современные шкалы,
которые построены
из ограниченного количества полей, применяемы не
только для ТЭЛА, но и в смежных областях сердечно-сосудистых
заболеваний, и порой используются как вспомогательный инструмент
оценки.
Ниже представлен перечень полей и критериев исходного массива
данных, который был представлен для последующей обработки и анализа
(таблица 2.1). Параметр - это фактор, напрямую, косвенно повлиявший на
развитие ТЭЛА. Или же фактор ложный. Тип значения является типом
фактора, он может быть строковым, числовым, логическим, оформлен в виде
даты. Вид параметра - это фактор, который поступил на входе и дал верный
прогноз в клинической картине постановке диагноза ТЭЛА или стал известен
на выходе, уже после постановки диагноза.
25
Таблица 2.1
Структура исходных данных
№
Параметр
Тип значения
Вид параметра
1
Пол: 0-ж, 1-м
Логический
Вход
2
3
4
5
6
7
Дата рождения
Возраст
Адрес
Телефон
№ ИБ
Дата госпитализации
Дата
Числовой
Строковый
Строковый
Строковый
Дата
Не используется
Вход
Не используется
Не используется
Не используется
Не используется
8
№ отделения
Набор част. упор
Не используется 1
Числовой
Вход
Дата
Числовой
Не используется
Не используется
Логический
Вход
Логический
Вход
Логический
Вход
10
11
Длительность от начала
симптоматики до госпитализации
(сут)
Дата выписки
Койко/день
12
Перелом бедра
9
13
14
госпитализация с СН или ФП (3
месяца)
Протезирование суставов
15
Большое хирургическое
вмешательство
Логический
Вход
16
Хирургия 1- да, 2- нет
Логический
Вход
17
Операция - сколько суток назад
Числовой
Вход
18
Обширная травма
Логический
Вход
19
Инфаркт миокарда (3 месяца)
Логический
Вход
20
Повреждение спинного мозга
Логический
Не используется 1
21
Артроскоп хир к/суст
Логический
Не используется 1
22
Аутоиммунные заболевания
Логический
Вход
23
24
Переливания крови
Центр вен катетер
Логический
Логический
Вход
Вход
26
Продолжение таблицы 2.1
№
Параметр
Тип значения
Вид параметра
25
26
Х/терапия
Хирургическое заболевание лёгких
Логический
Логический
Вход
Вход
27
ХСН 3-4 ФК
Эритропоэтин стимулирующие
препараты
Набор упорядочен
Вход
Логический
Вход
ГЗТ
Логический
Вход
Логический
Вход
Логический
Не используется 1
Логический
Вход
Логический
Вход
Логический
Вход
28
29
34
Комбинированные гормональные
контрацептивы
ЭКО
Инфекции (пневмония,
мочеполовые, ВИЧ)
Воспалительные заболевания
кишечника
Онкология
35
Локализация онкологии
Строковый
Не используется 1
36
Давность (мес)
Числовой
Вход
37
ОНМК с параличом
Логический
Вход
38
Числовой
Вход
Логический
Вход
40
41
Давность (мес)
Беременность/послеродовая
депрессия
Анамнез ВТЭО: 0-нет, 1-да
Предшест. ТЭЛА, 0-нет, 1-да
Логический
Логический
Вход
Вход
42
Предшест. ТЭЛА, сколько лет назад
Числовой
Вход
43
Предшест. ТГВНК, 0-нет, 1-да
Логический
Вход
44
45
Предшест. ТГВНК, ск лет назад
Тромбоз поверхностных вен
Числовой
Логический
Вход
Вход
46
Тромбофилия
Логический
Вход
47
Дефицит АТ
Логический
Не используется 1
48
49
50
Дефицит прС
Дефицит ПрS
FVLeiden
Логический
Логический
Логический
Не используется 1
Не используется 1
Не используется 1
51
52
FVIII
FII
Логический
Логический
Не используется 1
Вход
30
31
32
33
39
27
Продолжение таблицы 2.1
№
Параметр
Тип значения
Вид параметра
53
54
55
56
Логический
Логический
Логический
Логический
Не используется 1
Вход
Вход
Вход
Логический
Вход
58
ГГЦ
Иммобил-я › 3 сут
Сахарный диабет
Альвеолярная гипервентиляция
Путешествие длительное
расстояние (более 3 часов)
Возраст ›60
Логический
Вход
59
Ожирение (ИМТ >30)
Логический
Вход
60
61
Лапароскоп хирургия
Беременность/роды
Варикозное расширение вен
нижних конечностей
Логический
Вход
Логический
Вход
57
62
63
ДЗ ТЭЛА более вероятен
64
65
66
Баллы по Wells
Баллы по Женевской шкале
Шок: 0-нет, 1-есть
Числовой
Числовой
Логический
Не используется
Не используется
Вход
67
САД, уровень, приемный покой
Числовой
Вход
68
ДАД, уровень, приемный покой
Числовой
Вход
69
Гипотензия: 0-нет, 1-есть,
приемный покой
Логический
Вход
70
71
72
73
74
Высокий риск смерти
Невысокий риск смерти
Одышка
Боль в груди
Боль в грудной клетке острая
Логический
Логический
Логический
Логический
Логический
Вход
75
Боль в грудной клетке загрудинная
Логический
Вход
76
Боль в грудной клетке плевральная
(при повороте туловища, дыхании)
Логический
Вход
77
Кашель
Логический
Вход
78
79
Синкопе
Кровохаркание
Логический
Логический
Вход
Вход
80
81
82
ЧСС при поступлении
Пост ФП
Парокс ФП
Числовой
Логический
Логический
Вход
Вход
Вход
Вход
28
Продолжение таблицы 2.1
№
Параметр
Тип значения
Вид параметра
83
84
85
ЧД при поступлении
Цианоз верх 1/2 туловища
Цианоз носогубного треугольника
Локализация поражения н/конечн:
1-правая, 2-левая, 3-двустор
Числовой
Вход
Вход
Вход
Набор упорядочен
Вход
86
87
Отёк н/к
Вход
88
Боль в н/к
Вход
89
Боль при пальпации ГВНК
Асимметрия диаметра н/к
(икроножн): 0-нет, 1-есть
Асимметрия диаметра н/к
(икроножн), см
90
91
Логический
Вход
Логический
Вход
Числовой
Вход
92
Асимметрия диаметра н/к (бедро):
0-нет, 1-есть
Логический
Вход
93
Асимметрия диаметра н/к (бедро),
см
Числовой
Вход
94
Хрипы в лёгких: 0-нет, 1-есть
Логический
Вход
95
Лихорадка >37,5
Логический
Вход
96
ЭКГ признаки 0-нет 1-есть
Логический
Вход
97
ЭКГ: p-pulmonale
Логический
Вход
98
ЭКГ:QIII-SI
Логический
Вход
99
ЭКГ: отр TIII
Логический
Вход
100
ЭКГ: SV5-6
Логический
Вход
101
102
103
БПНПГ полная
БПНПГ неполная
ЭКГ: TV1-3
ЭКГ все три признака: SI-QIII,
БПНПГ и инверсия Т
Логический
Логический
Логический
Вход
Вход
Вход
Логический
Вход
Rg-признак 0-нет 1-есть
Логический
Вход
Логический
Вход
Логический
Вход
Логический
Вход
104
105
106
107
108
Rg: расширение прав границы
сердца
Rg: выбух-е легочного конуса по
лев контуру
Rg: расширение тени ВПВ
29
Продолжение таблицы 2.1
№
Параметр
Тип значения
Вид параметра
109
Rg: выс стояние куп-ла диафрагмы
Логический
Вход
110
Rg: с-м Вестермарка
Логический
Вход
111
Rg: инфильтрат
Логический
Вход
112
Rg: плеврал выпот
Логический
Вход
113
Rg: с-м Хемптона
Логический
Вход
114
Эхо-призн1: 0-нет 1-есть
Логический
Вход
115
116
Числовой
Числовой
Вход
Вход
Логический
Вход
118
Эхо1: сист ДЛА
Эхо1: ТКгр
Эхо1: Дилатация ПЖ (более 30): 0нет, 1-да
Эхо1: Размер ПЖ, СМ
Числовой
Вход
119
Эхо1: Гипокинез ПЖ
Логический
Вход
120
Эхо1: Расширенный НПВ
Числовой
Вход
121
Эхо1: ФВ
Числовой
Вход
122
Эхо2: не пров - 0, пров - 1
Логический
Вход
123
Эхо2: сист ДЛА
Числовой
Вход
124
Эхо2: ТКгр
Эхо2: Дилатация ПЖ (более 30): 0нет, 1-нет
Числовой
Вход
Логический
Вход
117
125
126
Эхо2: Размер ПЖ, см
Числовой
Вход
127
Эхо2: Гипокинез ПЖ
Логический
Вход
128
Эхо2: Расшир НПВ
Числовой
Вход
129
Эхо2: ФВ
Ангиопульмонография: 0-не вып, 1вып
Объём поражения: 1-мелк ветви, 2сегментар, 3-ствол, гл ветви, 4норма
Числовой
Вход
Логический
Вход
Набор упорядочен
Вход
130
131
132
Кава-графия: 0-не вып, 1- вып
Логический
Вход
133
Кава-граф: тромбоз
Логический
Вход
134
Кава-гр: норма
Логический
Вход
135
КТ: 0- не вып, 1-вып
Логический
Вход
136
КТ без контрастирования
Логический
Вход
137
КТ: есть признаки ТЭЛА
Логический
Вход
30
Продолжение таблицы 2.1
№
Параметр
Тип значения
Вид параметра
138
КТ: нет признаков ТЭЛА
Логический
Вход
139
Левая легочная артерия
Логический
Вход
140
Правая легочная артерия
Логический
Вход
141
Обе ЛА
Логический
Вход
142
Одна доля
Логический
Вход
143
Один сегмент
Логический
Вход
144
Несколько долей
Логический
Вход
145
Несколько сегментов
Логический
Вход
146
147
Массивная
Субмассивная
Логический
Логический
Вход
Вход
148
Мелких ветвей
Логический
Вход
149
Одно (1)- двухсторонняя (2)
150
КТ-признаки инфаркт-пневмонии: 0
-нет, 1 -да
Логический
Вход
151
ЦДК н/к: 0-не вып, 1-вып
Логический
Вход
152
Логический
Вход
154
ЦДК: тромбоз
ЦДК: тип тромба 0-пристен, 1окклюзир, 2-флоттир
ЦДК: ПТФБ
Логический
Вход
155
ЦДК: клапанная недостаточность
Логический
Вход
156
ЦДК: норма
Логический
Вход
157
D-димер: 0-не вып, 1-вып
Логический
Вход
158
159
160
D-димер: уровень
BNP: 0-не вып, 1-вып
BNP: уровень
Числовой
Логический
Числовой
Вход
Вход
Вход
161
Тропонин: 0-не вып, 1-вып
Логический
Вход
162
163
164
Тропонин: количество
ОАК1 : Hb
ОАК1: Er
Числовой
Числовой
Числовой
Вход
Вход
Вход
165
ОАК1: Hct
Числовой
Вход
166
167
ОАК1: Le
ОАК1: Tr
Числовой
Числовой
Вход
Вход
168
ОАК2 : Hb
Числовой
Вход
169
ОАК2: Er
Числовой
Вход
153
Вход
Вход
31
Продолжение таблицы 2.1
№
Параметр
Тип значения
Вид параметра
170
ОАК2: Hct
Числовой
Вход
171
172
ОАК2: Le
ОАК2: Tr
Числовой
Числовой
Вход
Вход
173
174
175
176
177
178
179
180
Б/х1: билирубин
Б/х1: глюкоза
Б/х1:белок
Б/х1:АЛАТ
Б/х1:АСАТ
Б/х1:мочевина
Б/х1:креатинин
Б/х2:билирубин
Числовой
Числовой
Числовой
Числовой
Числовой
Числовой
Числовой
Числовой
Вход
Вход
Вход
Вход
Вход
Вход
Вход
Вход
181
Б/х2:глюкоза
Числовой
Вход
182
183
184
Б/х2:белок
Б/х2:АЛАТ
Б/х2:АСАТ
Числовой
Числовой
Числовой
Вход
Вход
Вход
185
186
Б/х2:мочевина
Б/х2:креатинин
Числовой
Числовой
Вход
Вход
187
ТЛТ: 0- не проведена, 1 - проведена
Логический
Вход
188
ТЛТ: препарат
Строковый
Не используется
189
ТЛТ-эффект: 0-нет, 1- есть
Парент АК: 0-не назначен, 1назначен
Логический
Вход
Логический
Вход
191
Парент АК: препарат
Строковый
Не используется
192
ОАК: 0-не назначен, 1- назначен
Логический
Вход
193
ОАК: препарат: 1-варфарин, 2ривароксабан, 3-дабигатран. 4фенилин
Набор не
упорядочен
Вход
ОАК: рекомендованная
длительность в эпикризе, мес
Кава-фильтр: 0-не имплант, 1имплант
Эмболэктомия: 0-не вып, 1выполнена
Логический
Вход
Логический
Вход
190
194
195
196
197
Эмболэктомия: результат
32
Продолжение таблицы 2.1
№
Параметр
Тип значения
Вид параметра
198
Эласт трикотаж: 0-не рекоменд, 1рекоменд
Эласт трикотаж: рекомендованная
длительность
Логический
Вход
200
Исход лечения: 1-вып, 2- умер
Логический
Выход
201
Вопросы рекомендации
Строковый
Не исп
199
В ходе первичной обработки были отсечены все поля, которые
относятся к персональным данным, с целью обезличивания и так как эти
данные не являются ценными для данного исследования.
2.2 Выбор инструментов для обработки и работы с данными
На сегодняшний день существует большое количество инструментов
для обработки статистических данных, в том числе биомедицинских данных.
Наиболее популярные из них: MS Excel, STADIA, SPSS, STATA, SYSTAT,
PRISM.
Пакет MS Excel является самым часто используемым офисным
приложением в отечественных учреждениях. MS Excel - это удобная для
восприятия пользователя электронная таблица с достаточно мощным
статистическим функционалом. Однако расчеты, сделанные при помощи MS
Excel, не признаются научными биомедицинскими журналами. Также в MS
Excel
затруднено
построение
качественных
медицинских
графиков.
Безусловно, MS Excel хорошо подходит для сбора данных, промежуточной
выкладки информации, подведением предварительных итогов, а также для
построения
определенного
статистический
анализ
рода
диаграмм.
необходимо
делать
Однако
в
окончательный
специализированных
программах.
STADIA - это программа отечественной разработки с 30-и летней
историей, которая прекрасно справляется с статистическим анализом,
33
благодаря наличию в ней необходимых статистических функций. Но
STADIA выглядит архаично, так как внешне не обновлялась с 1996 года.
Графики и диаграммы, построенные при помощи STADIA, выглядят в
современных презентациях не привычно, а из-за красной цветовой гаммы
утомляют в работе.
SPSS (Statistical Package for Social Science) один из наиболее часто
используемых пакетов статистической обработки данных с более чем 40-и
летней историей. Отличается гибкостью и многообразием применения для
всех видов статистических расчетов, используемых в медицине. SPSS имеет
удобный графический интерфейс и различные средства подготовки отчетов.
Статистические выкладки отображаются на экране в виде простых и
понятных рядовому пользователю графических окон.
STATA - профессиональный статистический программный продукт с
data-management system, который может применяться для статистических
выкладок и в медицине. Программа обладает большим количеством
технической документации, издается специальный журнал для пользователей
продукта.
Однако
STATA
относится
к
наукоемкому программному
обеспечению, и цена продукта недоступна рядовому пользователю.
SYSTAT - статистический продукт для персональных компьютеров.
Версия обладает неплохим интуитивно понятным интерфейсом, обширным
диапазоном проработки функционала. Компания Systat Software также
разрабатывает популярные у отечественных исследователей SigmaStat и
SigmaPlot, которые являются, программами статистической обработки и
построения диаграмм. Единый пакет из этих программ позволяет выполнять
обширные задачи для статистической обработки и визуализации данных в
медицине.
PRISM создавалась специально для биомедицинских задач. Обладая
интуитивно понятным интерфейсом, она позволяет за краткий период
времени просчитать данные, их проанализировать и выдать качественную
статистическую выкладку. PRISM содержит наиболее часто применяемые
34
статистические
функции,
которых
для
большинства
медицинских
исследований будет достаточно. Однако, как отмечают сами разработчики
системы,
PRISM
не
является
профессиональным
статистическим
программным пакетом, и поэтому не может применяться в решении сложных
статистических выкладок.
IBMSPSSv25 обладает простым интегрированным интерфейсом для
работы с описательной, регрессионной и расширенной статистикой. В SPSS
доступны
форматы,
поддерживающие
расширения
для
языков
программирования с открытым исходным кодом R и Python. Преимуществом
IBMSPSSv25 является не только большой выбор широкого спектра функций
и источника данных, но и наличие функционала для работы с нейронными
сетями,
что
является
важным
критерием
для
выполнения
данного
исследования.
Методология нейронных сетей существует достаточно давно, однако в
связи с последними достижениями прогресса в науке и технике, данная
область начинает обретать популярность. Благодаря всевозрастающему
многообразию инструментов и сервисов нейронные сети оказывают
существенное влияние на экономику и бизнес и расширяют сферы
применения
ИИ.
Ниже
представлены
наиболее
известные
и
часто
используемые программы-симуляторы для нейронных сетей, которые
представлены на рынке в сегменте программное обеспечение.
Alyuda NeuroIntelligence — высококачественная профессиональная
нейросетевая
программная
среда
для
получения
максимальной
предсказательной силы по технологии искусственных нейронных сетей.
Программное обеспечение нейронной сети Алюды успешно используется
тысячами экспертов для решения сложных задач интеллектуального анализа
данных, для расширения возможностей распознавания образов и прогнозного
моделирования, построения классификаторов и симуляторов нейронных
сетей, проектирования торговых систем и прогнозирования. Основанное на
запатентованных
самоконструктивных
нейронных
сетях,
программное
35
обеспечение для прогнозирования Alyuda обеспечивает надежные прогнозы,
даже когда входные данные являются шумными, полными нелинейных
зависимостей
или
неполными.
Программное
обеспечение
для
прогнозирования Alyuda позволяет легко начать с нейронных сетей,
поскольку оно автоматически проектирует, обучает и тестирует модели
прогнозирования нейронных сетей, используя последние достижения в
области искусственных нейронных сетей.
Amygdala - это программное обеспечение с открытым исходным кодом
для моделирования всплесков нейронных сетей (spiking neural networks SNN). Всплеск нейронных сетей является очень специфическим видом
«искусственного мозга», который продемонстрировал особые перспективы в
недавних научных исследованиях. SNN имеют очень полезные приложения в
искусственном интеллекте и распознавании образов. Цель проекта Amygdala
- использовать биологически точные модели «шипового кодирования» для
создания сетей, способных качественно работать в режиме реального
времени. Большое внимание уделяется поддержке многократной или
распределенной обработки, чтобы повысить масштабируемость и мощность
миндалевидных
«мозгов».
Еще
на
ранних
стадиях
Amygdala
уже
использовалась для создания работающих нейронных сетей, и дальнейшее ее
развитие сосредоточено на повышении эффективности и полезности.
Amygdala
реализована
в
виде
библиотеки
C++,
подходящей
для
использования программистами. Будущие усовершенствования расширят
возможности использования Amygdala, в частности, благодаря добавлению
графического интерфейса пользователя, подходящего для непрограммистов.
Также
предусмотрены
дополнительные
интерфейсы
к
языкам
программирования, отличным от C++, для расширения доступности и
полезности Amygdala для более широкой базы разработчиков и приложений.
EasyNN — комплексный анализ данных, который зарекомендовал себя
за его быстроту и простоту в пользовании. Позволяет создавать сети данных
из текста, таблиц, изображений или бинарных файлов. Сети с числовыми,
36
текстовыми, графическими или комбинациями типов данных создаются
автоматически или вручную с помощью сетевого редактора. EasyNN-plus
может взаимодействовать с другими приложениями, используя встроенные
средства Script и Macro.
Java library - библиотека языка программирования Java с открытым
кодом. Реализует сети прямого распространения в том числе: многослойные
персептроны, обобщенные и модульные сети прямого распространения.
NeuroSolutions — передовое программное обеспечение нейронной сети
для интеллектуального анализа данных. Позволяет создавать высокоточные и
прогнозирующие
модели
с
использованием
передовых
методов
предварительной обработки и интеллектуального автоматического поиска
топологии
нейронной
сети
с
помощью
передовых
распределенных
вычислений.
NeuroXL —
является
простым
в
использовании
и
интуитивно
понятным, не требует каких-либо предварительных знаний нейронных сетей
и легко интегрируется с Microsoft Excel. NeuroXL обеспечивает повышенную
точность и точность в широком спектре задач, включая кластерный анализ,
прогноз цены акций, прогноз продаж, прогноз спорта и многое другое. Он
разработан с нуля, чтобы помочь экспертам в решении реальных задач
прогнозирования.
Simbrain - это бесплатный инструмент для построения, запуска и
анализа нейронных сетей. Simbrain стремится быть максимально визуальным
и простым в использовании. Simbrain написан на Java и работает в Windows,
Mac OS X и Linux. Simbrain является продуктом с открытым исходным
кодом, и постоянно развивается.
Python – язык программирования высокого уровня общего значения с
низким порогом входа. Язык обладает связанным и последовательным
синтаксисом, коротким временем разработки и гибкости. Так как существует
широкий спектр библиотек, разработанных для языка программирования
Python, они помогают исследователям заниматься машинным обучением,
37
даже не имея значительных познаний в разработке. Разработчик не тратит
время - просто использует уже написанные ранее другими библиотеки. Сами
же библиотеки являются, ничем иначе как, наборами подпрограмм и
функций, написанных на Python. Хороший комплект библиотек может
облегчить
осуществление
незамысловатых
задач
без
необходимости
написания многих строк кода. В результате вокруг Python сложилось
community по нейросетям, ведь этот язык идеально подходит для разработки
непростых моделей и предсказательных движков, которые можно напрямую
внедрять в предпродакшен. Ниже представлены несколько библиотек,
которые широко используются в машинном обучении.
Scikit-learn это одна из самых известных и применяемых библиотек по
машинному обучению. Она использует множество контролируемых и
неконтролируемых
параметров
обучения.
Такие
как:
линейные
и
логистические регрессии, деревья принятия решений, кластеризацию, kmeans и т. д.
Scikit-learn, создана на основе слияния двух важных библиотек Python –
NumPy и SciPy. В библиотеку добавлен набор подпрограмм и алгоритмов для
широко известных задач машинного обучения и поиска данных. Даже такие
задачи как перемена данных и отбор функций могут быть реализованы с
помощью пары строк кода. Для людей, только познающих машинное
обучение, Scikit-learn является наилучшим инструментом.
Tensorflow
идеально
подходит
для
глубокого
обучения.
Это
комплексная платформа с открытым исходным кодом для машинного
обучения. Он имеет всеобъемлющую, гибкую экосистему инструментов,
библиотек
и
ресурсов
сообщества,
что
позволяет
исследователям
использовать самые современные технологии ML, а разработчикам легко
создавать и развертывать приложения на базе ML
Theano - это еще одна хорошая библиотека Python для алгоритма
числового расчета, похожая на NumPy. Она позволяет на высоком уровне
38
оптимизировать и вычислять математические выражения, содержащие
множество массивов данных.
Выделяет эту библиотеку использование преимуществ графического
процессора компьютера, что дает Theano производить вычисления с
большими массивами данных в несколько раз быстрее, чем при запуске
только на центральном процессоре. Скорость Theano подходит для глубокого
обучения и других задач, связанных со сложными вычислениями.
Keras — открытая нейросетевая библиотека, написанная на языке
Python.
Она
представляет
собой
надстройку
над
фреймворками
Deeplearning4j, TensorFlow и Theano [30,31].
Библиотека содержит в примерах множество реализаций повсеместно
применяемых строительных слоев нейронных сетей, целевые и передаточные
функции,
и
множество
инструментов
для
облегчения
работы
с
изображениями и символами.
Pandas - это из популярных библиотек Python, предоставляющая
структуры данных высокого уровня, легкие в использовании и понятные
простому пользователю. В ней есть множество встроенных критериев для
группировки и комбинирования данных, последующей их фильтрации, и
дальнейшего анализа временных рядов. Pandas извлекает данные из
множества источников, таких как базы данных Excel, SQL, JSON, и
позволяет манипулировать этими данными для выполнения определенных
задач.
Проанализировав
возможности
инструментов
и
сервисов,
было
принято решение в реализации задачи на Pandas. Сервис хоть и не
предназначен
для
оптимизации
машинного
обучения
в
сфере
здравоохранения, но хорошо показал себя в очистке и первичной оценке
массива данных по общим критериям.
39
2.3 Формирование требований для работы с нейронными сетями
Важной частью исследования является задача по качественному
анализу входных данных, отбору важных параметров и подготовке их для
последующей обработки.
После первичного анализа приведенных в таблице 2.1 параметров было
принято решение исключить информацию о локализации поражений, отеках,
боли в нижних конечностях, асимметрии диаметра нижних конечностях,
хрипов в легких и других параметров. К каждому параметру для облегчения
анализа
была
созданы
дополнительные
столбцы
с
вопросами
или
комментариями и ответами на них. Таким образом, количество параметров
сократилось, но прибавилось количество столбцов с информацией, не
пригодной для быстрого анализа простыми средствами.
Следующим этапом необходимо было оценить степень наполнения
данными по каждому параметру, а так же количество, качество и
уникальность значений, использовавшихся при оценке. После вторичной
обработки, заново был пересмотрен каждый параметр. Оказалось, что в
перечне некоторых параметров стоят пустые ячейки, или же эти ячейки
прокомментированы
порой
взаимоисключающей
информацией.
Эти
параметры были заново проанализированы и по возможности представлены к
максимально читаемому виду. Теперь можно было приступать ко второму
этапу обработки автоматизированными инструментами. Для этого был
использован функционал MS Exsel и IBMSPSSv25.
Следующей задачей в этом случае было получить список параметров,
достаточный для продолжения исследования, не зависимо от их полноты
наполнения. А чтобы снизить вероятность ошибки при выборе параметров
для
обучения
нейронной
сети,
впоследствии
учитывалось
мнение
специалистов в области кардиологии.
В итоге предполагалось получить определенное количество параметров
с
наиболее
полным
набором
данных
и
важных
с
точки
зрения
прогнозирования в задачах постановки диагноза ТЭЛА.
40
Выбор критериев проводился, учитывая, имеющие шкалы клинической
вероятности оценки риска ТЭЛА и впоследствии был составлен следующий
перечень параметров, объединенных в группы по приоритетности:
1)
Перелом
бедра
или
нижних
конечностей,
хирургическое
вмешательство, повреждение спинного мозга;
2)
Наличие злокачественных новообразований, воспаления;
3)
Химиотерапия,
заместительная
гормонотерапия,
противозачаточные оральные препараты, сахарный диабет,
4)
Хроническая сердечная недостаточность, инсульт с параличом,
тромбофилия, ТЭЛА в прошлом, варикозные вены;
5)
Беременность, послеродовой период;
6)
Возраст, ожирение, пол;
7)
Биохимия, КТ, ЭКГ, ЭХО;
Некоторые критерии были объединены в одну группу. Например, Rgпризнак. Другие из количественных переведены в наличие значения
превышающие норму.
Таким образом, перечень принял следующий вид, отображенный в
Таблице 2.2.
Таблица 2.2
Перечень параметров после обработки
№
№
Параметр
Тип
значения
Вид параметра
12
a1
Перелом бедра
Логический
Вход
14
15
a2
a3
Протезирование суставов
Большое хирургическое
вмешательство
Логический
Логический
Вход
Вход
16
a4
Хирургия 1- да, 2- нет
Логический
Вход
17
a5
Операция - сколько суток назад
Числовой
Вход
18
a6
Обширная травма
Логический
Вход
88
a7
Боль в нижних конечностях
Логический
Вход
41
Продолжение таблицы 2.2
№
№
Параметр
Тип
значения
Вид параметра
90
a8
Логический
Вход
26
a9
Асимметрия диаметра нижних
конечностей
Хирургическое заболевание лёгких
Логический
Вход
32
a10
Логический
Вход
33
a11
Логический
Вход
34
a12
Инфекции (пневмония,
мочеполовые, ВИЧ)
Воспалительные заболевания
кишечника
Онкология
Логический
Вход
95
25
23
24
a13
a14
a15
a16
Лихорадка >37,5
Х/терапия
Переливания крови
Центр вен катетер
Логический
Логический
Логический
Логический
Вход
Вход
Вход
Вход
30
a17
Логический
Вход
28
a18
Логический
Вход
27
a19
Комбинированные гормональные
контрацептивы
Эритропоэтин стимулирующие
препараты
ХСН 3-4 ФК
Вход
42
45
a20
a21
Предшествующая ТЭЛА
Тромбоз поверхностных вен
Набор
упорядочен
Логический
Логический
46
a22
Тромбофилия
Логический
Вход
62
a23
Логический
Вход
39
a24
Логический
Вход
2
a25
Варикозное расширение вен нижних
конечностей
Беременность/послеродовая
депрессия
Пол: 0-ж, 1-м
Логический
Вход
3
a26
Возраст
Числовой
Вход
58
a27
Возраст ›60
Числовой
Вход
59
96
105
114
a28
a29
a30
a31
Ожирение (ИМТ >30)
ЭКГ признаки 0-нет 1-есть
Rg-признак 0-нет 1-есть
Эхо-признак: 0-нет 1-есть
Числовой
Логический
Логический
Логический
Вход
Вход
Вход
Вход
135
a32
КТ: 0- не вып., 1-вып.
Логический
Вход
151
a33
Логический
Вход
157
a34
ЦДК нижних конечностей: 0-не
вып., 1-вып.
D-димер: 0-не вып., 1-вып.
Логический
Вход
Вход
Вход
42
Продолжение таблицы 2.2
№
№
Параметр
Тип
значения
Вид параметра
163
a35
ОАК
Числовой
Вход
173
a36
Биохимический анализ
Числовой
Вход
Таким образом, в первых девяти пунктах содержатся параметры
хирургического или посттравматического вмешательства. До тринадцатого
пункта выявленные онкологические заболевания, инфекции, воспаления. С
четырнадцатого
–
воздействия
на
кровь,
применение
оральных
контрацептивов. С девятнадцатого по двадцать третий выявленные сердечнососудистые заболевания. Двадцать четвертый параметр - беременность,
послеродовой синдром. Социальные характеристики и сопутствующие им
схожие параметры заняли 25-28 строчки. Параметры с двадцать девятого
носят функционально-диагностический и лабораторный характеры.
2.4 Построение нейронной сети, анализ результата
Шаг первый – это инициализация всех действующих компонентов
нейронной сети.
Библиотека
Импортируем
содержит
модули
библиотеку языка
для
Python –
оптимизации,
Pandas.
интегрирования,
специальных функций, обработки изображений и многих других задач. Так
же, возможно, пригодится функция активации, имя которой - "сигмоида". Эта
функция относится к классу непрерывных функций, принимает на
вход произвольное
вещественное
не
число
обязательно целое число и
в
интервале
от
0
до
на
выходе
1.
В
дает
частности,
большие отрицательные числа превращаются в 0, а большие положительные
– в 1. После определения класса нейронной сети и ее инициализации
прописываем все обязательные входные данные, информацию по скрытым
слоям, выходные данные, задаем скорость обучения. Затем задаем
43
количество узлов для всех слоев и обозначаем веса между слоями. Сама
скорость обучения подбирается вручную.
Следующий шаг состоит из тренировки нейронной сети. Ведется
подсчет сигналов, подающихся в функцию активации,
исходящих из
скрытых слоев к конечному выходному. Изучаются ошибки скрытых слоев,
полученных после распределения нейронов по весам между скрытыми и
выходными слоями, обновляются веса.
Опрос нейронной сети это ключевой шаг в построении. Необходимо
создать функцию, которая будет принимать любые или заданные входные
значения. Указать количество узлов в рядах входных, скрытых и выходных
слоев.
Перед
запуском
конструктора
и
непосредственно
созданием
нейронной сети определяем коэффициент обучения – то есть скорость
обучения.
Первый результат обучения получился после прохода 36 параметров.
По степени влияния на результат наиболее важными оказались следующие
пятнадцать параметров в порядке убывания: a1- перелом бедра; a4 - хирургия
1- да, 2- нет; a8 - асимметрия диаметра нижних конечностей; a16 центральный венозный катетер; a27 - возраст ›60; a30 - Rg-признак 0-нет 1есть; a31 - Эхо-признак: 0-нет 1-есть; a32 - КТ: 0- не вып., 1-вып.; a33 - ЦДК
нижних конечностей: 0-не вып., 1-вып. Исходя из результатов, можно судить,
во-первых, что уровень предсказательной способности получившейся
нейронной сети достаточно высок. Во-вторых, в перечне критериев, которые
оказывают влияние на результат, присутствуют параметры ранее не
использовавшиеся в клинической практике для оценки отдаленных исходов:
асимметрия диаметра нижних конечностей, центральный венозный катетер.
Рассмотрим результаты обучения нейронной сети с использованием
SPSS с параметрами обучения по умолчанию и таким же перечнем полей для
обучения.
44
Основной
Основной
Основной
Основной
Основной
-Основной
-Основной
-Основной
-Основной
ФИО
Основной
Перелом бедра
Протезирование суставов
Большое хирургическое вмеш-во …
Хирургия 1- да, 2- нет
Операция - сколько суток назад
Обширная травма 0-нет, 1-да
Боль в н/к
Асимметрия диаметра н/к (бедро):…
хр заб лёгких
Инфекции (пневмония, …
Воспалительные заболевания …
Онкология 0- нет, 1- есть
Лихорадка >37,5
Хирургическая/терапия
Переливания крови
Центральный венозный катетер
Комбинированные гормональные …
Эритропоэтин стимулирующие …
ХСН 3-4 ФК
Предшест ТЭЛА, 0-нет, 1-да
Тромбоз поверхностных вен
Тромбофилия
Варикозное расширение вен …
Беременность/послеродовая …
Пол: 0-ж, 1-м
Возраст
Возраст ›60
Ожирение (ИМТ >30)
ЭКГ признаки 0-нет 1-есть
Rg-призн 0-нет 1-есть
Эхо-призн1: 0-нет 1-есть
КТ: 0- не вып, 1-вып
ЦДК н/к: 0-не вып, 1-вып
D-димер: 0-не вып, 1-вып
ОАК: 0-не назначен, 1- назначен
Биохимический анализ
Основной
Рис. 2.1 - Результаты обучения нейронной сети
Итоговый результат предсказательной способности получившейся
нейронной сети так же достаточно велик. Благодаря предсказательной
способности нейронной сети и нахождению новых неучтенных параметров –
можно создать новую прогностическую шкалу для оценки клинической
вероятности ТЭЛА. Классификация важности параметров так же показывает
наличие не только неучтенных важных параметров, ранее не применявшихся
в задачах постановки диагноза и назначения лечения больным ТЭЛА. Но и в
отсутствие у некоторых параметров верного прогноза для характерного типа
заболевания. В данный список попали столбцы: a11 - воспалительные
заболевания кишечника, a21 - тромбоз поверхностных вен. Можно
предположить, что использование этого исследования в клинической
практике может повысить точность постановки диагноза ТЭЛА. Однако
данное предположение необходимо проверять в рамках дополнительного
исследования.
45
Второй результат обучения получился после прохождения 201
параметра. Итогом стало обнаружение в совокупности с известными
параметрами неучтенных с риском возникновения ТЭЛА у беременных.
Летальная ТЭЛА у беременных встречается в среднем один случай на тысячу
родов. Риск ТЭЛА особенно возрастает в послеродовой период, частично
после процедуры кесарева сечения. Патофизиология ТЭЛА включила в себя
следующие параметры (согласно таблице 1), которые либо не учитываются,
либо имеют малую доказательную базу, либо на них не обращают внимание
при сборе анамнеза.
Но были показаны нейронной сетью, как одни из
ключевых. Параметр 56 - альвеолярная гипервентиляция; 57 - путешествие на
длительное расстояние (более 3 часов); 59 - ожирение (ИМТ >30), 61 беременность/роды; 39 - беременность/послеродовая депрессия. Выявленные
параметры позволят предупредить ТЭЛА у беременных и даст следующие
рекомендации повышенная двигательная активность, борьба с ожирением,
предупредить
глубокий
венозный
тромбоз
во
время
длительных
путешествий: пить дополнительную жидкость, периодически двигаться,
использовать компрессионные чулки, исключить алкоголь. Однако данное
предположение
необходимо
проверять
в
рамках
дополнительного
исследования.
2.5 Разработка и описание алгоритма модуля в задачах постановки
диагноза и назначения лечения больным ТЭЛА, оценка результатов
Исходя из предполагаемых результатов, полученных от модуля,
необходимо принимать во внимание, что данный модуль не рекомендуется
использовать, как отдельный инструмент прогнозирования. Наиболее
эффективным применением предполагается как дополнительный модуль к
медицинской информационной системе, играющий роль второго мнения.
Реализация такой концепции построения модуля поможет не только
наращивать объем медицинской базы, но и проводить частое переобучение
сети, тем самым увеличивая предсказательную способность. Переобучение
46
нейронной сети является ключевым фактором в работе модуля, так как
клиническая картина заболеваний и методики их лечения могут меняться, то
нейронная сеть должна получать и изучать новые данные и типы
исследований, тем самым повышая предсказательную способность. Наличие
базы данных позволит сэкономить время врача на сборе анамнеза и
предыдущих осмотров.
На рисунке 2.2 изображена блок схема и описание алгоритма работы с
описанием образа и формы входных, обрабатываемых и выходных данных
при его состыковке в качестве дополнительного модуля с медицинской
системой. На вход в модуль передается уникальный ключ пациента из базы
данных. В качестве данного ключа используются параметры или группы
параметров,
которые
однозначно
идентифицируют
пациента
и
его
последующую госпитализацию. В случае использования модуля как
отдельного инструмента, все данные придется заполнять вручную,
в
дополнительно разработанный интерфейс или в форме подготовленного
согласно шаблону файла, что осложнит автоматизацию и осложнит перенос
результатов
в
электронно-медицинскую
карту.
Последнее
исключает
качественное ведение накопительной базы.
Этап обработки данных состоит из двух основных частей: вычисление
баллов на основе существующих в шкалах Wells, DASH, Padua, Номограмма
VIENNA и согласно клинической картине заболеваемости, и заканчивая
анализом данных после обучения нейронной сети. В случае модулянадстройки в медицинской системе, во-первых, хранение данных будет
осуществляться в заданном едином формате, потому что в информационных
системах реализован контроль ввода данных. В-вторых, все вычисления шкал
могут быть выполнены встроенными функциями калькуляторов, что
ускоряет и экономит вычислительные ресурсы системы. Последующую
обработку данных нейронной сетью так или иначе будет выполнена другим
языком программирования с библиотекой, по типу Phyton, в виде
дополнительного модуля. Но, исходя из многообразия платформ и библиотек
47
по обучению ИИ, реализация такого функционала не представит больших
технических сложностей.
Входные данные
Обработка данных:
Вычисление баллов по шкалам Wells, DASH,
Padua, Номограмма VIENNA и общей
клинической картине заболеваемости;
Анализ данных после обучения нейронной
сети.
Вывод результатов:
Вывод результатов шкал, а так же количества
пациентов с такими же параметрами и процентное
соотношение прогноза для постановки диагноза.
Вывод результатов полученных нейронной сетью.
Добавление результатов в
базу данных.
Рис. 2.2 Блок схема алгоритма работы модуля
Вывод результатов является наиболее сложным этапом с точки зрения
анализа актуальных данных. Предполагается, что при выводе результатов,
кроме численных значений будет выводиться и дополнительная оценочная
информация. Визуально вывод должен выводиться в виде таблицы или
списка на основе проверенных данных. В качестве примера приводится
таблица 2.3, в которой зелеными полями указаны критерии, предполагающие
48
возможный риск ТЭЛА у пациента, на основе имеющего количества
пациентов с аналогичном характером заболевания. Знак «?» подразумевает
отсутствие данных по этой категории.
После вывода данных и демонстрации их профильному специалисту,
вся полученная информация должна остаться в базе медицинской системы
для последующего переобучения нейронной сети.
Таблица 2.3
Хирургия 1- да, 2- нет (%)
Операция - сколько суток назад (%)
Умер
Да или нет
Нет данных
Да или нет
Нет данных
Большое хирургическое вмешательство
(название операции) (%)
Живой
Протезирование суставов (%)
ФИО
Перелом бедра (%)
Пример выгрузки данных
0,989
0,011
0,889
0,111
12%
0,994
0,006
0,926
0,074
15%
0,938
0,062
0,926
0,074
21%
0,933
0,067
0,000
1,000
67%
?
?
?
?
?
49
Заключение
В процессе исследования были изучены и получены следующие
результаты:
1)
Изучены современные методы оценки постановки диагноза и
назначения лечения больным тромбоэмболии легочных артерий;
2)
Изучены методы многокритериального анализа
и методы
искусственного интеллекта в медицине;
3)
Выбраны методы и инструменты для обработки данных;
4)
Проанализированы данные клинической базы, выбраны наиболее
важные клинические и статистически важные параметры;
5)
Простроена
нейронная
сеть
с
использованием
различных
инструментов и их различных настроек;
6)
Получен перечень критериев, которые в ходе анализа нейронной
сети показали себя важными и оказывали «большое» влияние на результат;
7)
Построен алгоритм модуля оценки исходов, раскрыт алгоритм
работы модуля и описаны методы его применения и интеграции;
8)
Из полученных результатов могут быть составлены новые шкалы
или методы оценки постановки диагноза и назначения лечения больным
тромбоэмболии легочных артерий.
Предсказательная
способность
получившейся
нейронной
сети
достаточно велика. Благодаря предсказательной способности нейронной сети
и нахождению новых неучтенных параметров – можно создать новую
прогностическую шкалу для оценки клинической вероятности ТЭЛА.
Классификация важности параметров так же показывает наличие не только
неучтенных важных параметров, ранее не применявшихся в задачах
постановки диагноза и назначения лечения больным ТЭЛА. Можно
предположить, что использование этого исследования в клинической
практике может повысить точность постановки диагноза ТЭЛА. Однако
50
данное предположение необходимо проверять в рамках дополнительного
исследования.
Интересным и безусловно заслуживающим внимание со стороны
кардиологов стало обнаружение в совокупности с известными параметрами
неучтенных с риском возникновения ТЭЛА у беременных. нейронная сеть
обнаружила в патофизиология ТЭЛА параметры, которые либо не
учитывались, либо имели малую доказательную базу, либо на них не
обращали
внимание
Выявленные
профильные
параметры
позволят
специалисты
при
предупредить
сборе
анамнеза.
тромбоэмболию
у
беременных и дадут ряд клинических рекомендаций в целях предупреждения
такого страшного сердечно-сосудистого недуга, как ТЭЛА.
51
Список использованных источников
1.
Болвашенков И.В. Искусственный интеллект в сфере здравоохранения
[Текст] / И.В. Болвашенков // Журнал "Research and Science". - 2019. - № 4. С. 11-12.
2.
Прокубовский В.И. Нетрадиционные эндоваскулярные вмешательства
для профилактики тромбоэмболии легочной артерии [Текст] / В.И.
Прокубовский // Ангиология и сосудистая хирургия. - 2001. - Т. 7, - № 1. - С.
81-89.
3.
Котельников М.В., Котельникова Н.Ю. Диагностика и лечение
тромбоэмболии легочной артерии [Текст] / М.В. Котельников, Н.Ю.
Котельникова // Рус. мед. журн. - 2008. - № 16, 17. - С. 9-21.
4.
Darryl Y. Sue. MD: Pulmonary Disease. In Frederic S. Dongard, MD (ed.):
Current: Critical Care Diagnosis & Treatment [Текст] / Y. Sue Darryl // US a
lange medical book. – First Edition. – P. 496.
5.
Task Force Report. Guidelines on diagnosis and management of acute
pulmonary embolism. European Society of Cardiology [Текст] / Task Force
Report // Europ. Heart J. – 2000. – Vol. 21. - P.1301–1336.
6.
Task Force Report. Guidelines on diagnosis and management of acute
pulmonary embolism. European Society of Cardiology [Текст] / Task Force
Report // Europ. Heart J. – 2000. – Vol. 21. - P.1301–1336.
7.
Панченко Е. Профилактика и лечение венозных тромбозов в клинике
внутренних болезней [Текст] / Е. Панченко // Врач. - №7, - 2003.
8.
Sharma G.V.R.K, Schoolman M., Sasahara A.A. Diagnosis and Treatment
of Pulmonary Embolism. In Melvin M., Sheinman, M.D.(eds.) [Текст] / G.V.R.K.
Sharma // Cardiac Emergencies. W.B. Saunders Company, - 1984. - P. 349.
9.
Российский Консенсус «Профилактика послеоперационных венозных
тромбоэмболических осложнений» – М., 2000. – 20 с.
52
10.
Савельев В.С., Яблоков Е.Г., Кириенко А.И. Тромбоэмболия легочных
артерий [Текст] / В.С. Савельев // М.: Медицина, 1979. – 264с.
11.
Ботова С.Н., Починка И.Г., Дворникова М.И., Стронгин Л.Г., Гурьева
Т.М. Клиническая характеристика тромбоэмболии легочной артерии по
данным госпитального регистра [Текст] / С.Н. Ботова // Кардиология:
новости, мнения, обучение. - 2016. - №3. - С. 95-9.
12.
Mukhtar O, Alhafidh O, Khalid M, et al. Predictors of hospital stay in
normotensive acute pulmonary embolism: a retrospective pilot study [Текст] / O.
Mukhtar // J Community Hosp Intern Med Perspect. - 2018. - 8(3). - P.95-100.
13.
Erkens PM, Gandara E, Wells PS, et al. Does the Pulmonary Embolism
Severity Index accurately identify low risk patients eligible for outpatient
treatment? [Текст] / PM. Erkens // Thromb Res. - 2012. -129(6). - P. 710-4.
14.
Aujesky D, Roy PM, Verschuren F, et al. Outpatient versus inpatient
treatment for patients with acute pulmonary embolism: an international, openlabel, randomised, non-inferiority trial [Текст] / D. Aujesky Lancet // - 2011. 378(9785). -P.41-8.
15.
Eichinger S. et al. Risk assessment of recurrence in patients with
unprovoked deep vein thrombosis or pulmonary embolism The Vienna prediction
model [Текст] / S. Eichinger // Circulation. - 2010. - 121(14). -P.1630–1636.
16.
Ройтман Е.В., Левшина Н.Ю.. Тромбоз и гемостаз. Шкалы и алгоритмы
[Текст]/ Е. В. Ройтман // Пособие. Под ред. Е. В. Ройтмана, Н. Ю. Левшина. –
2016.- С. 17.
17.
Tosetto A. et al. Predicting disease recurrence in patients with previous
unprovoked venous thromboembolism: a proposed prediction score (DASH)
[Текст] / A. Tosetto // J Thrombosis Haemostasis. - 2012. -10(6). - P. 1019–1025.
18.
Ройтман Е.В., Левшина Н.Ю.. Тромбоз и гемостаз. Шкалы и алгоритмы
[Текст]/ Е. В. Ройтман // Пособие. Под ред. Е. В. Ройтмана, Н. Ю. Левшина. –
2017.- С. 18.
53
19.
Wells
PS.
Integrated
strategies
for
the
diagnosis
of
venous
thromboembolism [Текст] / PS. Wells // J Thrombosis Haemostasis.- 2007.-5(s1).
- P. 41–50.
20.
Barbar S. et al. A risk assessment model for the identifi cation of
hospitalized medical patients at risk for venous thromboembolism: the Padua
Prediction Score [Текст] / S. Barbar // J Thrombosis Haemostasis. - 2010; - 8(11).
-P.2450–2457.
21.
Российские клинические рекомендации по диагностике, лечению и
профилактике
венозных
тромбоэмболических
осложнений
(ВТЭО).
Флебология. 2015; 9(4): 4–46.
22.
Муллова И.С., Черепанова Н.А., Павлова Т.В., Хохлунов С.М.,
Гниломедова Д.А., Лексина А.А., Дупляков Д.В. [Текст] И.С. Муллова /
Шкала GRACE в оценке риска госпитальных исходов у пациентов с
тромбоэмболией легочной артерии // Российский кардиологический журнал.
- 2018. - №(12). - С.25-31.
23.
Aregai Tecle. Choice of Multicriterion Decision Making Techniques for
Waterwashed Management.Ph.D [Текст] / Tecle Aregai // Dissertation, The
University of Arizona. - 1988.
24.
Wallenius J., Dyer J. S., Fishburn P. C., Steuer R. E., Zionts S., Deb
K.Multiple criteria decision making, multiattribute utility theory: Recent
accomplishments and what lies ahead [Текст] / J. Wallenius // Management
Science.- 2008. -54.
25.
Саати Т. Л. Об измерении неосязаемого. Подход к относительным
измерениям на основе главного собственного вектора матрицы парных
сравнений [Текст] / Т.Л. Саати // Журнал "Cloud Of Science". - 2015. - Т. 2. № 1.
26.
Williams R. W., Herrup K. The control of neuron number. (англ.) [Текст] /
R. W. Williams // Annual review of neuroscience. - 1988. - Vol. 11. - P. 423-453.
27.
Azevedo F. A., Carvalho L. R., Grinberg L. T., Farfel J. M., Ferretti R.
E., Leite R. E., Jacob Filho W., Lent R., Herculano-Houzel S. Equal numbers of
54
neuronal and nonneuronal cells make the human brain an isometrically scaled-up
primate brain. (англ.) [Текст] / F. A. Azevedo // The Journal of comparative
neurology. - 2009. - Vol. 513, no. 5. - P. 532-541.
28.
Болвашенков И.В. Использование нейронных сетей для поиска
дополнительных критериев постановки диагноза и оценки исходов ТЭЛА //
[Текст] / И.В. Болвашенков // Журнал "European multi science journal". - 2019.
- № 26. -С. 10-11.
29.
Online magazine «Workday». [Электронный ресурс]: How Machine
Learning is Transforming Healthcare Administration. - Режим доступа к журн:
http://kmis.ru/media/files/workday-how-machine-learning-is-transforminghealthcare-administration-final.pdf. – Загл. с экрана.
30.
Джулли А., Пал С. Библиотека Keras — инструмент глубокого
обучения = Deep learning with Keras [Текст] / А. Джулли // ДМК Пресс. 2017. - С. 294.
31.
Шолле Ф. Глубокое обучение на Python = Deep Learning with Python
[Текст] / Ф. Шолле // Питер. - 2018. - С. 400.
55
Приложение А
Часть листинга кода по инициализации сети, тренировке
нейронной сети, опросе нейронной сети
import numpy
import scipy.special
class NeuralNetwork:
def __init__(self, inputnodes, hiddennodes, outputnodes, learningrate)
self.input
=x
self.weights1 = np.random.rand(self.input.shape[1],4)
self.weights2 = np.random.rand(4,1)
self.y
self.output
=y
= np.zeros(y.shape)
self.inodes = inputnodes
self.hnodes = hiddennodes
self.onodes = outputnodes
class NeuralNetwork:
def __init__(self, x, y):
self.input
=x
self.weights1 = np.random.rand(self.input.shape[1],4)
self.weights2 = np.random.rand(4,1)
self.y
self.output
=y
= np.zeros(self.y.shape)
def feedforward(self):
self.layer1 = sigmoid(np.dot(self.input, self.weights1))
self.output = sigmoid(np.dot(self.layer1, self.weights2)) class NeuralNetwork:
def train(self, inputs_list, targets_list):
self.input
=x
self.weights1 = np.random.rand(self.input.shape[1],4)
self.weights2 = np.random.rand(4,1)
self.y
self.output
=y
= np.zeros(self.y.shape)
def feedforward(self):
self.layer1 = sigmoid(np.dot(self.input, self.weights1))
self.output = sigmoid(np.dot(self.layer1, self.weights2))
def backprop(self):
56
# application of the chain rule to find derivative of the loss function with respect to weights2 and
weights1
d_weights2 = np.dot(self.layer1.T, (2*(self.y - self.output) * sigmoid_derivative(self.output)))
d_weights1 = np.dot(self.input.T, (np.dot(2*(self.y - self.output) *
sigmoid_derivative(self.output), self.weights2.T) * sigmoid_derivative(self.layer1)))
# update the weights with the derivative (slope) of the loss function
self.weights1 += d_weights1
self.weights2 += d_weights2
def query(self, inputs_list):
inputs = numpy.array(inputs_list, ndmin=2).T
hidden_inputs = numpy.dot(self.wih, inputs)
input_nodes = 3
hidden_nodes = 3
57
Приложение Б
Вход
0,1,м,ж,й,
ПУСТОЕ
Вычислять от
даты, если
есть?
Возраст какой
максимум
поставить
(типа, если
после 90 нет
разницы, то
можно 90
макс - так
будет
логичнее)
1) да,
вычислять от
даты
2)
максимумом
ставить то
число,
которое
является
максимальны
м в данном
параметре на
самом деле.
0-90
0
9
0
Погрешность
Числов
ой
1) да, стоит
использовать
2)да, йопечатка,
исправили.
3)
пропустили,
исправили
Максимум
Не исп
1. Стоит ли
использовать
в модели,
если не
согласно
теории влияет
на результат?
Если только
пытаться
найти
скрытые
зависимости
2. й- опечатка,
должно быть
1?
3. ПУСТОЕ просто
пропустили?
Минимум
Дата
Вход
Вопросы/Комментарии
Не исп
Значения в данных
Дата
рождения
Возраст
Строко
вый
Логиче
ский
Ответы на вопросы
Пол: 0-ж,
1-м
Вид параметра
ФИО
Тип значения
Параметр
Обработка данных
58
Адрес
Строко
вый
Строко
вый
Строко
вый
Дата
Не исп
Набоч
част
упор
Не исп
1
Длит-ть от
начала
симпт-ки
до госпции (сут)
Числов
ой
Вход
Дата
выписки
Койко/ден
ь
Дата
Не исп
Числов
ой
Не исп
Телефон
№ ИБ
Дата
госпитализ
ации
№
отделения
Не исп
Не исп
Не исп
Уточнить Тип
значения!
1. Есть ли
между
отделениями
некая
зависимостиь,
типа простое
отделение,
улучшенное,
совсем крутое
(например, по
оснащению,
комплектации
,
специализаци
и и т.д., тпа
реанимация)?
2. На
начальном
этапе
предлагаю не
использовать,
считая что это
никак не
влияет на
результат
1. В данных
максимум 150
суток. Этого
достаточно?
2. Часы
учитываем
как доли
суток,
правильно?
1)
зависимости
нет
2) можно не
использовать
1) да,
достаточно
2) да, часыдоли суток
0 - 150,
часы
0
1
5
0
59
Перелом
бедра
Логиче
ский
Вход
госпитализ
ация с СН
или ФП (3
мес)
Логиче
ский
Вход
Протезиро
вание
суставов
Логиче
ский
Вход
Уточнить Тип
значения!
1. Достаточно
ли учитывать
было/не было
перелома в
последние 4
месяца или
надо
отдельным
значением
учитывать
более ранние
переломы?
2. ПУСТО =
НД?
Уточнить Тип
значения!
1. что
означает
значение 3?
2. Достаточно
ли учитывать
было/не было
госпитализац
ии или есть
какие-то
особенности в
разных
случаях?
3. ПУСТО =
НД?
Уточнить Тип
значения!
1. что
означает
значение 10?
2. что
означает
значения с
указанием
года?
3. Достаточно
ли учитывать
было/не было
протезирован
ия в
последнее
время
(сколько-то
последних
месяцев) или
1) достаточно
учитывать
было/не было
в последние 4
мес, более
ранние не
нужно.
2) ПУСТО не было
события
0
1
1, в 2008г.
внут.менис
к
пр.бедр.кос
ти
30.01.2013
нд
(пусто)
1) значение 3
- это 1,
исправили.
2)достаточно
учитывать
было/не было
0
1
3
нд
(пусто)
1) значение
10, это 1,
исправили
2) достаточно
учитывать
только в
течение
последних 4
мес
0
1
10
1,
тазобедр.,
2004г.,
2006г.
нд
тазобедр. В
2003г.,
2003г.
60
могут быть
влияния и
более старых
фактов
протезирован
ия на
возникновени
е болезни?
Большое
хир вмешво
Логиче
ский
Вход
Уточнить Тип
значения!
1. Может ли
вид операции
влиять на
заболеваемост
ь?
2. На
начальном
этапе
предлагаю
упростить до
БЫЛО/НЕ
БЫЛО.
1) да, может,
были введены
операции,
которые
могут влиять
2)да, можно,
упростить
0
1
1 резекция
ободочной
кишки по
поводу с-r
АКШ
гемилянэкт
омия L4L5,спондил
одез
двуст.тубоовариальн.
абсцесс
дренаж
перикарда
нд
Операция
Троянова
слева
Остеосинте
з левой
лодыжки
по поводу
перелома
перевязка
перфор.вен
под язвой
(ПТФБвен
н/к,
отечно-язв.
Форма)
протезир
тазобед.
Сустава
тромбэкто
мия из
устья БПВ,
перевязка
БПВ;
комбинир.
венэктомия
справа
61
флебэктом
ия слева
холецистэк
томия
экстирпаци
я матки без
придатков
по поводу
метроэндо
метрита
после
родов
эндопротез
ирование
правого
тазобедрен
ного
сустава
Хирургия
1- да, 2нет
Логиче
ский
Вход
Операция сколько
суток
назад
Числов
ой
Вход
1. Чем
1) в
отличается от
"хирургия"
"Большое хир
сам факт
вмеш-во"?
наличия
2. ПУСТО =
хирургическо
НД?
го
3. Можно
вмешательств
сделать
а, а в "бол хир
единую
вмешательств
упорядоченну
о" название
ю шкалу для
операции
этого и
2)ПУСТО - не
предыдущего было события
параметра:
3) нет, шкала
0 - малое хир
не нужна,
вмеш-во
важен сам
1 - среднее
факт наличия
хир вмеш-во
события
2 - Большое
хир вмеш-во
или
аналогично?
1.
Учитываемый
максимум 90 это
нормально?
1
2
н/д
(пусто)
0-90
0
9
0
62
Обширная
травма
Логиче
ский
Вход
Инфаркт
миокарда
(3 мес)
Логиче
ский
Вход
Поврежден
ие сп мозга
Логиче
ский
Не исп
1
Уточнить Тип
значения!
1. Может ли
вид травмы
влиять на
заболеваемост
ь?
2. Может ли
длительность
от травмы
влиять на
заболевамость
? Как это
учесть
(только одно
значение
указывает
количество
дней, одно
дату)
3. Значение 0
отсутствует все с
травмами?
4. ПУСТО =
ДН или 0?
1. Как понять
значения:
01.00
00.01.1900
2. ПУСТО =
НД или НЕ
БЫЛО
инфаркта?
3. Указан год.
Да и Год
инфоркта?
Это
учитываем
или считаем
то НЕТ в
последние 3
мес?
1. нет таких в
выборке? Не
сможем
учесть
данный
параметр, т.к.
он по сути не
влияет - либо
недоступен,
1) да, может,
1
были введены
нд
травмы,
перелом
которые
костей
могут влиять
пр.кисти,
2)длительност пр.малобар
ь только в
ц.кости
течение
06.04.2014
последних 4
разрыв
мес,
сухожилия
остальных
сгибателя 1
можно не
пальца
учитывать
ушиб мягк.
3) 0 - это
тк. правой
пустые
голени 18
ячейки
дн. назад
4)ПУСТО - не
(пусто)
было события
(0)
1) не
учитываем их
2) ПУСТО не было
инфаркта
3) считаем,
что нет
инфаркта,
если не было
в последние 3
мес
1
2
2006
нд
0:00:00
(пусто)
1) учитываем
все равно, в
любом
случае. Это
значит, что ни
у кого из
пациентов
этого события
не было
0
нд
(пусто)
63
Артроскоп
хир к/суст
Логиче
ский
Не исп
1
Аутоимму
нные
заболевани
я
Логиче
ский
Вход
Переливан
ия крови
Логиче
ский
Вход
Центр вен
катетер
Логиче
ский
Вход
либо НЕТ...
2. ПУСТО =
НД?
3. Если нет
примеров с
ДА, то
предллагаю
на начальном
этапе
исключить
его
1. нет таких в
выборке? Не
сможем
учесть
данный
параметр, т.к.
он по сути не
влияет - либо
недоступен,
либо НЕТ...
2. ПУСТО =
НД?
3. Если нет
примеров с
ДА, то
предллагаю
на начальном
этапе
исключить
его
1. ПУСТО =
НД?
2) ПУСТО не было
события
3) не следует
исключать
1) учитываем
все равно, в
любом
случае. Это
значит, что ни
у кого из
пациентов
этого события
не было
2) ПУСТО не было
события
3) не следует
исключать
0
нд
(пусто)
ПУСТО - не
было события
0
1
нд
(пусто)
1. ПУСТО =
НД?
2. о опечатка,
должно быть
0?
1) ПУСТО не было
события
2)да,
опечатка,
исправили
0
1
нд
о
(пусто)
1. ПУСТО =
НД?
ПУСТО - не
было события
0
1
нд
(пусто)
64
Х/терапия
Логиче
ский
Вход
1. ПУСТО =
НД?
ПУСТО - не
было события
0
1
нд
(пусто)
хр заб
лёгких
Логиче
ский
Вход
1. ПУСТО =
НД?
ПУСТО - не
было события
0
1
нд
(пусто)
ХСН 3-4
ФК
Набор
упоряд
очен
Вход
1) да
2) нет,
кодировать не
нужно, важен
сам факт
наличия или
отсутствия
именно 3-4
функциональ
ного класса
0
1
2
3 фк
нд
(пусто)
Эритропоэ
тин
стимулиру
ющие
препараты
Логиче
ский
Вход
1.
Хроническая
сердечная
недостаточно
сть?
2.
Нормально,
если
закодировать:
0 - НЕТ
1 - I ст.
2 - II А ст.
3 - II Б ст.
4 - III ст.
?
1. ПУСТО =
НД?
ПУСТО - не
было события
0
1
нд
(пусто)
ГЗТ
Логиче
ский
Вход
1. ПУСТО =
НД?
2. дн опечатка, =
НД?
1) ПУСТО не было
события
2) да,
опечатка,
исправили
0
1
дн
нд
(пусто)
Комб.
Горм.
Контрацеп
ция
Логиче
ский
Вход
ЭКО
Логиче
ский
Не исп
1
0
1
нд
1. нет таких в
выборке? Не
сможем
учесть
данный
параметр, т.к.
он по сути не
влияет - либо
недоступен,
1) учитываем
все равно, в
любом
случае. Это
значит, что ни
у кого из
пациентов
этого события
не было
0
нд
(пусто)
65
Инфекции
(пневмони
я,
мочеполов
ые,ВИЧ)
Логиче
ский
Вход
Воспалите
льные
заболевани
я
кишечника
Логиче
ский
Вход
Онкология
Логиче
ский
Вход
локализац
ия
онкологии
Строко
вый
Не исп
1
либо НЕТ...
2. ПУСТО =
НД?
3. Если нет
примеров с
ДА, то
предллагаю
на начальном
этапе
исключить
его
1. ПУСТО =
НД?
2) ПУСТО не было
события
3) не следует
исключать
ПУСТО - не
было события
0
1
нд
(пусто)
1. ПУСТО =
НД?
ПУСТО - не
было события
0
1
нд
(пусто)
0
1
нд
1. Можно както
формализоват
ь и выделить
варианты
влияющие на
заболеваемост
ь?
тектовые
данные
66
Давность
(мес)
Числов
ой
Вход
ОНМК с
параличем
Логиче
ский
Вход
Давность
(мес)
Числов
ой
Вход
Берем/посл
ерод п-д
Логиче
ский
Вход
1. Выялено
только что,
считаем =0?
2. ПУСТО =
НД?
3. Если
активное
лечение
сильно
влияет, то его
желательно
выделить в
отдельный
параметр.
Хотя, есть
еще параметр
Химиотерапи
я, возможно с
ним
пересекается..
?
4. Макс 120
мес
достаточно?
1) да, считаем
=0, либо доли
от месяца в
сутках
2) ПУСТО не было
события
3) активное
лечение
считать как
химиотерапи
ю
4) да,
достаточно
1. Этот
паказатель
относится к
ОНМК с
параличем?
2. Сейчас это 0 или НД?
3. Максимум
120 мес достаточно?
1) да
2) это 0
3) да,
достаточно
0
0,5
1
1,55
2
3
4
6
8
12
20
24
36
60
84
2007
2008
0
1
2
0
0
1
2
0
обнаружен
о на секции
1 год
3 года
активное
лечение
нд
сейчас
только
выявлена
(пусто)
0
1
нд
0
1
24
49
96
108
111
11 лет
нд
сейчас
08.02.2012
(пусто)
0
1
нд
67
Анамнез
ВТЭО: 0нет, 1-да
Логиче
ский
Вход
1. 11 - это
опечатка,
должно быть
1?
1) да,
опечатка,
исправили
0
1
11
нд
Предшест
ТЭЛА, 0нет, 1-да
Логиче
ский
Вход
1. Что
означает - 2?
1) 2 это 1,
исправили
0
1
2
нд
Предшест
ТЭЛА, ск
лет назад
Числов
ой
Вход
1) 10 лет
достаточно
0-31
Предшест
ТГВНК, 0нет, 1-да
Логиче
ский
Вход
1. Максимум
40 лет - этого
достаточно?
Может
меньше
достаточно, а
все что
больше уазывать
максимум?
1. ПУСТО =
НД?
ПУСТО - не
было события
0
1
нд
(пусто)
Предшест
ТГВНК, ск
лет назад
Числов
ой
Вход
1) 10 лет
достаточно
0-40
Тромбоз
поверхнос
тных вен
Логиче
ский
Вход
0
0,08
1
нд
(пусто)
Тромбофи
лия
Логиче
ский
Вход
1) ПУСТО не было
события
2) да,
опечатка,
исправили.
Должно быть
1
1) ПУСТО не было
события
2) да,
опечатка,
исправили
1. Максимум
40 лет - этого
достаточно?
Может
меньше
достаточно, а
все что
больше уазывать
максимум?
1. ПУСТО =
НД?
2. 0,08 опечатка?
Если да, то
должно быть?
1. ПУСТО =
НД?
2. р/д опечатка,
должно быть
НД?
0
4
0
0
4
0
0
1
нд
р/д
(пусто)
68
Дефицит
АТ
Логиче
ский
Не исп
1
Дефицит
прС
Логиче
ский
Не исп
1
Дефицит
ПрS
Логиче
ский
Не исп
1
1. нет таких в
выборке? Не
сможем
учесть
данный
параметр, т.к.
он по сути не
влияет - либо
недоступен,
либо НЕТ...
2. ПУСТО =
НД?
3. Если нет
примеров с
ДА, то
предллагаю
на начальном
этапе
исключить
его
1. нет таких в
выборке? Не
сможем
учесть
данный
параметр, т.к.
он по сути не
влияет - либо
недоступен,
либо НЕТ...
2. ПУСТО =
НД?
3. Если нет
примеров с
ДА, то
предллагаю
на начальном
этапе
исключить
его
1. нет таких в
выборке? Не
сможем
учесть
данный
параметр, т.к.
он по сути не
влияет - либо
недоступен,
либо НЕТ...
2. ПУСТО =
НД?
везде
поставить НД,
значит
данный
анализ не
проводился
0
нд
(пусто)
везде
поставить НД,
значит
данный
анализ не
проводился
0
нд
(пусто)
везде
поставить НД,
значит
данный
анализ не
проводился
0
нд
(пусто)
69
FVLeiden
Логиче
ский
Не исп
1
FVIII
Логиче
ский
Не исп
1
3. Если нет
примеров с
ДА, то
предллагаю
на начальном
этапе
исключить
его
1. нет таких в
выборке? Не
сможем
учесть
данный
параметр, т.к.
он по сути не
влияет - либо
недоступен,
либо НЕТ...
2. ПУСТО =
НД?
3. Н и НН =
НД?
3. Если нет
примеров с
ДА, то
предллагаю
на начальном
этапе
исключить
его
1. нет таких в
выборке? Не
сможем
учесть
данный
параметр, т.к.
он по сути не
влияет - либо
недоступен,
либо НЕТ...
2. ПУСТО =
НД?
3. Если нет
примеров с
ДА, то
предллагаю
на начальном
этапе
исключить
его
везде
поставить НД,
значит
данный
анализ не
проводился
0
н
нд
нн
(пусто)
везде
поставить НД,
значит
данный
анализ не
проводился
0
нд
(пусто)
70
FII
Логиче
ский
Вход
1. ПУСТО =
НД?
везде
поставить НД,
значит
данный
анализ не
проводился
везде
поставить НД,
значит
данный
анализ не
проводился
ГГЦ
Логиче
ский
Не исп
1
1. нет таких в
выборке? Не
сможем
учесть
данный
параметр, т.к.
он по сути не
влияет - либо
недоступен,
либо НЕТ...
2. ПУСТО =
НД?
3. Если нет
примеров с
ДА, то
предллагаю
на начальном
этапе
исключить
его
Иммобил-я
› 3 сут
Логиче
ский
Вход
Сахарный
диабет
Логиче
ский
Вход
1. ПУСТО =
НД?
ПУСТО= не
было события
0
1
нд
(пусто)
АГ
Логиче
ский
Вход
1. ПУСТО =
НД?
ПУСТО= не
было события
0
1
нд
(пусто)
Путеш-е
длит
расстоян
(более 3
часов)
Возраст
›60
Логиче
ский
Вход
0
1
нд
Логиче
ский
Вход
0
1
нд
0
1
нд
(пусто)
0
нд
(пусто)
0
1
нд
71
Ожирение
(ИМТ >30)
Логиче
ский
Вход
Лапароско
п хирургия
Логиче
ский
Вход
Берем/род
ы
Варикозно
е
расширени
е вен
нижних
конечносте
й
ДЗ ТЭЛА
более
вероятен
Логиче
ский
Вход
1. ПУСТО =
НД?
ПУСТО= не
было события
0
1
нд
(пусто)
0
1
нд
1. Как этот
параметр
связан с
"Берем/после
род п-д"?
2. Как
интерпретиро
вать
значения?
1)
беременность/
роды имеется
сколько всего
вжизни у
женщины
было
беременносте
й/родов
2)
беременность/
послеродовой
период - это
имеется в
виду наличие
на данный
момент
0
1
1и0
1и1
1и1
1\1
1и1
2 / 2.
2и1
2и3
3и2
3и3
4и2
4и3
4и2
6и2
6и4
7и3
9и2
нд
нет данных
04.02.2014
05.05.2014
(пусто)
1. ПУСТО =
НД?
ПУСТО= не
было события
0
1
нд
(пусто)
1. Как
интерпретиро
вать
параметр: это
вход или
результат
анализа?
2. Как
это опечатки,
исправлено на
1
0
1
3
н
нд
(пусто)
72
интерпритиро
вать значения
0,1,3?
3. н - это
опечатка,
должно быть
НД?
Баллы по
Wells
Числов
ой
Не исп
Баллы по
Женевск
шкале
Числов
ой
Не исп
Шок: 0нет, 1-есть
Логиче
ский
Вход
САД,
уровень,
приемн
покой
Числов
ой
Вход
Баллы же
можно
вычислить на
основании
входных
данных.
Предлагаю
учесть ВСЕ
входные
данные, а этот
параметр не
учитывать в
модели
Баллы же
можно
вычислить на
основании
входных
данных.
Предлагаю
учесть ВСЕ
входные
данные, а этот
параметр не
учитывать в
модели
учесть нужно,
для сравнения
и
определения
эффективност
и данной
шкалы
это
интегральный
параметр
учесть нужно,
для сравнения
и
определения
эффективност
и данной
шкалы
это
интегральный
параметр
0
1
нд
1. Как
интерпретиро
вать
значения?
Единицы
измерения?
2. Диапазон 0210
нормально
или надо
расширить?
1) мм рт ст
2) нормально
0-210, НД
0
2
1
0
73
ДАД,
уровень,
приемн
покой
Числов
ой
Вход
Гипотензи
я: 0-нет, 1есть,
приемн
покой
Высокий
риск
смерти
Логиче
ский
Вход
Невысокий
риск
смерти
Логиче
ский
Одышка
Логиче
ский
БОЛЬ В
ГРУДИ
Логиче
ский
боль в гр
клетке
острая
Логиче
ский
Логиче
ский
1. Как
интерпретиро
вать
значения?
Единицы
измерения?
2. Диапазон 0150
нормально
или надо
расширить?
1) мм рт ст
2) нормально
0
1
5
0
0
1
1. Это
входной или
выходной
параметр для
анализа?
1. Это
входной или
выходной
параметр для
анализа?
входной
параметр
0
1
входной
параметр
0
1
Вход
Вход
0-150, НД
0
1
нд
1. ПУСТО =
НД?
2. Как
связаны
логически
между собой
параметры о
боле в груди?
Может
достаточно
только
следующих
параметров
или выделить
"Боль в груди
прочая"
1. ПУСТО =
НД?
1)
ПУСТО=НД
2) нужно
оставить все
параметры в
плане
дифференциа
льной
диагностики с
острым
коронарным
синдромом,
напрример
0
1
нд
(пусто)
ПУСТО= не
было события
0
1
нд
(пусто)
74
боль в гр
клетке
загрудинна
я
Логиче
ский
Вход
1. ПУСТО =
НД?
ПУСТО= не
было события
0
1
нд
(пусто)
боль в гр
клетке
плевральна
я (при
повороте
туловища,
дыхании)
Кашель
Логиче
ский
Вход
1. ПУСТО =
НД?
ПУСТО= не
было события
0
1
нд
(пусто)
Логиче
ский
Вход
Синкопе
Логиче
ский
Вход
1. ПУСТО =
НД?
ПУСТО= не
было события
0
1
нд
(пусто)
Кровохарк
ание
Логиче
ский
Вход
1. ПУСТО =
НД?
2. дн опечатка, =
НД?
1) ПУСТО=
не было
события
2)да,
опечатка,
исправили
0
1
дн
нд
(пусто)
ЧСС при
поступлен
ии
Числов
ой
Вход
1. Это пульс?
2. Диапазон 0170
нормально
или надо
расширить?
3. Пульс = 0 это как?
0-170, НД
Пост ФП
Логиче
ский
Вход
1. ПУСТО =
НД?
1) да
2) нормально
3) оба
пациента
умершие,
скорее всего
поступили в
агональном
состоянии,
пульс не
определялся
ПУСТО= не
было события
Парокс ФП Логиче
ский
Вход
0
1
нд
0
1
7
0
0
1
(пусто)
0
1
нд
75
ЧД при
поступлен
ии
Числов
ой
Вход
1. ЧД =
1) ДА,
Частота
частота
дыхания?
дыхания,
Тогда 0 - это
пациентв
как?
агональном
2. 32-36 - как
состоянии
интерпритиро
2) берем
вать: 34 +/-2 максимальное
(погрешность
значение
)?
3) значит 0
3. ИВЛ
4) значит нет
мешком Амбу
записи в
- как
истории
интерпретиро
вать?
4. нд - как
интерпритиро
вать: не
записали или
не могут
понять или
еще как?
1. ПУСТО = 1) ПУСТО=не
НД?
было события
2. В чем
2) 0 или 1,
измеряются было или нет,
значения?
опечатки
исправили
Диапазон:
0-109
32-36
ИВЛ
мешком
Амбу
нд
Цианоз
верх 1/2
туловища
Вход
Цианоз
носогубн
треугол
Вход
1. В чем
измеряются
значения?
1) нет единиц
измерения,
опечатки
исправили
0
1
8
нд
Вход
1. 0 - нет
поражения?
2. По степени
возрастания
риска:
0 - нет
поражения
1 - левая
2 - правая
3 - двухстор
правильно?
1. В чем
измеряются
значения?
2. ПУСТО =
НД?
1) да,
поражения
нет
2) да,
правильно
0
1
2
3
нд
1) единиц
измерения
нет, было/не
было 1, 0 .
Опечатки
исправили
0
1
2
нд
(пусто)
Локализац
ия пораж-я
н/конечн:
1-правая,
2-левая, 3двустор
Отёк н/к
Набор
упоряд
очен
Вход
0
1
0
9
0
1
8
нд
(пусто)
76
Боль в н/к
Боль при
пальп
ГВНК
Логиче
ский
Вход
1. ПУСТО =
НД?
1) единиц
измерения
нет, было/не
было 1, 0 .
Опечатки
исправили
ПУСТО = не
было события
Асимметр
ия
диаметра
н/к
(икроножн
): 0-нет, 1есть
Асимметр
ия
диаметра
н/к
(икроножн
), см
Логиче
ский
Вход
1. ПУСТО =
НД?
ПУСТО = нет
данных
0
1
нд
(пусто)
Числов
ой
Вход
0
2
3
4
нд
(пусто)
Логиче
ский
Вход
1. ПУСТО =
1) ПУСТО =
НД?
нет данных
2. 0 = Нет
2)да
асиметрии?
3)объединять
3.
не нужно, в
Рассматриваю первом случае
вариант
наличие или
объединения
нет
с параметром асимметрии, а
выше
во втором 4. Максимум
разность в
= 4,
диаметрах
правильно?
4) ДА
1. ПУСТО =
ПУСТО = нет
НД?
данных
Числов
ой
Вход
1. ПУСТО =
НД?
2. 0 = Нет
асиметрии?
3.
Рассматриваю
вариант
объединения
с параметром
выше
4. Максимум
= 5,
правильно?
0
5
нд
(пусто)
Асимметр
ия
диаметра
н/к
(бедро): 0нет, 1-есть
Асимметр
ия
диаметра
н/к
(бедро), см
Вход
1. В чем
измеряются
значения?
ПУСТО = неТ
ДАННЫХ
0
1
2
нд
0
1
нд
(пусто)
0
4
0
5
0
1
нд
(пусто)
77
Хрипы в
лёгких: 0нет, 1-есть
Логиче
ский
Вход
1. ПУСТО =
НД?
ПУСТО = не
было события
Лихорадка
>37,5
Логиче
ский
Вход
ЭКГ
признаки
0-нет 1есть
Логиче
ский
Вход
ЭКГ: ppulmonale
Логиче
ский
Вход
ЭКГ:QIIISI
Логиче
ский
Вход
ЭКГ: отр
TIII
Логиче
ский
Вход
ЭКГ: SV56
Логиче
ский
Вход
1. ПУСТО =
НД?
2. 11 - это
опечатка?
ПУСТО = не
было события
опечатка исправили
0
1
11
нд
(пусто)
БПНПГ
полная
Логиче
ский
Вход
1. ПУСТО =
НД?
ПУСТО = не
было события
0
1
нд
(пусто)
БПНПГ
неполная
Логиче
ский
Вход
0
1
нд
(пусто)
0
1
нд
1. ПУСТО =
НД?
2. Как
связаны
логически
между собой
параметры по
ЭКГ - этот и
ниже?
1. ПУСТО =
НД?
ПУСТО = не
было события
здесь сам
факт наличия
признаков,
ниже
расшифровка
какие именно
0
1
нд
(пусто)
ПУСТО = не
было события
0
1
нд
(пусто)
1. ПУСТО =
НД?
ПУСТО = не
было события
0
1
нд
(пусто)
0
1
нд
0
1
нд
78
ЭКГ: TV13
Логиче
ский
Вход
1. ПУСТО =
НД?
2. Это ЭКГ
как-то связано
с теми, что
были выше?
ПУСТО = не
было события
да, все
признаки
связаны
между собой
ЭКГ все
три
признака:
SI-QIII,
БПНПГ и
инверсия Т
Rg-призн
0-нет 1есть
Логиче
ский
Вход
Логиче
ский
Вход
Rg:
расшир
прав
границы
сердца
Rg: выбухе легочн
конуса по
лев
контуру
Rg:
расшир-е
тени ВПВ
Логиче
ский
Вход
0
1
нд
Логиче
ский
Вход
0
1
нд
Логиче
ский
Вход
1. ПУСТО =
НД?
ПУСТО = не
было события
0
1
нд
(пусто)
Rg: выс
стояние
куп-ла
диафрагмы
Логиче
ский
Вход
1. ПУСТО =
НД?
ПУСТО = не
было события
0
1
нд
(пусто)
Rg: с-м
Вестермар
ка
Логиче
ский
Вход
1. ПУСТО =
НД?
ПУСТО = не
было события
0
1
нд
(пусто)
Rg:
инфильтра
т
Логиче
ский
Вход
1. ПУСТО =
НД?
ПУСТО = не
было события
0
1
нд
(пусто)
0
1
нд
(пусто)
0
1
нд
1. Как данный
признак
связан с теми,
что ниже
Rg...?
здесь сам
факт наличия
признаков,
ниже
расшифровка
какие именно
0
1
нд
79
Rg:
плеврал
выпот
Логиче
ский
Вход
ПУСТО = не
было события
0
1
нд
Rg: с-м
Хемптона
Логиче
ский
Вход
ПУСТО = не
было события
0
1
нд
Эхопризн1: 0нет 1-есть
Логиче
ский
Вход
0
1
11
нд
Эхо1: сист
ДЛА
Числов
ой
Вход
1) все
свидетельству
ют о наличии
легочной
гипертензии
2) опечатка,
исправили
1) мм рт ст
2) да
3) либо
проводилось,
но в
заключении
не указан
именно
данный
параметр
Эхо1:
ТКгр
Числов
ой
Вход
Эхо1:
Дилатация
ПЖ (более
30): 0-нет,
1-да
Логиче
ский
Вход
Эхо1:
Размер
ПЖ, СМ!!!
Числов
ой
Вход
1. Как
связаны
между собой
параметры
Эхо?
2. 11 - это
опечатка?
1. В чем
еденица
измерения?
2. 143
максимум это
правильно?
3. НД =
исследование
не
проводилось?
1. В чем
еденица
измерения?
2. 133
максимум это
правильно?
3. НД =
исследование
не
проводилось?
4. ПУСТО =
НД
1. Не понятен
смысл
значений 10 и
39?
1. Почему
значения так
сильно
разняться.
Часть в
0-143, НД
0
1
4
3
1) мм рт ст
2) да
3) либо
проводилось,
но в
заключении
не указан
именно
данный
параметр
4)да
0-133, НД,
ПУСТО
0
1
3
3
это опечатки,
исправлено на
1
0
1
10
39
нд
да, в разных
единицах, все
исправлено
0-67, НД
80
Эхо1:
Гипокинез
ПЖ
Логиче
ский
Вход
Эхо1:
Расшир
НПВ
Числов
ой
Вход
Эхо1: ФВ
Числов
ой
Вход
пределах 6 (от
1,8 до 5,9) с
десятыми
долями, часть
целые
значения от
18 до 67? Есть
подозрения,
что они одни
и те же,
только в
разных
еденицах
измерения
1. 2,4 - это не это опечатки,
верное
исправлено на
значение?
1
1. В чем
еденица
измерения?
2. 78
максимум это
правильно?
3. НД =
исследование
не
проводилось?
4. ПУСТО =
НД
1. В чем
еденица
измерения?
2. 89
максимум это
правильно?
3. НД =
исследование
не
проводилось?
4. ПУСТО =
НД
0
1
2,4
нд
1) в мм
2)да
3) это значит
нет данных
4) да
0-78, НД,
ПУСТО
0
7
8
1) в
процентах
2) правильно
3) может
проводилось,
но не указан
данный
параметр.
Если
исследование
не
проводилась
по всем
параметрам
будет нд или
пусто
0-89, НД
0
8
9
81
Эхо2: не
пров - 0,
пров - 1
Логиче
ский
Вход
1. По
описанию
логический,
по значениям
не понятно.
Просьба
пояснить
значение :
45,46,нет?
2. ПУСТО =
НД?
1. В чем
еденица
измерения?
2. 124
максимум это
правильно?
3. НД =
исследование
не
проводилось?
Эхо2: сист
ДЛА
Числов
ой
Вход
Эхо2:
ТКгр
Числов
ой
Вход
1. В чем
еденица
измерения?
2. 109
максимум это
правильно?
3. НД =
исследование
не
проводилось?
Эхо2:
Дилатация
ПЖ (более
30): 0-нет,
1-нет
Логиче
ский
Вход
1. ПУСТО =
НД?
2. д опечатка,
должно быть
НД?
1) опечатки,
исправлено
2) не
проводилось
0
1
45
46
нд
нет
(пусто)
1) мм рт ст
2) да
3) либо
проводилось,
но в
заключении
не указан
именно
данный
параметр
для параметра
проводилось/
не
проводилось
есть
отдельный
столбец
1) мм рт ст
2) да
3) либо
проводилось,
но в
заключении
не указан
именно
данный
параметр
для параметра
проводилось/
не
проводилось
есть
отдельный
столбец
1) да
2) опечатка,
исправлено
0-124, НД
0
1
2
4
0-109, НД
0
1
0
9
0
1
д
нд
(пусто)
82
Эхо2:
Размер
ПЖ, см
Числов
ой
Вход
Эхо2:
Гипокинез
ПЖ
Логиче
ский
Вход
Эхо2:
Расшир
НПВ
Числов
ой
Вход
Эхо2: ФВ
Числов
ой
Вход
Ангиопуль
монографи
я: 0-не
вып, 1-вып
Логиче
ский
Вход
1. Данные
странно
разняться.
Сначала от 0
до 6,7 с
десятыми,
потом от 22
до 47 уже в
целых. Это
правильно?
Не знаю, что
такое ПЖ, но
может ли оно
быть оно
полметра у
человека…
1. Параметр
логический,
38 - ошибка?
2. Как связан
с Размером
ПЖ?
3. н опечатка?
1. Параметр
числовой?
2. 77 максимум?
3. днд = НД?
4. ПУСТО =
НД?
1. 78 максимум?
2. Еденица
измерения?
1. о = 0?
было в
разных
единицах,
испралено
0-47, НД
опечатки,
исправлено
0
1
38
н
нд
да, чиловой,
диаметр
нижней полой
вены
да,максимум
опечатки
исправлены
да
0
4
7
0
1
18
21
23
24
26
77
днд
нд
(пусто)
0
7
7
1) да
2) да, в
процентах
0-78, НД
0
7
8
да,
исправлено
0
1
нд
о
83
Объём
пораж-я: 1мелк
ветви, 2сегментар,
3-ствол, гл
ветви, 4норма
Набор
упоряд
очен
Вход
Каваграфия: 0не вып, 1вып
Логиче
ский
Вход
Кава-граф:
тромбоз
Логиче
ский
Вход
1. Просьба
1) да, именно
пояснить суть
так
значений.
2) это мелкие
Интересует,
ветви
можно ли их
3) да,
упорядочить
исправлено
по мере
повышения
риска
заболеваемост
и:
норма лучше,
чем мелк
ветви,
которые
лучше чем
сегментар,
ствол гл ветви
- самое
плохое
(самый
высокий
риск)?
2. как
интерпретиро
вать значение
"ветви 3
порядка"?
3. н, ндн =
НД?
1. ПУСТО =
1) пустто НД?
исследование
2. если это
не
назначение,
выполнялось
то как может
3) это
быть НД?
параметр
3. Как
самого факта
связаны
выполнения/н
между собой
евыполнения
параметры
исследования,
этот и ниже
ниже
Кава?
результаты
проведенного
исследования
1. ПУСТО =
исследование
НД?
не
выполнялось.
Данных нет
0
1
2
3
4
ветви 3
порядка
н
нд
ндн
(пусто)
0
1
нд
(пусто)
0
1
нд
(пусто)
84
Кава-гр:
норма
Логиче
ский
Вход
1. ПУСТО =
НД?
исследование
не
выполнялось.
Данных нет
0
1
нд
(пусто)
КТ: 0- не
вып, 1-вып
Логиче
ский
Вход
Логиче
ский
Вход
1) да,
исправлено
2) по
результатам
проведенной
КТ
исследование
не
выполнялось
0
1
н
нд
КТ без
контрастир
ования
1. н = НД?
2. Как
взаимосвязан
ы между
собой
параметы КТ?
1. ПУСТО =
НД?
КТ: есть
признаки
ТЭЛА
Логиче
ский
Вход
1. 4опечатка? Что
должно быть?
2. н, ндн,
ПУСТО =
НД?
исправили
4=1
0
1
4
н
нд
ндн
(пусто)
КТ: нет
признаков
ТЭЛА
Логиче
ский
Вход
1. ПУСТО =
НД?
кт не
выполнялось,
не т данных
0
1
нд
(пусто)
левая
легочная
артерия
Логиче
ский
Вход
кт не
выполнялось,
не т данных
нет, никакой
связи
0
1
нд
(пусто)
правая
легочная
артерия
Логиче
ский
Вход
1. ПУСТО =
НД?
2. Как
связаны
между собой
параметры,
выделенные
жирным
шрифтом?
3. В чем суть
параметров,
выделенных
жирным
шрифтом?
1. ПУСТО =
НД?
кт не
выполнялось,
нет данных
0
1
нд
(пусто)
0
1
нд
(пусто)
85
обе ЛА
Логиче
ский
Вход
1. ПУСТО =
НД?
кт не
выполнялось,
нет данных
0
1
нд
(пусто)
одна доля
Логиче
ский
Вход
1. ПУСТО =
НД?
2. 10 - это
опечатка?
кт не
выполнялось,
нет данных
исправлено на
0
0
1
10
нд
(пусто)
один
сегмент
Логиче
ский
Вход
1. ПУСТО =
НД?
кт не
выполнялось,
нет данных
0
1
нд
(пусто)
несколько
долей
Логиче
ский
Вход
1. ПУСТО =
НД?
кт не
выполнялось,
нет данных
0
1
нд
(пусто)
несколько
сегментов
Логиче
ский
Вход
1. ПУСТО =
НД?
кт не
выполнялось,
нет данных
0
1
нд
(пусто)
массивная
Логиче
ский
Вход
1. ПУСТО =
НД?
2. В чем суть
параметра?
0
1
нд
(пусто)
субмассив
ная
Логиче
ский
Вход
1. ПУСТО =
НД?
2. Что
означает 2опечатка или
нет?
3. В чем суть
параметра?
кт не
выполнялось,
нет данных
поражение
ствола и
крупных
ветвей
легочной
артериии
кт не
выполнялось,
нет данных
исправлено
на1
поражение
долевых
ветвей
легочной
артерии
0
1
2
нд
(пусто)
86
мелких
ветвей
Логиче
ский
одно (1)двухсторо
нняя (2)
Вход
1. ПУСТО =
НД?
2. В чем суть
параметра?
Вход
1. Что
означают: 0,
1,2,3?
2. ПУСТО =
НД?
3. В чем суть
параметра?
1. Как это
параметр КТ
связан с
предыдущими
КТ?
2. По
описанию
значения 0 и
1, что
означает 2?
3. ПУСТО =
НД?
1. Как
связаны
между собой
параметры
ЦДК?
КТпризнаки
инфарктпневмонии
: 0 -нет, 1 да
Логиче
ский
Вход
ЦДК н/к:
0-не вып,
1-вып
Логиче
ский
Вход
ЦДК:
тромбоз
Логиче
ский
Вход
ЦДК: тип
тромба 0пристен, 1окклюзир,
2-флоттир
Вход
кт не
выполнялось,
нет данных
поражение
мелкихветвей
легочной
артериии
1) 3 убрали
2)да
3) поражение
легочной
артерии с
одной
стороны или
двухсторонне
е
2) исправлено
3)да
0
1
нд
(пусто)
0
1
2
3
нд
(пусто)
0
1
2
нд
(пусто)
0
1
нд
0
1
нд
1. Можно ли
1) да,
упорядочить пристеночные
значения по
и
степени
окклюзирующ
возрастания
ие иенее
риска или еще
опасные,
как-то
флоттирующи
логически?
е более
2. Что
опасные
означает 1,2 2) да
присутствует 3) исправлено
и окколюзир
4) НД, не
и флоттир?
указано какой
Аналогично 0
тромбоз
0
1
1,2
2
0и1
г
нд
(пусто)
87
и 1?
3. г - это как
интерпретиро
вать?
4. ПУСТО =
НД?
ЦДК:
ПТФБ
Логиче
ский
Вход
ЦДК: клап
нед-ть
Логиче
ский
Вход
ЦДК:
норма
Логиче
ский
Вход
D-димер:
0-не вып,
1-вып
Логиче
ский
Вход
1. Возможны
только 2
значения: 0 и
1?
2. г - что
означает?
3. ПУСТО =
НД?
1. Как
интерпретиро
вать значения
параметров: г,
н, нн?
2. ПУСТО =
НД?
1) да и нет
данных
2) исправлено
3) да
0
1
г
нд
(пусто)
исправлено
да
0
1
г
н
нд
нн
(пусто)
1. Возможны
только 2
значения: 0 и
1?
2. г - что
означает?
3. ПУСТО =
НД?
1. По
описанию
логический,
по значениям
не понятно.
Просьба
прояснить.
2. Как этот
параметр
связан со
следующим?
3. ПУСТО =
НД?
1) да и НД
2) исправлено
3)да
0
1
г
нд
(пусто)
да
0
1
1,33
1,65
2
10
11
н
нд
(пусто)
88
D-димер:
уровень
Числов
ой
Вход
1. Числовые
значения от 0
до 12
понятны, как
интерпретиро
вать
остальные?
BNP: 0-не
вып, 1-вып
Логиче
ский
Вход
1. По
описанию
логический
параметр, по
значению не
понятно.
Просьба
пояснить
BNP:
уровень
Числов
ой
Вход
Тропонин:
0-не вып,
1-вып
Логиче
ский
Вход
1. Как
интерпретиро
вать г?
2. ПУСТО =
НД?
1. ПУСТО =
НД?
2. Как этот
параметр
связан со
седующим?
у некоторых
пациентов
числовых
значений нет,
брали только
качественно,
нужно
отметить
отриц или
полож
0-12 с
точностью
до 10-х
205нг/дл
52527мкг/м
л
>5000
нг/мл
кач
нд
отр
отр.
полож
полож.
слабополо
жит.
(пусто)
0
1
2,3
2,58
5,73
11,2
2,,95
нд
полож.
(пусто)
исправлено
да
0-5000
г
нд
ПУСТО
ПУСТО
исправлено на
1
0
1
нд
(пусто)
89
Тропонин:
колич
Числов
ой
Вход
ОАК1 : Hb
Числов
ой
Вход
ОАК1: Er
Числов
ой
Вход
ОАК1: Hct
Числов
ой
Вход
ОАК1: Le
Числов
ой
Вход
1. Большая
часть
значений
находится в
диапозоне 07, часть
значений
выпадает они верны?
2. Что
означают
текстовые
результаты и
как их
интерпретиро
вать?
3. ПУСТО =
НД?
1. 194 максимум?
2. Еденица
измерения?
1. Большая
часть
значений
находится в
диапозоне 07,3, часть
значений
выпадает они верны?
1. Большая
часть
значений
находится в
диапозоне 00.58, часть
значений
выпадает они верны?
1. Большая
часть
значений
находится в
диапозоне 033.6, часть
значений
выпадает они верны?
1) ДА,
ВЕРНЫ
2) кака
качественный
анализ
3)да
0-7
18,7
27,46
<0,2
нд
отр
отр.
отрицатель
ный
полож
положит.
(пусто)
1) да
0-194, НД
0
НЕТ,
ИСПРАВЛЕН
О
0 - 7,3;
103
128
143
156
НД
0
исправлено
0-0,58
0,9
25
39
НД
0
исправлено
0-33,6
76
127
НД
0
2) г/Л
1
9
4
90
ОАК1: Tr
Числов
ой
Вход
1. ПУСТО =
НД?
да
ОАК2 : Hb
Числов
ой
Вход
1. 1772 опечатка?
исправлено
ОАК2: Er
Числов
ой
Вход
1. Большая
часть данных
0-9,3,
остальные
выпадают.
Это
правильно?
исправлено
ОАК2: Hct
Числов
ой
Вход
ОАК2: Le
Числов
ой
Вход
ОАК2: Tr
Числов
ой
Вход
б/х1:
билирубин
Числов
ой
Вход
1. ПУСТО =
НД?
2. 6,9 максимум?
1. Просьба
поправить
опечатки
2. 87 максимум,
правильно?
1. большая
часть
значений <
636. 1107 и
2755 - верные
значения?
2. ПУСТО =
НД?
1. Опечатки?
2. ПУСТО =
НД?
б/х1:
глюкоза
Числов
ой
Вход
б/х1:белок
Числов
ой
б/х1:АЛАТ
Числов
ой
0-653
НД
ПУСТО
0-208
1772
НД
0-9,3
39
44,8
143
нд
03.01.1900
14:24
0
исправлено
0-6,9
НД
ПУСТО
0
6,
9
исправлено
0-87
н
нд
05.03.2002
0
8
7
исправлено
да
0-636
1107
2755
нд
(пусто)
0
исправлено
да
0-276
нд
08.01.1900
(пусто)
0
2
7
6
1. как
интерпретиро
вать ОТР?
2. ПУСТО =
НД?
исправлено
да
0-25,7
нд
отр
(пусто)
0
2
5,
7
Вход
1. ПУСТО =
НД?
2. 140 максимум?
0-140
НД
ПУСТО
0
1
4
0
Вход
1. 3272 максимум,
исправлено
да
0- нет
данных,анали
з не
проводился
да
0- нет
0-3272
НД
0
3
2
0
0
6
5
3
2
0
8
1
0
91
парвильно?
б/х1:АСАТ
Числов
ой
Вход
1. 2015 максимум,
парвильно?
б/х1:мочев
ина
Числов
ой
Вход
1. 51 максиум?
б/х1:креат
инин
Числов
ой
Вход
б/х2:билир
убин
Числов
ой
Вход
б/х2:глюко
за
Числов
ой
Вход
б/х2:белок
Числов
ой
Вход
б/х2:АЛАТ
Числов
ой
Вход
б/х2:АСАТ
Числов
ой
Вход
б/х2:мочев
ина
Числов
ой
Вход
1. 0 - это
нормальное
значение?
2. 1146 максиум,
правильно?
1. 0 - это
нормальное
значение?
2. 164 максиум,
правильно?
3. ПУСТО =
НД?
1. НН опечатка?
2. 17 максимум?
1. 109 максиум,
правильно?
2. ПУСТО =
НД?
1. н опечатка?
2. 1610 максимум?
1. как
интрепретиро
вать
более2000 =
2000?
2. н опечатка?
3. 2000 - это
максимум?
1. 52 - это
максимум?
данных,анали
з не
проводился
да
0- нет
данных,анали
з не
проводился
да
0- нет
данных,анали
з не
проводился
0 - значит нет
данных,
анализ не
проводился
7
2
0-2015
НД
0
2
1
0
5
0-51
нд
0
5
1
0
28-1146
НД
0
1
1
4
6
0- нет
данных,анали
з не
проводился
да
да
0-164
НД
ПУСТО
0
1
6
4
да
0-17
НД
НН
0
1
7
да
0-109
НД
ПУСТО
0
1
0
9
да
0-1610
н
нд
0
1) да
2) да
3) да
0-474
более2000
н
нд
(пусто)
0
1
6
1
0
2
0
0
0
1) да
0-52
нд
0
5
2
92
б/х2:креат
инин
Числов
ой
Вход
ТЛТ: 0- не
проведена,
1проведена
Логиче
ский
Вход
0
1
нд
ТЛТ:
препарат
Строко
вый
Не исп
ТЛТэффект: 0нет, 1- есть
Логиче
ский
Вход
Парент
АК: 0-не
назначен,
1-назначен
Логиче
ский
Вход
0
урокиназа
1-пуролаза,
2стрептокин
аза
актилиза
актилизе
антилизе
гепарин
метализе
метилизе
нд
пуролаза
стептокина
за
стрептаза
стрептилиз
е
стрептокин
аза
стрептокин
аза
урокиназа
0
1
1-1, 2-0
инфузия
прекращен
а по
причине
коллавса
на
введение
нд
(пусто)
0
1
11
гепарин
нд
1. 1524 максимум?
1. Как
интерпретиро
вать:
1-1, 2-0
инфузия
прекращена
по причине
коллавса на
введение
?
2. ПУСТО =
НД
1. Как понять:
11
гепарин
?
1) да
1) исправлено
эффекта нет
да
исправлено
0-1524
нд
0
1
5
2
4
93
Парент
АК:
препарат
Строко
вый
Не исп
ОАК: 0-не
назначен,
1назначен
Логиче
ский
Вход
ОАК:
препарат:
1варфарин,
2ривароксаб
ан, 3дабигатран
. 4-
Набор
не
упоряд
очен
Вход
0
1
\гепарин
арикстра
арикстра
клексан
гемапаксан
гепарин
гепарин
гепарин
арикстра
гепарин
клексан
гепарин,
клексан
гепарин,
клексан,ар
икстра
(фондапари
нкус)
гепарин,ар
икстра
гепарин,кл
ексан
детралекс
клексан
клексан,
гепарин
клексан,геп
арин
нд
фраксипар
ин
эноксапари
н натрия
эноксипари
н натрия
(пусто)
0
1
нд
1. Что значит
0?
не назначался
0
1
2
4
нд
94
фенилин
ОАК:
рекоменд
длительнос
ть в
эпикризе,
мес
1. Как
понимать это
параметр: это
длительность
приема,
частота или
еще как?
длительность
приема, все
лишнее
нужно убрать
0
3
6
12
1 мес
1 раз в
неделю
2,5 мес
24 мес
3 месяца
6 месяцев
нд
не менее 3
мес
не менее 6
мес
не
назначен
не показан
не рек-н
отменен кр-е
пожизненн
о
постоянно
при норм.
печеноч.по
к-й
назначить
противопок
азан:
о.расслоен
ие аорты
рек-н
ривароксаб
ан длит-но
смерть
смерть
пациента
смерть
пациентки
(пусто)
95
Кавафильтр: 0не
имплант,
1-имплант
Логиче
ский
Вход
Эмболэкто
мия: 0-не
вып, 1выполнена
Логиче
ский
Вход
Эмболэкто
мия:
результат
Эласт
Логиче
трикотаж:
ский
0-не
рекоменд,
1рекоменд
Эласт
трикотаж:
рекоменд
длительнос
ть
1. Этот Кава
параметр както связан с
Кава
параметрами
выше?
2. н0 = НД?
1) это имеется
в виду ранее,
в анамнезе
а выше - эт о
на данный
момент, в эту
госпитализац
ию
0
1
н0
нд
0
1
нд
1. Как
интерпретиро
вать
значения?
0 - нет
результата,
положительн
ый
Вход
0
н
нд
положител
ьный
(пусто)
0
1
нд
1. Как влияет
данный
параметр на
риск?
2. Как
интерпретиро
вать
результаты?
чем меньше
дительность,
тем больше
риск.
в годах
0
1
6
1год
3 года
нд
постоянно
постоянное
(пусто)
96
Отзывы:
Авторизуйтесь, чтобы оставить отзывБлагодаря предсказательной способности нейронной сети и нахождению новых неучтенных параметров можно классифицировать важность тех или иных полей. Опрос и последующая тренировка покажет наличие не только неучтенных важных параметров, ранее не применявшихся в задачах постановки диагноза и назначения лечения больным ТЭЛА. Но и в отсутствие у некоторых параметров верного прогноза для характерного типа заболевания.
На чем основывается вывод о том, что можно создать новую прогностическую шкалу для оценки клинической вероятности ТЭЛА?