САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
КАФЕДРА МАТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ ЭНЕРГЕТИЧЕСКИХ СИСТЕМ
Краснощекова Анастасия Константиновна
Выпускная квалификационная работа бакалавра
Математическое и информационное обеспечение
конкурсных процедур
Направление 010400
Прикладная математика, фундаментальная информатика и программирование
Научный руководитель,
кандидат физ.-мат. наук,
доцент
Свиркин М.В.
Санкт-Петербург
2016
Содержание
Введение......................................................................................................... 4
Постановка задачи ........................................................................................ 6
Обзор литературы ......................................................................................... 7
Глава 1. Описание проведения конкурсной процедуры ........................... 9
1.1 Особенности тендера .......................................................................... 9
1.1.1 Различия между конкурсом и тендером .................................... 9
1.1.2 Виды тендеров ............................................................................ 10
1.2 Типы заказов ...................................................................................... 12
1.3 Компании-подрядчики ..................................................................... 13
1.4 Проведение конкурсной процедуры ............................................... 14
Глава
2.
Методология
прогнозирования
результата
конкурсной
процедуры .............................................................................................................. 17
2.1 Подходы и методы для обработки данных..................................... 18
2.1.1 Таблицы сопряжённости ........................................................... 18
2.1.2 Проверка гипотезы о независимости факторов при помощи
критерия χ2 ..................................................................................................... 19
2.1.3 Логит анализ ............................................................................... 20
2.2 Влияние значимых факторов и информативности выборки на
результат............................................................................................................. 23
2.3 Описание наиболее влияющих параметров на модель проведения
конкурсной процедуры ..................................................................................... 23
Глава 3. Использование математического подхода на реальных данных
................................................................................................................................. 26
3.1 Случай включения в регрессию всех переменных ........................ 26
2
3.2 Случай выделения наиболее значимых факторов ......................... 27
3.3 Случай выделения наиболее значимой части выборки ................ 29
3.4 Построение регрессии на основе информационно-логической
модели ................................................................................................................ 30
Выводы ......................................................................................................... 31
Заключение .................................................................................................. 32
Список литературы ..................................................................................... 33
3
Введение
В связи с активным исследованием сложных систем и бизнеспроцессов всё чаще возникает проблема в получении оптимального решения
некоторой задачи. В маркетинговых исследованиях наиболее важной
является проблема принятия решения о дальнейшем построении плана
развития организации.
Существуют
неформальные
(эвристические),
коллективные
и
количественные методы принятия решений [1]. В основе последних лежит
научно-практический
решения
путём
подход,
обработки
предполагающий
информации.
В
выбор
оптимального
зависимости
от
типа
математической функции, положенной в основу модели, различают:
• линейное программирование;
• динамическое программирование;
• вероятностные и статистические модели;
• теорию игр;
• имитационные модели.
Имеется множество моделей принятия решений с использованием
теории игр или вероятностно-статистического подхода в социальной и
экономической сферах [2], [3], [4]. Также существуют решения задач о
выборе оптимальной стратегии при определённых условиях конкурса.
Аналогично существуют стратегии выбора победителя [5] и выбора способа
проведения тендера в зависимости от внешних условий [6], [7].
В настоящей работе изучается вопрос прогнозирования результата
конкурса для одной из компаний, претендующих на выигрыш в тендере на
строительство объекта, необходимого некой организации, объявившей
конкурс. На основе полученного прогноза делается выбор, участвовать в
данном тендере, или стоит отказаться от затрат на проектирование в случае,
если тендер с большой вероятностью будет проигран данной организацией.
4
Поскольку
процесс
проведения
тендера
довольно
длительный,
возникает множество затрат на организацию переговоров, составление
расчётов перед получением окончательного результата. Данная работа
является актуальной и в случае, когда есть несколько альтернатив для
участия в конкурсе, но организации лучше выбрать одну или несколько из
них, оптимальным образом распределив свои затраты.
Для
анализа
данных
используются
методы
вероятностно-
статистического моделирования, а для задачи прогнозирования результата
тендера – логит и пробит модели [8], [9]. Они применяются в маркетинговых
исследованиях, разница между ними заключается в виде распределения, что
лежит в основе модели. Логистическая регрессия опирается на логистическое
распределение влияющих факторов, пробит модель – на нормальное. Оба
метода, в основном, используются в моделях бинарного выбора. В данной
работе результатом построения регрессии является прогноз, на основе
которого принимается решение об участии в тендере.
5
Постановка задачи
В данной работе рассматривается задача принятия решений об участии
в конкурсной процедуре на примере некоторой строительной организации.
Выделено несколько параметров, некоторые из них бинарные,
другие в
дальнейшем будут переведены в категориальные. Информация может быть
проинтерпретирована как субъективная оценка компании с точки зрения
заказчика. Основные решаемые задачи в настоящей работе:
• анализ и формализация процедуры участия в конкурсной
процедуре;
• выделение наиболее значимых на результат тендера сущностей и
факторов, и на основе полученной информации – создание
информационно-логической
модели
участия
в
конкурсной
процедуре;
• выбор и обоснование математических методов для обработки и
прогнозирования результата тендера;
• проведение анализа принятия решения об участии в тендере;
• анализ применимости математического аппарата на имеющихся
данных.
6
Обзор литературы
Аукционы, как форма торговли произведениями искусства, появились
ещё в древние времена. В 18-м веке данный вид торгов стал популярен, что в
дальнейшем сформировало научный интерес к изучению системы торгов.
Первые научные статьи были написаны в 1961-м году, Уильямом Викри,
который предложил один алгоритм проведения однораундового закрытого
аукциона [10]. После этого начался прорыв в изучении как самих аукционов,
так и различных стратегий для выигрыша или проведения торгов, не только в
разделе теории игр.
Написано большое количество статей, рассматривающие правила
выбора стратегии проведения торговых аукционов и тендеров (победителя в
торговых аукционах и тендерах) в зависимости от обстоятельств и
имеющейся информации [4], [5], [7], [11].
На данный момент существует множество видов аукционов, в том
числе набирают популярность тендеры на строительство – один из видов
выдачи заказа на выполнение услуг или работ. Есть множество статей,
описывающих оптимальные стратегии для потенциальных покупателей
(подрядчиков), или игроков [6] при различных типах продаж.
В данной работе под оптимальностью стратегии или решения
понимается минимизация расходов лица, принимающего решения –
организации, которая решает вопрос об участии в конкурсе. Как правило,
такими вопросами в организациях занимается отдел маркетинга. Одной из
важнейших задач этого отдела является будущее планирование рынка [12].
Маркетинговые исследования включают в себя сбор, обработку и
анализ информации с целью изучения текущих проблем и принятия
необходимых решений [12]. В ходе проведения исследования создаётся
информационно-аналитическая база, на основе которой разрабатываются
рекомендации, и принимается решение о дальнейших действиях.
7
Зачастую в решении задач такого типа используются вероятностностатистические методы. К таким можно отнести анализ трендов, факторный
анализ, регрессионный, корреляционный, кластерный, дискриминантный
анализ и другие [13]. Но наиболее часто в маркетинге используется
корреляционно-регрессионный анализ, поскольку он позволяет выявить
степени влияния различных факторов на результирующий показатель.
Для моделирования процесса в маркетинговых исследованиях наиболее
популярным математическим методом является аппроксимация исходных
данных
с
использованием
регрессии,
или
с
использованием
иных
зависимостей, таких как гиперболическая, показательная, логистическая и др.
Но в некоторых ситуациях более целесообразно использовать интерполяцию
данных произвольными степенными или ортогональными полиномами [14].
8
Глава 1. Описание проведения конкурсной
процедуры
В данном разделе даётся определение конкурсной процедуры как
таковой, её формальные различия с тендером для общего понимания
процедуры проведения конкурса. В дальнейшем оба понятия будут
использоваться как одно понятие. Рассматриваются существующие виды
конкурсов, а также типы заказов, общая информация о подрядчиках, на
основе чего строится информационно-логическая модель в главе 2.
1.1 Особенности тендера
Термин тендер произошел от английского слова «tender», что
переводится как «предложение». По факту, тендер является методикой
выдачи заказа на предоставление товаров и услуг, а также выполнение какихлибо работ. В российском законодательстве не существует такого термина,
поэтому даже производные от этого слова не используются при оформлении
каких-либо официальных документов. Во всех правовых актах используется
слово «конкурс», и, несмотря на то, что в России принято использовать сразу
оба понятия, у них есть вполне конкретные различия.
1.1.1 Различия между конкурсом и тендером
Главное отличие тендера от конкурса – оно не регламентировано
российским законодательством. Федеральный закон №94-ФЗ определяет
понятие конкурса и порядок его проведения. В связи с этим можно выделить
несколько различий между этими понятиями [15], зафиксированных в
таблице 1.
9
Конкурс
Тендер
Цель организации Соблюдение всех
Максимальная экономия
регламентов и норм
денежных средств
Права
Определённым образом
Никаких обязанностей
поставщиков
защищены при участии
перед поставщиками
Результат
Заключение договора
По усмотрению тендерной
проведения
комиссии
Изменение заявок После вскрытия изменены Организаторы тендера
быть не могут
могут пытаться снизить
цену до минимальной
Победитель
Обязательно становится
Становится известен только
известен
по воле тендерного
комитета
Срок оглашения
Известен заранее
результата
Может быть любым и
изменяться в процессе
Таблица 1. Различия тендера и конкурса
Таким образом, конкурс в основном устраивается государственными и
муниципальными структурами, в то время как коммерческие организации
предпочитают тендер, поскольку это более выгодный вариант проведения
состязания. Однако зачастую употребляются оба термина в одном значении,
как это и будет использовано далее.
1.1.2 Виды тендеров
Согласно российскому законодательству, существует несколько видов
конкурсов
(тендеров),
далее
будут
рассматриваться
следующие
классификации [5]:
1) Общая классификация:
a. Тендеры «цены» – организатор определяет, какие работы
требуется выполнить, а подрядчики предлагают виды работ,
10
сроки выполнения, дополнительные услуги и цену;
b. Тендеры
«открытых
решений»
заказчик
–
только
приблизительно представляет, какие виды работ и услуг
требуются для достижения желаемого результата;
2) Классификация по степени открытости:
a. Открытые
тендеры
–
к
участию
допускаются
любые
организации, количество участников не ограничено;
b. Закрытые тендеры – участвуют только заранее приглашённые
организаторами компании;
c. Конкурсы с ограниченным участием – круг участников не
определён, но ограничен определёнными условиями;
3) Классификация по платности:
a. Бесплатные конкурсы – к участию допускаются любые
организации;
b. Конкурсы с платным участием – допускаются только те
организации, которые оплатили первоначальный взнос;
4) По допустимости изменения конкурсных требований во время
проведения конкурса
a. Одноэтапные конкурсы – запрещены какие-либо переговоры
между организатором и участниками;
b. Двухэтапные
конкурсы
–
на
первом
этапе
конкурса
проводятся переговоры по технической части предложений
подрядчиков с целью выгодно изменить условия.
Специально подготовленная конкурсная документация в любом случае
должна содержать:
• Данные об организаторе конкурса и его участниках;
• Необходимый товар (услуга), предоставляемый победителем;
• Сроки поставки товара (услуги);
• Сумма, которую обязуется выплатить заказчик.
11
Рассмотрим основные виды проведения конкурсов немного подробнее.
Если предметом тендера является поставка технически сложных услуг
или товаров, тендер объявляется закрытым. Также это происходит в случаях,
если количество поставщиков товара или услуги ограничено и когда закупки
в той или иной степени связаны с государственными тайнами, которые
охраняются законодательством. В случае проведения закрытого тендера
претенденты
могут
получить
индивидуальное
приглашение
от
потенциального заказчика, в то время как проведение открытого конкурса
предполагает возможность приглашения неограниченного круга лиц.
Специализированный конкурс (или конкурс с ограниченным участием)
подразумевает собой предварительный квалификационный отбор. В нём
подрядчики, претендующие на участие в тендере, должны пройти
аккредитацию и иметь соответствующие сертификаты.
Двухэтапные
конкурсы
проводятся
при
потребности
закупки
продукции или выполнения каких-либо работ высокого уровня сложности. В
этом случае заказчик, как правило, не может заранее сформулировать чёткие
требования к тендеру, поэтому намерен лично пообщаться с каждым из
претендентов и после этого скорректировать условия.
1.2 Типы заказов
Заказом, или предметом контракта, в данной работе могут являться
услуги
строительства
или
проектирования
различных
объектов.
Классификацию объектов можно проводить по разным признакам, например,
по стоимости или масштабу строительства, однако, в данной работе наиболее
актуальной является классификация по назначению. У каждого объекта есть
свои особенности в конструкции, которые непременно должны быть учтены.
Для
заводов
различной,
в
том
числе
химической
и
горной
промышленности, к примеру, необходимо соблюдение норм пожарной
безопасности, то есть аппараты должны быть расположены внутри так, чтобы
12
в случае пожара или выхода одного из аппаратов из строя можно было легко
выбраться. Также регламентирована этажность, которая зависит от типа
завода. Более того, характерной чертой для заводов, например, химической
промышленности является близкое расположение раздевалок и рабочих
помещений.
Для объектов торговой недвижимости характерна малая этажность,
поскольку с увеличением этажей уменьшается количество посетителей. К
тому
же
должна
быть
особая
система
вентиляции.
Есть
многофункциональные торговые центры (такие как MEGA, Стокманн,
Северная Галерея), объёмные магазины-склады (например Metro, Ашан), а
также небольшие бутики и продуктовые магазины. Для каждого типа из
названных помещений существуют свои стандарты и нормы, которые также
различаются в зависимости от площади, функционального назначения и
проходимости помещения.
Для объектов коммерческого строительства (офисы и бизнес центры)
характерно большое количество небольших помещений. По этой причине
должно быть мало несущих стен, регламентирована высота потолков и
допустимая нагрузка на межэтажные перекрытия. Более того, должна быть
хорошая шумоизоляция, которая обеспечивает наиболее продуктивную
работу в помещениях.
Таким образом, чтобы иметь дело с подрядчиком, необходимо
убедиться в том, что является квалифицированным исполнителем для
строительства данного объекта.
1.3 Компании-подрядчики
Под компанией-подрядчиком понимается организация, которая по
договору (подряду) обязуется выполнить определённую работу, в данном
случае организовать подряд на строительство некого объекта.
Зачастую
компании-подрядчики
13
имеют
некоторую
узкую
специализацию, строят определённый класс объектов. Например, одна
организация специализируется на объектах промышленной деятельности, а
другая – на объектах коммерческого направления, таких как торговые и
бизнес центры. У каждого класса объектов свои особенности, которые
обязательно должны быть учтены.
Существуют также и компании-
генподрядчики, которые зачастую выполняют функции заказчика – то есть
сами выбирают подрядчиков на строительство конкретных объектов. По этой
причине такие организации не имеют конкретной специализации и
конкурентно способны на тендерах различных типов, а также для
строительства объектов различных классов.
Рассматриваемая
в
данной
работе
организация
является
генподрядчиком, и осуществляет специализированную услугу управления
строительством, а именно полный цикл работ, связанный с организацией
строительного процесса: от участия в разработке концепции объекта до сдачи
построенного объекта в эксплуатацию. Компания имеет обширную базу
подрядчиков в различных регионах Российской Федерации и прилежащих
странах.
1.4 Проведение конкурсной процедуры
Проведение
тендеров
на
строительство
подразумевает
собой
проведение организационного торга между заказчиком и подрядчиками.
Конкурс включает в себя несколько этапов:
1. Подготовка документации для конкурса. Заказчик объявляет о
конкурсе, обозначает срок, объём и цену, а также готовит полностью
необходимую
документацию,
в
которой
будет
развёрнутое
представление о финансовых и технических сторонах заказа.
Подрядчики соглашаются на добровольное выполнение работы в
заданных условиях. Все строительные торги сводятся к снижению
первоначальной цены, которую обозначил заказчик. В некоторых
14
тендерах желаемые затраты заранее не известны для подрядчиков.
2. Предварительный квалификационный отбор. В случае конкурса с
ограниченным участием заказчики в качестве нулевого этапа требуют
проведения аккредитации поставщиков, которая направлена на
расширение круга потенциальных партнёров и сбор информации об
организациях, желающих принять участие в проводимых конкурсах.
Это условие является необходимым для того, чтобы участие в тендере
принимали только квалифицированные исполнители [16]. Проводится
предварительный квалификационный отбор, где конкурсная комиссия
отбирает претендентов, удовлетворяющих критериям финансовой,
репутационной
и
производственной
безопасности,
на
основе
предоставляемых информационных пакетов.
3. Определение победителя и заключение договора. В ходе проведения
конкурса выбирается в качестве организации-победителя участник,
предложивший наилучшие в соответствии с условиями проведения
конкурса. После объявления результатов конкурса с победителем
заключается договор. В случае уклонения победителя от заключения
договора, победителем может быть объявлен участник, показавший
второй результат.
Кроме
регламентированных
факторов,
влияющих
на
результат
проведения конкурса, существуют и иные – субъективные. В них может
включаться, например, наличие опыта сотрудничества между заказчиком и
каким-то из подрядчиков. Если данный подрядчик уже работал на заказчика,
и обе стороны остались довольны сотрудничеством, то вероятность того, что
заказчик выберет какого-то другого подрядчика, уменьшается.
Так же к субъективным факторам можно отнести наличие связей или
даже географическое местоположение – не факт, что конкретный подрядчик
сможет обеспечить хорошее качество проводимой работы на большом
расстоянии. Такие проблемы возникают из-за необходимости доставлять
15
множество техники в другие города или регионы, что зачастую дороже, чем
нанять подрядчика, располагающегося намного ближе к предполагаемому
месту возведения объекта.
16
Глава 2. Методология прогнозирования результата
конкурсной процедуры
В данной главе будут рассмотрены математические подходы и методы,
используемые для прогнозирования результата тендера.
Проводится анализ существующих данных и выделение наиболее
значимых факторов путём проверки значимости выделенных параметров на
результат конкурса.
Строится математическая модель прогнозирования
результата, основанная на логистической функции распределения в связи её
распространённостью и преимуществами над другими способами решения
данного
типа
задач.
Создаётся
информационно-логическая
модель
прогнозирования результата.
Полученные результаты (см. главу 3) отображаются в виде таблицы 2.
Величины 𝑚𝑚00 , 𝑚𝑚11 – количество верно спрогнозированных в ходе
построения модели проигранных и выигранных тендеров, 𝑚𝑚01 , 𝑚𝑚10 –
ошибки первого и второго рода соответственно [9]. При этом выполняется
соотношение 𝑚𝑚00 + 𝑚𝑚01 + 𝑚𝑚10 + 𝑚𝑚11 = 𝑛𝑛, где 𝑛𝑛 – объём выборки. Значения
𝑐𝑐0 и 𝑐𝑐1 показывают отношение количества правильно спрогнозированных
величин к общему количеству проигранных или выигранных тендеров
соответственно,
а
𝑐𝑐
отношение
–
общего
количества
спрогнозированных результатов к объёму выборки.
Наблюденные
Результат тендера –
победа
Спрогнозированные величины
Результат
победа
тендера
0
1
0
m00
m01
c0
1
m10
m11
c1
Общий процент
-
Процент
корректных
c
Таблица 2. Пример представления результатов.
17
верно
Точность построенной модели определяется близостью величины c к
100%. Таким образом, чем выше процент корректных, тем выше точность
прогнозирования результатов для будущих проектов.
2.1 Подходы и методы для обработки данных
Предполагается, что имеется выборка из 𝑛𝑛 элементов и 𝑁𝑁 факторов. В
данном разделе будет проводиться вероятностно-статистический анализ
существующих данных с целью получить наиболее точный результат
прогнозирования.
В первую очередь необходимо проверить, являются ли все выделенные
нами факторы значимыми, если нет, то некоторые из них можно просто
исключить, так как они не имеют значительного влияния на результат.
Проверку можно проводить разными способами [17], [18]. Для определения
зависимости результата от конкретного фактора используются отношения,
построенные на основе таблиц сопряжённости, а также основанный на
критерий 𝜒𝜒 2 Пирсона, использующий таблицы сопряжённости.
2.1.1 Таблицы сопряжённости
Пусть имеются 𝑁𝑁 факторов: 𝑥𝑥1 , 𝑥𝑥2 , … , 𝑥𝑥𝑁𝑁 . Для каждого из тендеров
параметр 𝑥𝑥𝑖𝑖 принимает значение 0 (отсутствие фактора) или 1 (его наличие).
Функция 𝑦𝑦𝑖𝑖 (𝑥𝑥1 , 𝑥𝑥2 , … , 𝑥𝑥𝑁𝑁 )– принимает значение 1, если тендер был выигран, и
0 – если проигран. Эта функция находится в какой-то зависимости от
фактора 𝑥𝑥𝑖𝑖 , которую мы хотим определить. А также найти вероятность
выигрыша для заданного набора 𝑥𝑥1 , 𝑥𝑥2 , … , 𝑥𝑥𝑁𝑁 .
Для каждого значения параметра 𝑥𝑥𝑖𝑖 суммируем количество тендеров,
которые были выиграны, и которые были проиграны. Результат представлен
в таблице 3.
18
Наименование критерия
0 – отсутствие фактора
1 – присутствие фактора
Всего
𝑥𝑥𝑖𝑖
Количество
проигрышей
𝑛𝑛00
𝑛𝑛10
𝑛𝑛.0
Таблица 3. Таблица сопряженности для фактора xi.
Количество
выигрышей
𝑛𝑛01
𝑛𝑛11
𝑛𝑛.1
Всего
𝑛𝑛0.
𝑛𝑛1.
𝑛𝑛
Таблица такого вида называется таблицей сопряжённости, где
величины:
𝑛𝑛 – всего тендеров, в которых компания принимала участие;
𝑛𝑛.0 – общее количество проигранных тендеров;
𝑛𝑛.1 – общее количество выигранных тендеров;
𝑛𝑛0. – общее количество тендеров, где фактор отсутствовал;
𝑛𝑛1. – общее количество тендеров, где фактор имел место.
Проверка гипотезы о независимости факторов проводится с помощью
критерия 𝜒𝜒 2 [18].
2.1.2 Проверка гипотезы о независимости факторов при помощи
критерия χ2
Критерий 𝜒𝜒 2 проверки гипотезы является основным способом
обнаружения зависимости между факторами при работе с таблицами
сопряжённостей. Этот метод является довольно универсальным, поскольку
относится к непараметрическим методам, т.е. которые не подразумевают
знание генерального распределения. Правда, данный критерий теряет свою
точность при малых значениях в ячейках таблицы.
Однако стоит помнить про жёсткие условия его использования. Перед
тем, как рассчитывать значение 𝜒𝜒 2 , необходимо обратить внимание на
некоторые особенности при работе с таблицами сопряжённостей 2х2.
Корректность проведения теста 𝜒𝜒 2 определяется тремя условиями:
1) случайный выбор наблюдений;
19
2) ожидаемые частоты 𝑛𝑛𝑖𝑖𝑖𝑖 <5 должны встречаться не более чем в 20%
полей таблицы (в таблице 2х2 не должно быть значений меньше
пяти);
3) суммы по столбцам и строкам всегда должны быть больше 0.
В основе хи-квадрат критерия лежит отклонение наблюдаемых частот
(О), от ожидаемых или теоретических, идеальных частот (И). Это и является
стандартной статистикой 𝜒𝜒 2 , имеющей следующий вид:
(О − И ) 2
χ (идеал) =
∑
,
И
по всем ячейкам
2
где под идеально независимыми частотами понимается вполне определённое
соотношение, представленное в таблице 4.
Наименование критерия
0 – отсутствие фактора
1 – присутствие фактора
Всего
𝑥𝑥𝑖𝑖
Количество
проигрышей
𝑛𝑛/4
𝑛𝑛/4
𝑛𝑛/2
Количество
выигрышей
𝑛𝑛/4
𝑛𝑛/4
𝑛𝑛/2
Таблица 4. Схема идеально независимой таблицы сопряжённостей
Всего
𝑛𝑛/2
𝑛𝑛/2
𝑛𝑛
Таким образом, сравнивая значение «идеального» значения критерия
𝜒𝜒 2 , с известным значением критерия Пирсона на заданном уровне
значимости, мы можем принять или отклонить гипотезу о независимости
факторов.
2.1.3 Логит анализ
Логит
исследований,
и
пробит
когда
анализ
нужно
распространены
посчитать
для
вероятность
маркетинговых
события
для
определённых значений факторов [9], [19]. Различие точности данных
моделей невелико, однако, логит модель имеет наиболее простой вид,
поэтому далее будет рассматриваться именно функция логистического
распределения, которая имеет вид
20
𝐹𝐹(𝑧𝑧) =
где
1
1 + 𝑒𝑒 −𝑧𝑧
(1)
𝑧𝑧 = 𝑏𝑏0 + 𝑏𝑏1 𝑥𝑥1 + ⋯ + 𝑏𝑏𝑁𝑁 𝑥𝑥𝑁𝑁
– уравнение логистической регрессии, а 𝐹𝐹 (𝑧𝑧) задаёт вероятность выигрыша в
конкурсной процедуре при определённых параметрах 𝑏𝑏0 , … , 𝑏𝑏𝑁𝑁 и значениях
факторов 𝑥𝑥0 , … , 𝑥𝑥𝑁𝑁 .
Аналитическая оценка параметров производится при помощи метода
максимального правдоподобия (ММП) [9]. В этом случае наблюдения
𝑦𝑦1 , … , 𝑦𝑦𝑛𝑛 , которые принимают значения 0 или 1, из существующей статистики
полагаются независимыми. Запишем параметры 𝑏𝑏0 , … , 𝑏𝑏𝑁𝑁 в виде вектора 𝑏𝑏,
тогда логарифмическая функция правдоподобия имеет вид
𝑛𝑛
ln 𝐿𝐿(𝑦𝑦1 , … , 𝑦𝑦𝑛𝑛 ) = �(𝑦𝑦𝑖𝑖 ln 𝐹𝐹 (𝑏𝑏 𝑇𝑇 𝑥𝑥𝑖𝑖 ) + (1 − 𝑦𝑦𝑖𝑖 )ln(1 − 𝐹𝐹 (𝑏𝑏 𝑇𝑇 𝑥𝑥𝑖𝑖 ))).
(2)
𝑖𝑖=1
После дифференцирования функции (2) по вектору 𝑏𝑏 и проведения
упрощения выражения при помощи тождества
𝐹𝐹 ′ (𝑧𝑧) = 𝐹𝐹 (𝑧𝑧)�1 − 𝐹𝐹 (𝑧𝑧)�
получим
𝑛𝑛
�(𝑦𝑦𝑖𝑖 − 𝐹𝐹 (𝑏𝑏 𝑇𝑇 𝑥𝑥𝑖𝑖 ))𝑥𝑥𝑖𝑖 = 0.
(3)
𝑖𝑖=1
Далее из (3) получается оценка 𝑏𝑏� параметров 𝑏𝑏. Однако уравнение
правдоподобия
является
лишь
необходимым
условием
локального
экстремума. По этой причине чтобы убедиться в том, что 𝑏𝑏� действительно
является оценкой максимального правдоподобия, следует показать, что (2)
является вогнутой по 𝑏𝑏 функцией. Для этого рассматривается гессиан
𝑛𝑛
𝜕𝜕 2 ln 𝐿𝐿
𝐻𝐻 =
= − �(𝐹𝐹 (𝑏𝑏 𝑇𝑇 𝑥𝑥𝑖𝑖 )(1 − 𝐹𝐹 (𝑏𝑏 𝑇𝑇 𝑥𝑥𝑖𝑖 )) 𝑥𝑥𝑖𝑖 𝑥𝑥𝑖𝑖 𝑇𝑇 ;
𝜕𝜕𝜕𝜕𝜕𝜕𝑏𝑏 𝑇𝑇
𝑖𝑖=1
который в этом случае оказывается отрицательно определён, т. е. (2) вогнута
21
по 𝑏𝑏, таким образом, 𝑏𝑏� является оценкой максимального правдоподобия.
Однако зачастую аналитическое оценивание параметров вызывает
затруднения, по этой причине прибегают к численным методам оценивания
параметров [9].
Общая схема имеет следующий вид:
Шаг 1. Выбираем начальную точку 𝑏𝑏 (0)
Шаг 2. Переходим в точку 𝑏𝑏 (1) по правилу
…
Шаг t.
𝑏𝑏 (1) = 𝑏𝑏 (0) + 𝜇𝜇0 ;
𝑏𝑏 (𝑡𝑡+1) = 𝑏𝑏 (𝑡𝑡) + 𝜇𝜇𝑡𝑡 .
Итерационный процесс заканчивается при выполнении определённого
условия остановки.
Обычно 𝜇𝜇𝑡𝑡 выбирают в виде 𝜇𝜇𝑡𝑡 = 𝐷𝐷𝑡𝑡 𝜕𝜕 ln 𝐿𝐿⁄𝜕𝜕 𝑏𝑏 𝑇𝑇 , где 𝐷𝐷𝑡𝑡 – матрица
«длин» шага, а 𝜕𝜕 ln 𝐿𝐿⁄𝜕𝜕 𝑏𝑏 𝑇𝑇 задаёт направление «спуска». Такая процедура
определяет точку 𝑏𝑏�. Способов выбора вектора 𝜇𝜇𝑡𝑡 , или матрицы 𝐷𝐷𝑡𝑡 , несколько:
• метод градиентного спуска;
• метод Ньютона;
• метод scoring;
• метод BHHH.
Каждый из этих методов имеет свои преимущества и свои недостатки.
Но
последний
из
них
имеет
широкое
распространение
среди
эконометрических задач.
Таким образом, оценки параметров модели, найденные ММП,
асимптотически подчиняются нормальному распределению
𝑏𝑏�~𝑁𝑁 �𝑏𝑏, 𝑉𝑉�𝑏𝑏���,
где 𝑉𝑉�𝑏𝑏�� – ковариационная матрица вектора 𝑏𝑏�, которую также можно
численно оценить несколькими методами [9].
22
2.2 Влияние значимых факторов и информативности
выборки на результат
При небольшом объёме выборки, допустим, до 20 наблюдений можно
столкнуться с проблемой, что факторов для предсказания результатов
слишком много в сравнении с достаточным.
Чтобы
разрешить
данную
проблему,
необходимо
создать
информационно-логическую модель, при помощи которой выбрать наиболее
значимые факторы вообще, а не из имеющихся в первоначальной статистике,
что и будет сделано далее.
Также для улучшения точности модели следует брать часть выборки,
которая соответствует какому-либо значению факторов. Например, если
компания занимается строительством различных коммерческих объектов, в
том числе заводов, бизнес-центров, автосервисов, то для прогнозирования
результата тендера на строительство завода необходимо рассматривать уже
имеющиеся результаты, связанные с тендерами на строительство заводов,
поскольку у объектов данного типа совершенно отличные от бизнес-центров
особенности. Такая выборка будет более информативна, и по этой причине
не стоит рассматривать выборку по всем различным объектам.
2.3 Описание наиболее влияющих параметров на модель
проведения конкурсной процедуры
Прежде чем проводить имитационное моделирование проведения
конкурсной процедуры, необходимо выявить сущности, которые при
взаимодействии друг с другом показывают наилучшие результаты.
То, из чего возникает задача – это потребность в построении какого-то
объекта, будь то завод или жилой дом. У объекта есть заказчик, который
размещает конкурс, и на участие претендуют потенциальные исполнители. У
каждой из сущностей есть свои свойства, некоторые из них отображены на
23
таблице 5.
Заказчик
Объект
• географическое
• тип (завод, складское • наличие
местоположение
помещение,
• желаемые услуги
центр и т.д.)
• желаемый
Исполнитель
бизнес-
оборудования
рабочей
уровень • использование
затрат
специализированного
силы
и
для
специализированного
возведения
оборудования
различных объектов
возведения
для
объекта • предполагаемые
(да/нет)
затраты
• примерная
• географическое
себестоимость
местоположение
• примерные сроки
Таблица 5. Свойства сущностей
Взаимодействие между сущностями появляется из-за отношений
между свойствами, поэтому далее приведены некоторые примеры связей
между основными сущностями.
Взаимоотношение заказчик-исполнитель:
• было ли сотрудничество ранее;
• дальность географического местоположения (таким образом
доступность к сотрудничеству);
• соотношение ожидаемых и предполагаемых затрат.
Исполнитель-объект:
• опыт работы с объектами данного типа;
• дальность местоположений;
• наличие специализированного оборудования и рабочей силы.
Заказчик-объект:
• соотношение себестоимости и желаемых затрат;
24
• дальность местоположений.
Данные
свойства
и
взаимоотношения
между
сущностями
предполагаются наиболее основными, по этой причине далее в работе будет
рассмотрен пример результата прогнозирования конкурсной процедуры, в
которой факторы удовлетворяют данным связям.
25
Глава 3. Использование математического подхода
на реальных данных
В
данной
главе
будет
приведены
результаты
использования
регрессионной модели для имеющихся данных. Данные представляют собой
совокупность наблюдений 𝑦𝑦0 , … , 𝑦𝑦𝑛𝑛 , 𝑦𝑦𝑖𝑖 𝜖𝜖{0,1}, каждое из которых зависит от
N бинарных факторов. Использование методологии будет осуществляться
для всех факторов, для наиболее значимых факторов, а также с
использованием более информативной выборки.
О тендерах также имеется дополнительная информация, позволяющая
реструктурировать исходные данные на основе информационно-логической
модели, для данного случая также будет представлено использование метода.
В целях конфиденциальности начальные данные будут переименованы.
3.1 Случай включения в регрессию всех переменных
Имеется 49 наблюдений результатов тендеров по 11 факторам. Для
оценивания точности модели используется прикладной статистический пакет
SPSS Statistics 17.0. При построении уравнения логистической регрессии
программа проводит проверку на необходимость постепенного включения
конкретных переменных при помощи частного F-теста [20]. На таблице 6
показан фрагмент исходных данных.
Характеристика/
Название компании
Название компании 1
Название компании 2
Название компании 3
Название компании 4
…
Результат
тендера - победа
Инициатор
контакта - клиент
...
1
1
0
0
…
1
0
1
0
…
...
…
…
...
…
Таблица 6. Пример заполнения данных
Для начала рассмотрим зависимость вероятности выигрыша в тендере
26
от
всех
факторов.
Используя
встроенную
функцию
построения
логистической регрессии, получим результаты, отображённые на таблице 7.
Наблюденные
Спрогнозированные величины
Результат тендера –
победа
Результат
победа
тендера
0
1
0
22
5
81,5
1
7
15
68,2
Общий процент
-
Процент
корректных
75,5
Таблица 7. Таблица верно и неверно предсказанных событий
Точность построенной модели составляет 75,5%, что является
неплохим результатом, однако, его стоит улучшить. Уравнение регрессии для
данного примера имеет вид
z =−7,6 + 0,939𝑥𝑥1 + 2,272𝑥𝑥2 + 0,394𝑥𝑥3 + 1,22𝑥𝑥4 + 3,429𝑥𝑥5 + 0,559𝑥𝑥6 +
0,365𝑥𝑥7 + 0,377𝑥𝑥8 + 3,393𝑥𝑥9 + 1,242𝑥𝑥10 − 0,412𝑥𝑥11 .
При подстановке значений факторов в данное уравнение можно
получить результат прогнозирования. Например, для одного из проектов
𝑧𝑧 = 2,299, тогда по формуле (1) 𝑝𝑝 = 0,91, что при пороговом значении
𝑝𝑝 = 0,5 прогнозируется как выигрышный тендер.
3.2 Случай выделения наиболее значимых факторов
Далее будет рассмотрен вопрос, насколько изменится точность модели
при выделении наиболее значимых факторов с использованием критерия 𝜒𝜒 2 -
Пирсона.
Для удобства результаты нахождения критерия хи-квадрат по каждому
фактору записаны в таблице 8. Чем больше значение критерия, тем меньше
зависимы между собой соответствующий фактор и конечный результат.
Необходимо
выбрать
те
факторы,
от
которых
наиболее
зависит
результирующий показатель. На уровне значимости 𝛼𝛼 < 0,05 гипотеза о
27
значимости фактора принимается только на нескольких минимальных
значениях, из всех отображённых на таблице 8 [18]. Наиболее значимые
факторы выделены цветом.
Наименование
фактора
хи-квадрат
Пирсона
(ас.
значимость)
x1
0,199
x2
0,007
x3
0,492
x4
0,163
x5
0,013
x6
0,445
x7
0,297
x8
0,002
x9
0,034
x10
0,407
x11
0,589
Таблица 8. Выделение наиболее значимых факторов критерием χ2-Пирсона.
Получив 4 наиболее значимых фактора, теперь можем построить
новую
логистическую
регрессию.
Единственное
отличие,
теперь
к
предикторам относим только обозначенные выше факторы. Рассмотрим
полученные результаты (см. табл. 9).
Наблюденные
Результат тендера –
победа
Спрогнозированные величины
Результат
победа
тендера
0
1
0
19
8
70,4
1
3
19
86,3
Общий процент
-
Процент
корректных
77,6
Таблица 9. Результат построения регрессии для 4-х наиболее значимых факторов.
28
В
данной
ситуации
выделение
наиболее
значимых
факторов
незначительно изменило общую точность модели. Уравнение регрессии
z =−4,223 + 1,676𝑥𝑥2 + 2,89𝑥𝑥5 + 1,147𝑥𝑥8 + 2,308𝑥𝑥9 .
Следует отметить, что уменьшение количества факторов значительно
уменьшает время на численное оценивание параметров регрессионной
модели. Однако на основе полученных результатов, можем выявить, что
существующие в исходных данных факторы не в полной мере описывают
систему, данных недостаточно для того, чтобы предсказать с достаточной
точностью результат. Следовательно, необходимо искать другое описание,
которое удовлетворит эту потребность.
3.3 Случай выделения наиболее значимой части выборки
В данном примере будет рассмотрен результат построения регрессии
для более узкого класса объектов – для промышленных объектов. Отличие
данного
примера
от
предыдущих
заключается
в
том,
что
здесь
рассматривается более информативная выборка: до этого рассматривались
различные классы объектов в совокупности – что может затруднять точность
предсказания модели. Результат построения регрессии показан в таблице 10.
Наблюденные
Результат тендера –
победа
Спрогнозированные величины
Результат
победа
тендера
0
1
0
13
1
92,9
1
1
9
90
Общий процент
-
Процент
корректных
91,7
Таблица 10. Результат построения регрессии для узкого класса объектов.
В данном примере выборка состоит всего из 24 элементов, но можно
заметить, что результат значительно улучшается при рассмотрении более
узкого класса объектов – в данном примере точность достигает 91,7%.
29
Уравнение регрессии будет иметь вид
z =−54,726 + 0,539𝑥𝑥1 + 20,615𝑥𝑥2 + 1,576𝑥𝑥3 − 28,129𝑥𝑥4 + 36,41𝑥𝑥5 +
23,017𝑥𝑥6 + 1,228𝑥𝑥7 + 18,989𝑥𝑥8 + 41,288𝑥𝑥9 + 58,312𝑥𝑥10 + 1,823𝑥𝑥11 .
3.4 Построение регрессии на основе информационнологической модели
На основе информационно-логической модели, а именно основных
сущностей и связями между ними, в исходных условиях были выделены
следующие факторы:
•
•
•
•
•
•
•
�����
5;
Направление строительства, 𝑥𝑥1 𝜖𝜖1,
������
Тип объекта, 𝑥𝑥2 𝜖𝜖1,
16;
Виды работ, 𝑥𝑥3 𝜖𝜖{0,1};
Инициатор контакта заказчик/подрядчик, 𝑥𝑥4 𝜖𝜖{0,1};
Наличие связей между заказчиком и подрядчиком, 𝑥𝑥5 𝜖𝜖{0,1};
�����
5;
Предложенная подрядчиком цена, 𝑥𝑥6 𝜖𝜖1,
�����
Дальность подрядчика от объекта (в км.), 𝑥𝑥7 𝜖𝜖1,
5.
Результаты построения регрессии отображены в таблице 11.
Наблюденные
Спрогнозированные величины
Результат тендера победа
Результат тендера
– победа
Процент
корректных
0
1
0
23
3
88,5
1
5
17
77,3
Общий процент
83,3
Таблица 11. Результат для построенной информационно-логической модели
Нетрудно заметить, что после преобразования первоначальных данных
точность прогнозирования значительно увеличилась при уменьшении
количества факторов с одиннадцати до семи.
30
Выводы
На
основе
проведённого
анализа
информации,
построения
информационно-логической модели, а также выбора математического
аппарата получены следующие результаты:
• точность построенной модели без предварительной обработки
данных (то есть для всех имеющихся наблюдений и факторов)
является
удовлетворительной
(≈75%),
однако,
не
стоит
останавливаться на полученном результате;
• выделение наиболее значимых факторов при помощи критерия
Пирсона 𝜒𝜒 2 значительно уменьшает количество переменных,
включаемых в значительную регрессию, что хорошо для
оптимизации
времени
вычисления,
однако,
незначительно
изменяет результат прогнозирования;
• использование более информативной выборки заметно изменяет
результат построения регрессионной модели – достигается
хорошая точность (≈91%);
• при
выделении
наиболее
значимых
факторов
на
основе
построенной информационно-логической модели для общей
совокупности наблюдений 𝑦𝑦0 , … , 𝑦𝑦𝑛𝑛 точность прогнозирования
также повышается.
31
Заключение
В данной работе был проведён анализ и формализация проведения
конкурсной процедуры с целью прогнозирования результата тендера для
принятия решения об участии в конкурсе, на основе имеющихся данных о
грядущем тендере.
Использована
методология
обработки
бинарных
статистических
данных с выбором основных сущностей и факторов, позволяющая построить
информационно-логическую модель проведения конкурсной процедуры.
При использовании особенностей имеющихся данных о прошедших
тендерах построена математическая модель прогнозирования результата на
основе логистической регрессии с выделением наиболее значимых факторов
для прогнозирования, а также с формированием более информативной
выборки в сравнении с исходной. Для выбранной математической модели
проведён анализ принятия решения об участии в конкурсной процедуре.
На основе вышеописанного проведена практическая реализация
полученного метода. После проведения преобразования подающихся для
построения
регрессии
данных
достигнута
точность
прогнозирования
результата до 91,7%.
Анализ проведённых исследований позволяет сделать вывод, что
данный подход к решению задачи о прогнозировании результата конкурса
позволяет получить адекватный результат, но целесообразно было бы
посмотреть изменение точности применения данной модели для большего
количества наблюдений, поскольку представленная выборка приближена к
минимальной, для которой проверка адекватности данного аппарата имеет
место.
32
Список литературы
[1]
Всё
о
менеджменте
//
poznajvse.com
URL:
(дата
http://poznajvse.com/menedgment/25-osnovi-menedgmenta
обращения: 25.04.2016).
[2]
Петросян Л. А., Зенкевич Н. А., Шевокпляс Е. В. Теория игр:
учебник. 2 изд. СПб.: БХВ-Петербург, 2012. 432 с.
[3]
Прасолов
А.
В.
Математические
методы
экономической
динамики: учебное пособие. 2 изд. СПб.: Лань, 2015. 352 с.
[4]
Буре А. В. Об одной теоретико-игровой модели тендера // Вестник
Санкт-Петербургского университета. Серия 10: Прикладная математика.
Информатика. Процессы управления. 2015. № 1. С. 25-32.
[5]
Патласов О. Ю., Самарин А. М. Алгоритмы проведения тендеров
и модель отбора участников // Омский научный вестник. 2013. № 5
(122). С. 46-52.
[6]
Klemperer P. Auction theory: a guide to the literature // Journal of
economic surveys. 1999. Vol. 13, No 3. P. 227-286.
[7]
McAfee P., McMillan J. Auctions and bidding // Journal of economic
surveus. 1999. Vol. 25. P. 699-738.
[8]
Lipovetsky S. Analytical closed-form solution for binary logit
regression by categorical predictors // Journal of applied statistics. 2014. P.
37-48.
[9]
Буре
В.
М.,
Парилина
Е.
М.
Теория
вероятностей
и
математическая статистика: учебник. СПб.: Лань. 2013. 416 с.
[10]
Vickrey W. Counterspeculation, auctions, and competitive sealed
tenders // Journal of finance. 1961. Vol. 16. Issue 1. P. 8-37.
[11]
Беленький А. С. Об одном правиле определения победителя в
33
закрытых тендерах и его математических свойствах // Экономический
журнал ВШЭ. 2009. № 1. C. 3-18.
[12]
Махнева О. В. Инструментарий для проведения маркетинговых
исследований // Научный вестник Московского государственного
технического университета гражданской авиации. 2009. № 143. C. 17-20.
[13]
Чеботарева
С.
В.
Статистико-математические
методы
маркетингового анализа // Бизнес в законе. Экономико-юридический
журнал. 2011. № 1. C. 295-297.
[14]
Гришина С. А. Метод прогнозирования в маркетинговых
исследованиях // Известия Тульского государственного университета.
Экономические и юридические науки. 2010. № 2-1. C. 293-301.
[15]
Федеральный закон от 21 июля 2005 г. № 94-ФЗ "О размещении
заказов
на
поставки
товаров,
услуг
для
государственных
и
муниципальных нужд" (ред от 02.07.2013) // Российская газета. 2005. 28
июля. №163.
[16]
Федеральный закон от 5 апреля 2013 № 44-ФЗ "О контрактной
системе в сфере закупок товаров, работ, услуг для обеспечения
государственных и муниципальных нужд" (ред. от 30.12.2015) //
Российская газета. 2013. 12 апреля. № 80.
[17]
Толстова Ю. Н., Рыжова А. В. Анализ таблиц сопряжённости:
использование отношений преобладаний и логлинейных моделей //
Социология: 4М. 2003. № 16. С. 150-164.
[18]
Бакаева О. А., Щенников В. Н. Использование критерия χ2 для
выявления связи между качественными переменными на основе
"идеальных" таблиц сопряжённости // Ярославский педагогический
вестник. 2011. № 4. С. 15-20,
[19]
Носко В. П. Эконометрика для начинающих (Дополнительные
34
главы). М.: ИЭПП. 2005. 239 с.
[20]
Куликова К. Ю. Исследование течения инфаркта миокарда у
мужчин моложе 60 лет // процессы управления и устойчивость. 2015.
Т. 1. № 1. С. 293-298.
35
Отзывы:
Авторизуйтесь, чтобы оставить отзыв