Санкт-Петербургский государственный университет
Кафедра математической теории моделирования систем
управления
Буре Артем Владимирович
Выпускная квалификационная работа аспиранта
Задачи выбора возможных значений показателей в
условиях неопределенности
Направление 010109
Дискретная математика и математическая кибернетика
Научный руководитель,
к.ф.м.н.,
доцент
Карелин В.В.
Санкт-Петербург
2016
Содержание
Введение...............................................................................................3
1. Прогнозирование момента времени появления события...............6
1.1 Линейная функция потерь............................................................6
1.2 Квадратичная функция потерь...................................................14
2. Конкурентное прогнозирование....................................................22
2.1 Теоретико-игровая модель конкурентного прогнозирования....22
2.2 Теоретико-игровая модель тендера.............................................31
2.3 Теоретико-игровая модель конкуренции двух фирм.................41
Заключение........................................................................................46
Литература.........................................................................................47
2
Введение.
Широкий круг прикладных задач связан с выбором некоторого возможного значения, какого-либо показателя, представляющего интерес в некотором конкретном прикладном исследовании. В разных прикладных исследованиях содержательный смысл
изучаемого показателя может существенно различаться. Например, речь может идти
о выборе некоторого момента времени для проведения какого-либо профилактического мероприятия или о выборе возможного значения стоимости выполнения некоторых
работ, или о выборе некоторого порогового значения, определяющего стратегию поведения фирмы на рынке. Во всех перечисленных ситуациях, а также во многих других,
действует общее для всех подобных ситуаций правило, возможное значение изучаемого показателя характеризуется довольно высоким уровнем неопределенности. Имеющуюся неопределенность удобно характеризовать заданием некоторого вероятностного
распределения, то есть другими словами, рассматривать изучаемый показатель как
некоторую случайную величину. Выбор возможного значения показателя может определяться из решения некоторой оптимизационной задачи, в которой минимизируемая
функция представляет собой, например, экономические потери, вызываемые тем или
иным выбором значения изучаемого показателя. В работе представлены две группы
задач.
В главе 1 рассматривается выбор момента времени проведения некоторого мероприятия, при этом распределение изучаемого показателя может быть несобственным, то
есть функция распределения при неограниченном возрастании аргумента может стремиться к некоторому значению q < 1. Несобственные распределения введены во втором
томе классической монографии В. Феллера [1], вероятность 1 − q допускает следующую
интерпретацию. Указанная вероятность представляет собой вероятность того, что событие (мероприятие) может вообще не произойти по тем или иным причинам.
В разделе 1.1 подробно изучена задача выбора момента времени для линейной
функции потерь для несобственного распределения изучаемого показателя, найдено
оптимальное решение, кроме того, получено минимаксное решение, необходимость в
3
котором возникает, если функция распределения не известна и нет статистической
информации, по которой можно было бы построить статистическую оценку функции
распределения. Кроме того, в этом разделе доказана теорема об оптимальном выборе
значения показателя, когда несобственное распределение представляет собой конечную
смесь известных несобственных распределений.
В разделе 1.2 изучен весь комплекс задач раздела 1.1, но вместо линейной применяется квадратичная функция потерь. В разделе 1.2 получены оптимальные решения,
аналогичные решениям из раздела 1.1.
Постановка задачи выбора момента времени проведения мероприятия для линейной
функции потерь и обычного распределения вероятностей содержится в работах [2, 3],
в работах[4, 5] дано обобщение задачи на несобственные распределения вероятностей и
получены результаты раздела 1.1 для несобственных вероятностных распределений. В
[6] рассмотрено обобщение сформулированной в предшествующих работах проблематики на случай квадратичной функции потерь, там же получены результаты раздела
1.2. Близкая в идейном плане проблематика рассматривалась в работах [7-10].
Глава 2 посвящена задачам конкурентного выбора в условиях неопределенности
для общего случая несобственных распределений, при этом все полученные результаты
остаются справедливыми и для обычных вероятностных распределений.
В разделе 2.1 изучается задача конкурентного прогнозирования для случая несобственных распределений вероятностей, вводится специальная шкала для оценки качества конкурентного прогнозирование и дается ее обоснование, рассматривается также
теоретико-игровая модель представляющая собой игру двух лиц с нулевой и ненулевой
суммами, найдены ситуации равновесия.
В разделе 2.2 сформулирована теоретико-игровая модель тендера для двух и трех
фирм для несобственных вероятностных распределений.
В рамках рассмотренных теоретико-игровых моделей найдены ситуации равновесия в чистых стратегиях. Применение несобственных распределений позволяет учесть
потенциальную возможность отмены тендера. Все результаты сохраняются и для обыч-
4
ных вероятностных распределений (когда тендер не может быть отменен).
В разделе 2.3 предложена и исследована теоретико-игровая модель конкуренции
двух фирм с несобственным распределением стоимости заказа. В рамках предложенной
модели найдена ситуация равновесия в смешанных стратегиях.
Результаты, изложенные в главе 2, были получены в работах [11 – 13]. Можно отметить близкие в идейном плане работы по конкурентному прогнозированию [14 – 16,
18, 19], однако в них не рассматривались несобственные вероятностные распределения.
Кроме того, прикладные теоретико-игровые модели с несобственными распределениями вероятностей являются новыми моделями.
5
1. Прогнозирование момента времени появления события
1.1 Линейная функция потерь
В этом разделе содержится обобщение результатов работ [2, 3] на случай несобственного распределения вероятностей моментов времени появления представляющего
интерес события. В работах [2, 3] рассматривалась задача из области агрофизики, а в
[4] были изучены похожие задачи, относящиеся к медицине. В действительности сфера
применимости результатов этого раздела включает теорию надежности, оценку финансовых рисков и многие другие приложения статистических методов. Близкие по
постановке задачи описаны в [7, 8, 9]. Надо отметить, что несобственные распределения часто встречаются в теории надежности, теории оценки финансовых рисков, при
анализе данных типа времени жизни, поэтому обобщение результатов работы [2] на
несобственные распределения является действительно актуальной задачей.
Все результаты данного раздела были получены в работах [4, 5].
Несобственное распределение момента времени. Обозначим через τ случайный момент времени наступления интересующего нас события, будем предполагать,
что функция распределения F (t) = P {τ < t} может быть несобственной [1], т. е.
lim F (t) = P {τ < ∞} = q ≤ 1.
t→∞
Следовательно, вероятность не наступления события равна 1 − q. Не наступление события будем обозначать {τ = ∞}, поэтому P {τ = ∞} = 1 − q. Функцию распределения
F (t) будем предполагать непрерывной и строго монотонной на некотором интервале
(α, β), где −∞ ≤ α < β ≤ ∞, F (α) = 0, F (β) = q.
Отметим, что функцию распределения F (t) можно построить по статистической
базе данных, построенной в результате длительных наблюдений. Предположим, что
заданы линейные штрафы в единицу времени, связанные с ошибкой в оценке момента
времени τ . В качестве оценки τ выбираем момент времени t01 ∈ [t0 , t1 ], где промежуток
времени [t0 , t1 ] задан заранее. Пусть c - штраф в единицу времени при наступлении
6
события t01 < τ , l - штраф в единицу времени при наступлении события τ < t01 . В
этом разделе будем рассматривать линейную функцию потерь.
e t 0 , t0 , t1 , F )
Линейная функция потерь. При определении функции потерь Q(τ,
1
следует учесть, что возможны следующие варианты наступления момента времени τ :
{τ ≤ t0 }, {t0 < τ ≤ t01 }, {t01 < τ ≤ t1 } {t1 < τ < ∞}, {τ = ∞}. Кроме того, будем
предполагать, что, если событие не происходит, τ = ∞, то потери отсутствуют при
любом выборе t01 . По условию задачи t01 ∈ [t0 , t1 ]. Исходя из сказанного, определим
линейную по времени функцию потерь равенством
e t0 , t0 , t1 , F ) = l(t0 − t0 )I{τ ≤ t0 } + l(t0 − τ )I{t0 < τ ≤ t0 } +
Q(τ,
1
1
1
1
+ c(τ − t01 )I{t01 < τ ≤ t1 } + c(t1 − t01 )I{t1 < τ < ∞},
где I{.} - индикатор события, содержащегося в скобках.
e t0 , t0 , t1 , F ) зависит от случайной величины τ , поэтому цеФункция потерь Q(τ,
1
лесообразно перейти к ожидаемым потерям, вычислив математическое ожидание по
распределению случайной величины τ . Тогда ожидаемые потери
e t0 , t0 , t1 , F ) = l(t0 − t0 )
Q(t01 , t0 , t1 , F ) = E Q(τ,
1
1
∫t0
dF (t) +
−∞
∫t01
∫∞
+ l (t01 − t)dF (t) + c(t1 − t01 ) dF (t) +
t0
t1
∫t1
+c
(t − t01 )dF (t) = l(t01 − t0 )F (t0 ) + c(t1 − t01 )(q − F (t1 )) +
t01
+ l(t01 −
t
t)F (t)|t001
∫t01
∫t1
F (t)dt + c(t −
+l
t01 )F (t)|tt101
t0
∫t1
F (t)dt − c
t0
F (t)dt =
t01
∫t01
= cq(t1 − t01 ) + l
−c
∫t1
F (t)dt = c
t01
t01
∫t01
(q − F (t))dt + l
F (t)dt
t0
Постановка задачи оптимального прогнозирования и основные результаты для линейной функции потерь. Сформулируем задачу минимизации потерь
7
t∗01 = arg
min
t01 ∈[t0 ,t1 ]
(1)
Q(t01 , t0 , t1 , F ).
Справедлива теорема.
Теорема 1. Пусть tp — решение уравнения
F (tp ) =
cq
,
c+l
другими словами tp — квантиль уровня p =
cq
c+l распределения
F (t).
Предположим, что Eτ ∈ R и существуют такие α и β, что −∞ ≤ α < β ≤
∞,
F (α) = 0, F (β) = q, функция F (t) строго монотонна и непрерывна на (α, β),
тогда решение задачи (1) определяется
t0 ,
tp ,
t∗01 =
t1 ,
выражением
если tp ≤ t0 ,
если t0 < tp ≤ t1 ,
если t1 < tp .
Д о к а з а т е л ь с т в о. Перед теоремой было получено следующее представление
ожидаемых потерь
∫t1
Q(t01 , t0 , t1 , F ) = c
∫t01
(q − F (t))dt + l
t01
F (t)dt
t0
Будем рассматривать ожидаемые потери Q(t01 , t0 , t1 , F ) как функцию аргумента t01 ∈
[t0 , t1 ] при фиксированных значениях t0 , t1 . Продифференцируем Q(t01 , t0 , t1 , F ) по t01 ,
тогда
∂Q(t01 , t0 , t1 , F )
= −c(q − F (t01 )) + lF (t01 ) = −cq + (c + l)F (t01 ).
∂t01
При t01 < tp производная отрицательна, так как функция F (t01 ) строго возрастает на
промежутке (α, β). При t01 > tp производная положительна. Если tp < t0 , то tp < t01
и, следовательно, целесообразно положить t∗01 = t0 , наоборот, если tp > t1 , то tp > t01
и, тогда, производная отрицательна, функция потерь убывает и необходимо выбрать
t∗01 = t1 . Если t0 < tp < t1 , то следует положить t∗01 = tp .
З а м е ч а н и е 1. Доказанная теорема 1 совпадает с соответствующим результатом в [2] при q = 1.
8
Решение на основе минимаксного подхода. Если функция F (t) не известна,
что отвечает самому низкому уровню информированности, когда статистическая база
отсутствует, то можно рассмотреть минимаксную постановку задачи:
t∗∗
01 = arg
inf
(2)
sup Q(t01 , t0 , t1 , F ),
t01 ∈[t0 ,t1 ] F ∈Σ
где Σ - множество всех функций распределения, удовлетворяющих условию lim F (t) =
t→+∞
q ≤ 1.
Теорема 2. Решение задачи (2) имеет вид
t∗∗
01 =
c
l
t1 +
t0 .
c+l
c+l
Д о к а з а т е л ь с т в о. Заметим, что
e t0 , t0 , t1 , F ) = l(t0 − t0 )I{τ ≤ t0 } + l(t0 − τ )I{t0 < τ ≤ t0 } +
Q(τ,
1
1
1
1
+ c(τ − t01 )I{t01 < τ ≤ t1 } + c(t1 − t01 )I{t1 < τ ≤ ∞} ≤ l(t01 − t0 )I{τ ≤ t01 } +
+ c(t1 − t01 )I{t01 < τ < ∞}.
С одной стороны,
e t0 , t0 , t1 , F ) ≤ l(t0 − t0 )F (t0 ) +
Q(t01 , t0 , t1 , F ) = E Q(τ,
1
1
1
+ c(t1 − t01 )(q − F (t01 ) ≤ q max{l(t01 − t0 ), c(t1 − t01 )}.
Правая часть этого неравенства не зависит от F , потому
sup Q(t01 , t0 , t1 , F ) ≤ q max{l(t01 − t0 ), c(t1 − t01 )}
F ∈Σ
С другой стороны,
∫t1
Q(t01 , t0 , t1 , F ) = c
∫t01
(q − F (t))dt + l
t01
F (t)dt
t0
Выберем в качестве несобственной функции распределения F (t) такую, для которой
F (t0 ) = q и, следовательно, F (t) = q при любом t > t0 . Но тогда для такой функции
распределения
Q(t01 , t0 , t1 , F ) = lq(t01 − t0 ).
9
Если в качестве F (t) выбрать функцию, для которой F (t1 ) = 0 и, отсюда, F (t) = 0 при
t < t1 , получим
Q(t01 , t0 , t1 , F ) = cq(t1 − t01 ).
Таким образом,
sup Q(t01 , t0 , t1 , F ) ≥ max{lq(t01 − t0 ), cq(t1 − t0 )} =
F ∈Σ
= q max{l(t01 − t0 ), c(t1 − t01 )}
Сравнивая два неравенства, приходим к равенству
sup Q(t01 , t0 , t1 , F ) = q max{l(t01 − t0 ), c(t1 − t01 )}.
F ∈Σ
(3)
Слева и справа в нем стоят функции от t01 , которые совпадают на отрезке [t0 , t1 ].
Но тогда совпадают и точки, в которых достигается минимум функций на множестве
[t0 , t1 ].
Поэтому для решения задачи (2) достаточно минимизировать функцию из правой
части равенства (3). Очевидно, что минимум достигается в точке пересечения линейных
функций g1 (t01 ) = c(t1 − t01 ) и g2 (t01 ) = l(t01 − t0 ).
Решая уравнение
c(t1 − t01 ) = l(t01 − t0 )
относительно t01 , приходим к решению задачи (2):
t∗∗
01 =
l
c
t1 +
t0 .
c+l
c+l
З а м е ч а н и е 2. Как видим, минимаксное решение не изменилось при использовании несобственных распределений и совпадает с минимаксным решением из
работы [2].
Представление функции распределения в виде конечные смеси распределений. Представляет интерес рассмотрение ситуации, когда функция распределения
момента времени представима в виде конечной смеси некоторых распределений. Подобная ситуация типична для многих прикладных задач. Дело в том, что в реальных
10
прикладных задачах всегда присутствует внутренняя неоднородность, связанная с действием разнообразных факторов. Довольно часто можно выделить некоторые типовые
сценарии развития событий. Элементы конечной смеси как раз и представляют собой
такие сценарии, а вероятности фигурирующие в виде коэффициентов являются вероятностями соответствующих сценариев.
Предположим, что функция распределения F (t) представима в виде конечной смеси непрерывных строго возрастающих на промежутке (α, β) функций распределения
F1 (t), ..., Fm (t) :
F (t) =
m
∑
(4)
pi Fi (t),
i=1
m
∑
где весовые множители pi ≥ 0, i = 1, ..., m;
pi = 1.
i=1
Предположим, что функции распределения Fi (t) несобственные, lim Fi (t) = qi ≤
t→+∞
1, тогда, как нетрудно видеть,
lim F (t) =
t→+∞
m
∑
pi qi = q ≤ 1,
i=1
т. е функция распределения F (t) также является несобственной.
Введем в рассмотрение дискретную случайную величину ν с распределением P {ν =
i} = pi , i = 1, ..., m.
Числовые реализации случайной величины τ происходят следующим образом. Вначале с вероятностью pi , i = 1, ..., m, выбирается совокупность с номером i, соответствующая функции распределения Fi (t), а затем из этой совокупности выбирается числовая реализация, подчиняющаяся распределению Fi (t). Рассмотренная вероятностная
модель часто встречается на практике, например в случае, когда генеральная совокупность представляет собой смесь нескольких однородных совокупностей.
Если событие {ν = i} можно безошибочно идентифицировать, то естественно применять теорему 1 не к общей функции распределения F (t) из (4), а к функции распределения однородной совокупности Fi (t). При этом можно предположить, что ожидаемые
потери окажутся меньше.
11
Введем обозначения
t∗01 = arg
t∗01 i = arg
min
t01 ∈[t0 ,t1 ]
min
t01 ∈[t0 ,t1 ]
Q(t01 , t0 , t1 , F ),
Q(t01 , t0 , t1 , Fi ), i = 1, ..., m,
где F (t) - конечная смесь распределений.
Пусть
∗
∗
tf
01 = t01 1 I{ν = 1} + ... + t01 m I{ν = m},
здесь I{ν = i}-индикатор события {ν = i}.
Таким образом, t∗01 - оптимальное решение для всей смеси F (t), t∗01 i -оптимальное
решение для распределения Fi (t), tf
01 -оптимальное решение для смеси, если точно идентифицируются события {ν = i}, i = 1, ..., m.
Ранее было выведено соотношение
∫t1
∫t01
(q − F (t))dt + l
Q(t01 , t0 , t1 , F ) = c
t01
F (t)dt
t0
m
∑
Подставим вместо F (t) конечную смесь (3) с учетом q =
pi qi . Тогда
i=1
Q(t01 , t0 , t1 , F ) =
m
∑
i=1
∫t1
pi (c
∫t01
(qi − Fi (t))dt + l
t01
Fi (t)dt) =
m
∑
t0
pi Q(t01 , t0 , t1 , Fi )
(5)
i=1
В условиях точной идентифицируемости событий {ν = i} и при использовании решения
tf
01 можно выписать ожидаемые потери от выбора решения tf
01 :
Q(tf
01 , t0 , t1 , F ) =
m
∑
Q(t∗01 i , t0 , t1 , Fi )I{ν = i}.
i=1
Величина Q(tf
01 , t0 , t1 , F ) является случайной, так как она зависит от случайной величины ν. Как легко видеть, полное математическое ожидание потерь имеет вид
EQ(tf
01 , t0 , t1 , F ) =
m
∑
pi Q(t∗01 i , t0 , t1 , Fi ).
i=1
Теорема 3. Справедливо неравенство
∗
EQ(tf
01 , t0 , t1 , F ) ≤ Q(t01 , t0 , t1 , F ).
12
Д о к а з а т е л ь с т в о. Из формулы (5), при подстановке в нее вместо t01 момента
времени t∗01 получаем
Q(t∗01 , t0 , t1 , F ) =
m
∑
pi Q(t∗01 , t0 , t1 , Fi ) ≥
i=1
≥
m
∑
pi Q(t∗01 i , t0 , t1 , Fi ) = EQ(tf
01 , t0 , t1 , F ).
i=1
З а м е ч а н и е 3. Для несобственных распределений сохраняется результат из
[2, 3].
Из теоремы 3 следует, что в условиях точной идентифицируемости событий {ν =
i}, i = 1, ..., m, ожидаемые потери при использовании оценки tf
01 оказываются меньше,
чем при помощи оценки t∗01 . Другими словами, наличие дополнительной априорной
информации позволяет иметь дополнительный выигрыш.
Выводы. В разделе 1.1 последовательно проведено обобщение результатов,полученных
в работах [2, 3] на случай несобственного распределения момента времени наступления
некоторого события. Несобственные распределения часто возникают в задачах оценки
рисков и в анализе медицинской информации. Для разного уровня информативности
получены теоремы, характеризующие оптимальные решения. Все содержание данного
раздела опубликовано в работе [5].
13
1.2 Квадратичная функция потерь
В предыдущем разделе было проведено рассмотрение линейных по времени потерь.
В разделе 1.2 изучаются квадратичные потери. Представляет интерес получение результатов аналогичных результатам предыдущего раздела и сравнение их между собой.
Использование квадратичных потерь позволяет учесть нелинейный характер зависимости суммарных потерь от времени, что довольно часто встречается в прикладных
задачах.
Для удобства изложения материала повторим определение несобственного распределения из предыдущего раздела, сохранив все обозначения. Все результаты раздела
1.2 получены в работе [6].
Несобственное распределение момента времени. Пусть τ — случайный момент времени наступления некоторого события, далее будем предполагать, что функция распределения F (t) = P {τ < t} может быть несобственной [1], т. е.
lim F (t) = P {τ < ∞} = q ≤ 1.
t→∞
Откуда следует, что вероятность не наступления события равна 1 − q. Как это обычно
принято, отсутствие события будем обозначать {τ = ∞}, следовательно, P {τ = ∞} =
1 − q. Будем предполагать, что функция распределения F (t) непрерывна и строго монотонна на (α, β), где −∞ ≤ α < β ≤ ∞, F (α) = 0, F (β) = q.
Как отмечалось в предыдущем разделе, функцию F (t) можно построить по имеющимся наблюдениям, полученным в ранее проведенных статистических исследованиях.
Будем считать, что известны штрафы в единицу времени, связанные с ошибкой в оценке момента времени τ . Выбираем момент времени t01 ∈ [t0 , t1 ] как оценку момента
времени τ , при этом промежуток времени [t0 , t1 ] считается заданным заранее, исходя
из содержательной постановки задачи. Пусть c — штраф в единицу времени при наступлении события t01 < τ , l — штраф в единицу времени при наступлении события
τ < t0 1 .
e t0 , t0 , t1 , F )
Квадратичная функция потерь. При определении функции потерь Q(τ,
1
14
заметим, что возможны следующие варианты наступления момента времени τ : {τ ≤
t0 }, {t0 < τ ≤ t01 }, {t01 < τ ≤ t1 } {t1 < τ < ∞}, {τ = ∞}. Будем предполагать,
что, если событие не происходит, т. е {τ = ∞}, то потери отсутствуют при любом выборе t01 . Также примем во внимание, что по условию задачи t01 ∈ [t0 , t1 ]. В разделе
1.1 исследовалась линейная функция потерь от времени. В разделе 1.2 примем, что
потери носят квадратичный характер, во многих приложениях такое задание функции
потерь представляется более правильным исходя из содержательных постановок задач.
Поэтому определим функцию потерь равенством
e t0 , t0 , t1 , F ) = l(t0 − t0 )2 I{τ ≤ t0 } + l(t0 − τ )2 I{t0 < τ ≤ t0 } +
Q(τ,
1
1
1
1
+ c(τ − t01 )2 I{t01 < τ ≤ t1 } + c(t1 − t01 )2 I{t1 < τ < ∞},
где I{.} — индикатор события, содержащегося в скобках.
e t0 , t0 , t1 , F ) зависят от случайной величины τ , целесоУчитывая, что потери Q(τ,
1
образно перейти к математическому ожиданию, используя распределение случайной
величины τ . Ожидаемые потери имеют следующий вид:
e t0 , t0 , t1 , F ) = l(t0 − t0 )
Q(t01 , t0 , t1 , F ) = E Q(τ,
1
1
∫t0
2
dF (t) +
−∞
∫t01
∫∞
2
2
+ l (t01 − t) dF (t) + c(t1 − t01 )
dF (t) +
t0
t1
∫t1
+c
(t − t01 )2 dF (t) = l(t01 − t0 )2 F (t0 ) + c(t1 − t01 )2 (q − F (t1 )) +
t01
+ l(t01 − t)
2
t
F (t)|t001
∫t01
+ 2l (t01 − t)F (t)dt + c(t − t01 )2 F (t)|tt101 −
t0
∫t1
− 2c
(t − t01 )F (t)dt =
t01
∫
∫t1
t01
= cq(t1 − t01 ) + 2l
(t01 − t)F (t)dt − 2c
2
t0
t01
15
(t − t01 )F (t)dt =
∫t1
= 2c
∫t01
(t − t01 )(q − F (t))dt + 2l (t01 − t)F (t)dt
t01
t0
Постановка задачи оптимального прогнозирования и основные результаты для квадратичной функции потерь. Момент времени наступления события t01
оценим как решение задачи минимизации потерь
t∗01 = arg
min
t01 ∈[t0 ,t1 ]
(6)
Q(t01 , t0 , t1 , F ).
Теорема 4. Предположим, что Eτ ∈ R и существуют такие α и β, что −∞ ≤
α < β ≤ ∞, F (α) = 0, F (β) = q, функция F (t) строго монотонна и непрерывна на
(α, β), тогда решение задачи (1) является единственным решением уравнения
∫t1
−c
∫t01
(q − F (t))dt + l
t01
F (t)dt = 0.
t0
Д о к а з а т е л ь с т в о. Ранее было найдено следующее представлением ожидаемых
потерь
∫t1
Q(t01 , t0 , t1 , F ) = 2c
∫t01
(t − t01 )(q − F (t))dt + 2l (t01 − t)F (t)dt.
t01
(7)
t0
Ожидаемые потери Q(t01 , t0 , t1 , F ) в (2) будем рассматривать как функцию аргумента
t01 ∈ [t0 , t1 ]. Границы промежутка t0 , t1 зафиксированы. Продифференцируем Q(t01 , t0 , t1 , F )
по t01 , тогда производная имеет вид
∫t1
Q
(1)
(t01 , t0 , t1 , F ) = −2c
∫t01
(q − F (t))dt + 2l
t01
F (t)dt,
t0
Вычислим вторую производную функции Q(t01 , t0 , t1 , F ) по t01
Q(2) (t01 , t0 , t1 , F ) = 2c(q − F (t01 )) + 2lF (t) > 0.
Нетрудно видеть, что функция Q(1) (t01 , t0 , t1 , F ), как функция t01 , возрастает на промежутке [t0 , t1 ], при этом она меняет знак с минуса на плюс (на левом конце промежутка
функция отрицательна, на правом — положительна).
16
З а м е ч а н и е 1. Доказанная теорема 1 существенно отличается от соответствующего результата в разделе 1.1, что вызвано нелинейным видом рассматриваемой
функции потерь.
Решение на основе минимаксного подхода. Предположим теперь, что функция F (t) полностью не известна, подобная ситуация соответствует самому низкому
уровню информированности. В этом случае целесообразно рассмотреть минимаксную
постановку задачи:
t∗∗
01 = arg
inf
(8)
sup Q(t01 , t0 , t1 , F ),
t01 ∈[t0 ,t1 ] F ∈Σ
где Σ — множество всех функций распределения, удовлетворяющих условию lim F (t) =
t→+∞
q ≤ 1.
Теорема 5. Решение задачи (3) имеет вид
t∗∗
01
√
√
c
l
√ t1 + √
√ t0 .
=√
c+ l
c+ l
Д о к а з а т е л ь с т в о. Заметим, что
e t0 , t0 , t1 , F ) = l(t0 − t0 )2 I{τ ≤ t0 } + l(t0 − τ )2 I{t0 < τ ≤ t0 } +
Q(τ,
1
1
1
1
+ c(τ − t01 )2 I{t01 < τ ≤ t1 } + c(t1 − t01 )2 I{t1 < τ ≤ ∞} ≤ l(t01 − t0 )2 I{τ ≤ t01 } +
+ c(t1 − t01 )2 I{t01 < τ < ∞}.
С одной стороны,
e t0 , t0 , t1 , F ) ≤ l(t0 − t0 )2 F (t0 ) +
Q(t01 , t0 , t1 , F ) = E Q(τ,
1
1
1
+ c(t1 − t01 )2 (q − F (t01 ) ≤ q max{l(t01 − t0 )2 , c(t1 − t01 )2 }.
Правая часть этого неравенства не зависит от F , потому
sup Q(t01 , t0 , t1 , F ) ≤ q max{l(t01 − t0 )2 , c(t1 − t01 )2 }.
F ∈Σ
17
С другой стороны, как было показано ранее,
∫t1
Q(t01 , t0 , t1 , F ) = 2c
∫t01
(t − t01 )(q − F (t))dt + 2l (t01 − t)F (t)dt.
t01
t0
Выберем в качестве несобственной функции распределения F (t) такую, для которой
F (t0 ) = q и, следовательно, F (t) = q при любом t > t0 . Но тогда для такой функции
распределения
Q(t01 , t0 , t1 , F ) = lq(t01 − t0 )2 .
Если в качестве F (t) выбрать функцию, для которой F (t1 ) = 0 и, отсюда, F (t) = 0 при
t < t1 , получим
Q(t01 , t0 , t1 , F ) = cq(t1 − t01 )2 .
Таким образом,
sup Q(t01 , t0 , t1 , F ) ≥ max{lq(t01 − t0 )2 , cq(t1 − t0 )2 } =
F ∈Σ
= q max{l(t01 − t0 )2 , c(t1 − t01 )2 }
Сравнивая два неравенства, приходим к равенству
sup Q(t01 , t0 , t1 , F ) = q max{l(t01 − t0 )2 , c(t1 − t01 )2 }
F ∈Σ
(9)
Слева и справа в нем стоят функции от t01 , которые совпадают на отрезке [t0 , t1 ].
Но тогда совпадают и точки, в которых достигается минимум функций на множестве
[t0 , t1 ].
Поэтому для решения задачи (8) достаточно минимизировать функцию из правой
части равенства (9). Очевидно, что минимум достигается в точке пересечения парабол
g1 (t01 ) = c(t1 − t01 )2 и g2 (t01 ) = l(t01 − t0 )2 .
Решая уравнение
c(t1 − t01 )2 = l(t01 − t0 )2
относительно t01 , приходим к решению задачи (3):
√
√
c
l
∗∗
√ t1 + √
√ t0 .
t01 = √
c+ l
c+ l
18
З а м е ч а н и е 2. Следовательно, минимаксное решение также изменилось
при сравнении с соответствующим результатом из раздела 1.2, где рассматривалась
линейная функция потерь.
Представление функции распределения в виде конечные смеси распределений. В прикладных исследованиях часто возникают ситуации, когда исходная генеральная совокупность состоит из нескольких относительно однородных совокупностей,
причем распределение каждой из них известно. Известна также относительная частота
встречаемости объектов для каждой из совокупностей. Как отмечалось в предыдущем
разделе 1.2, довольно часто можно выделить некоторые типовые сценарии развития
событий. Элементы конечной смеси представляют собой такие сценарии, а вероятности
фигурирующие в виде коэффициентов являются вероятностями соответствующих сценариев или, другими словами, относительными частотами,о которых говорилось выше.
Предположим, что функция распределения F (t) представима в виде конечной смеси непрерывных строго возрастающих на промежутке (α, β) функций распределения
F1 (t), ..., Fm (t) :
F (t) =
m
∑
(10)
pi Fi (t),
i=1
m
∑
где весовые множители pi ≥ 0, i = 1, ..., m;
pi = 1.
i=1
Введенные в (10) функции распределения определяют законы распределения однородных совокупностей, из которых состоит исходная генеральная совокупность, а
весовые множители представляют собой вероятности встречаемости объектов из однородных совокупностей в общей выборке.
Предположим, что функции распределения Fi (t) несобственные, lim Fi (t) = qi ≤
t→+∞
1, тогда, как нетрудно видеть,
lim F (t) =
t→+∞
m
∑
pi qi = q ≤ 1,
i=1
т. е. функция распределения F (t) также является несобственной.
Как и в разделе 1.1, введем дискретную случайную величину ν с распределением
P {ν = i} = pi , i = 1, ..., m, значение введенной случайной величины определяет номер
19
однородной совокупности.
Числовые реализации случайной величины τ происходят следующим образом. Вначале с вероятностью pi , i = 1, ..., m, выбирается однородная совокупность с номером
i, соответствующая функции распределения Fi (t), а затем из этой совокупности выбирается числовая реализация, подчиняющаяся распределению Fi (t).
Если событие {ν = i} можно безошибочно идентифицировать, то естественно применять теорему 1 не к общей функции распределения F (t) из (5), а к функции распределения однородной совокупности Fi (t). При этом можно предположить, что ожидаемые
потери окажутся меньше.
Введем обозначения
t∗01 = arg
t∗01 i = arg
min
t01 ∈[t0 ,t1 ]
min
t01 ∈[t0 ,t1 ]
Q(t01 , t0 , t1 , F ),
Q(t01 , t0 , t1 , Fi ), i = 1, ..., m,
где F (t) — конечная смесь распределений.
Пусть
∗
∗
tf
01 = t01 1 I{ν = 1} + ... + t01 m I{ν = m},
здесь I{ν = i}— индикатор события {ν = i}.
Таким образом, t∗01 — оптимальное решение для всей смеси F (t), t∗01 i -оптимальное
решение для распределения Fi (t), tf
01 — оптимальное решение для смеси, если точно
идентифицируются события {ν = i}, i = 1, ..., m.
Ранее было выведено соотношение
∫t1
Q(t01 , t0 , t1 , F ) = 2c
∫t01
(t − t01 )(q − F (t))dt + 2l (t01 − t)F (t)dt.
t01
t0
Подставим вместо F (t) конечную смесь (5) с учетом q =
m
∑
pi qi . Тогда
i=1
Q(t01 , t0 , t1 , F ) =
m
∑
i=1
∫t1
pi (2c
t01
20
(t − t01 i )(qi − Fi (t))dt +
∫t01
m
∑
pi Q(t01 , t0 , t1 , Fi )
+ 2l (t01 i − t)Fi (t)dt) =
i=1
t0
В условиях точной идентифицируемости событий {ν = i} и при использовании решения
tf
01 можно выписать ожидаемые потери от выбора решения tf
01 :
Q(tf
01 , t0 , t1 , F ) =
m
∑
Q(t∗01 i , t0 , t1 , Fi )I{ν = i}.
i=1
Величина Q(tf
01 , t0 , t1 , F ) является случайной, так как она зависит от случайной величины ν. Как легко видеть, полное математическое ожидание потерь имеет вид
EQ(tf
01 , t0 , t1 , F ) =
m
∑
pi Q(t∗01 i , t0 , t1 , Fi ).
i=1
Теорема 6. Справедливо неравенство
∗
EQ(tf
01 , t0 , t1 , F ) ≤ Q(t01 , t0 , t1 , F ).
Д о к а з а т е л ь с т в о. Подставим в выше найденное представление вместо t01
момент времени t∗01
Q(t∗01 , t0 , t1 , F ) =
m
∑
pi Q(t∗01 , t0 , t1 , Fi ) ≥
i=1
≥
m
∑
pi Q(t∗01 i , t0 , t1 , Fi ) = EQ(tf
01 , t0 , t1 , F ).
i=1
З а м е ч а н и е 3. Как видим, сохраняется результат из раздела 1.1.
Теорема 6 показывает, что в условиях точной идентифицируемости событий {ν =
i}, i = 1, ..., m, когда точно известно, из какой именно однородной совокупности извлекается реализация оцениваемой случайной величины, ожидаемые потери при исполь∗
зовании оценки tf
01 оказываются меньше, чем при применении оценки t01 . Результат
теоремы выглядит очень естественным, действительно, наличие дополнительной априорной информации позволяет получить дополнительный выигрыш.
Выводы. В работе последовательно проведено обобщение результатов работы [ 5]
на случай нелинейных потерь квадратичного типа и несобственных распределений. Для
разного уровня информированности получены теоремы, в которых найдены оптимальные решения. Все результаты данного раздела получены в работе [6].
21
2. Конкурентное прогнозирование
2.1 Теоретико-игровая модель конкурентного прогнозирования
В разделе 2.1 уточняются и обобщаются результаты, содержащиеся в [14] на случай
несобственных распределений вероятностей [1]. Доказана единственность оптимальных
смешанных стратегий в классе смешанных стратегий с носителем, состоящим из двух
точек. Близкие по постановке задачи были ранее рассмотрены в [15, 16]. Все результаты
этого раздела получены в работе [11].
Шкала прогноза. Предположим, что случайная величина τ подчиняется распределению с непрерывной функцией распределения F (z), причем на некотором интервале
(α, β), −∞ ≤ α < β ≤ ∞, функция распределения F (z) строго монотонна и может быть
несобственной функцией распределения [1]
lim F (z) = q ≤ 1,
z→∞
при этом F (α) = 0, F (β) = q.
Если распределение случайной величины τ является несобственным, то будем предполагать, что P {τ = ∞} = 1 − q.
Функция G(z), которую будем называть шкалой прогноза, удовлетворяет следующим аксиомам:
1) функция G(z) ≥ 0, z ∈ (−∞, ∞), непрерывна на числовой прямой, строго монотонна на интервале (α, β);
2) существуют пределы
lim G(z) = 0, lim G(z) = g,
z→−∞
z→∞
при этом G(α) = 0, G(β) = g;
3) если x1 < y1 , x2 < y2 и P {x1 ≤ τ < y1 } = P {x2 ≤ τ < y2 }, то G(y1 ) − G(x1 ) =
G(y2 ) − G(x2 ).
Третья аксиома означает, что при условии одинаковой вероятности двух прогнозов
относительное качество их должно быть одинаковым.
22
Теорема 7. Если выполнены аксиомы 1, 2, 3, то G(z) = gq F (z) при любом z ∈ R.
Д о к а з а т е л ь с т в о. Выберем последовательность точек z0 = α < z1 < ... <
zn = β, что F (zk ) = q nk , k = 1, ..., n.
Тогда
P {zk−1 ≤ τ < zk } = F (zk ) − F (zk−1 ) =
q
, k = 1, ..., n.
n
Кроме того,
P {α ≤ τ < zk } = P {G(α) ≤ G(τ ) < G(zk )} =
qk
.
n
Из аксиомы 3 вытекает, что
G(zk ) − G(zk−1 ) = G(z1 ) − G(z0 ),
Так как
g = G(zn ) =
n−1
∑
(G(zk+1 ) − G(zk )),
k=0
получаем, что
G(zk ) − G(zk−1 ) =
g
g
kg
, G(z1 ) = , G(zk ) =
.
n
n
n
Введем обозначение
H(z) =
qG(z)
, z ∈ R.
g
Функция H(z) непрерывна на числовой прямой и строго монотонна на интервале (α, β),
причем H(α) = 0, H(β) = q.
Тогда
{
{
kq }
kg }
qk
P H(τ ) <
= P G(τ ) <
= P {G(α) ≤ G(τ ) < G(zk )} =
.
n
n
n
На интервале (α, β) существует обратная функция H −1 (.), тогда
( kq )} qk
{
{
kq }
= P τ < H −1
=
.
P H(τ ) <
n
n
n
Следовательно,
( kq )) qk
(
=
, k = 1, ..., n.
F H −1
n
n
23
Последнее равенство выполнено для любых целых чисел k и n, таких, что 1 ≤ k ≤ n.
В силу непрерывности рассматриваемых функций
F (H −1 (t)) = t, t ∈ [0, q].
Таким образом, функция H −1 (t) является обратной к функции F (.), другими словами,
F (z) = H(z), z ∈ R.
Итак, G(z) =
gF (z)
q .
Теорема доказана.
Модель конкурентного прогнозирования. Игра с нулевой суммой. Рассмотрим задачу конкурентного прогнозирования случайной величины τ , как игру двух лиц
с нулевой суммой.
Введем выигрыш игрока 1 в зависимости от конкретной реализации случайной величины τ :
f1 (x, y, τ ) = (G(y) − G(x))I{x ≤ τ < y} − (G(y) − G(x))I{x < y ≤ τ < ∞}−
Q
−(G(x) − G(y))I{y ≤ τ < x} + (G(x) − G(y))I{y < x ≤ τ < ∞},
положим
f2 (x, y, τ ) = −Q
f1 (x, y, τ ),
Q
здесь предполагаем, что x, y ∈ (α, β).
Кроме того, примем, что при осуществлении события {τ = ∞} выигрыш обоих
игроков равен нулю.
f1 (x, y, τ ) и Q
f2 (x, y, τ ) задают выигрыш соответственно 1 и 2 игроков в
Функции Q
зависимости от выбранных ими прогнозов x, y ∈ (α, β) и от реализовавшегося значения
случайной величины τ .
Введем переменные u =
1
q F (x),
v =
1
q F (x)
и случайную величину ζ =
1
q F (τ ).
Нетрудно заметить, что случайная величина ζ принимает значения из промежутка
[0,1], кроме того,
u, v ∈ [0, 1].
Найдем функцию распределения случайной величины ζ
Fζ (t) = P {ζ < t} = P {F (τ ) < qt} = P {τ < F −1 (qt)} = F (F −1 (qt)) = qt
24
при t ∈ [0, 1).
Функция распределения Fζ (t) = P {ζ < t} непрерывна слева в каждой точке числовой прямой, поэтому Fζ (1) = q.
Будем полагать, что Fζ (t) = q при t > 1. С вероятностью 1 − q не появляются реализации случайной величины ζ. Другими словами, будем считать, что при появлении
события {τ = ∞} случайная величина ζ не определена, выигрыш обоих игроков при
этом равен нулю.
В новых переменных выигрыш игрока 1, зависящий от реализации τ , может быть
записан следующим образом:
f1 (x, y, τ ) = g(v − u)I{u ≤ ζ < v} − g(v − u)I{u < v ≤ ζ} − g(u − v)I{v ≤ ζ < u}+
Q
f1 (u, v, ζ),
+g(u − v)I{v < u ≤ ζ} = g H
кроме того,
f2 (u, v, ζ) = −H
f2 (u, v, ζ).
H
В качестве функций выигрыща обоих игроков будем рассматривать математические
ожидания
f1 (u, v, ζ), H2 (u, v) = E H
f2 (u, v, ζ)
H1 (u, v) = E H
Функция выигрыша игрока 1 имеет вид:
q(v − u)(2v − u − 1), u < v,
0,
u = v,
H1 (u, v) =
q(u − v)(v + 1 − 2u), u > v.
Множества стратегий игроков представляют собой промежуток [0, 1] = U = V .
Определена игра Γ =< U, V, H1 (u, v) >, где функция выигрыша игрока 2 H2 (u, v) =
−H1 (u, v).
Теорема 8. В игре Γ существует ситуация равновесия в
∗
(P1 , P2∗ ), причем оптимальные стратегии игроков
(1)
(1)
1
= P2∗
=
P1∗ (0) = P2∗ (0) = , P1∗
3
2
2
смешанных стратегиях
2
.
3
Ситуация равновесия (P1∗ , P2∗ ) единственна в классе смешанных стратегий с носителем, состоящим из двух точек.
25
Д о к а з а т е л ь с т в о. Необходимым и достаточным условием того, что пара
стратегий (P1 , P2 ) представляет собой ситуацию равновесия, является выполнение для
любых u, v ∈ [0, 1] неравенства [17]
∫
∫
H1 (u, s)P2 (ds) ≤ d ≤
[0,1]
H1 (s, v)P1 (ds),
(11)
[0,1]
где d - вещественное число (цена игры).
Нетрудно заметить, что
∫
H1 (u, s)P2∗ (ds) =
1
2 ( 1)
H1 (u, 0) + H1 u,
=
3
3
2
{
[0,1]
Следовательно,
∫
0,
0 ≤ u ≤ 12 ;
1
1
2q( 2 − u)(u − 2 ), 12 < u ≤ 1.
H1 (u, s)P2∗ (ds) ≤ 0, u ∈ [0, 1].
[0,1]
Кроме того, H1 (u, v) = −H1 (v, u), меры P1∗ и P2∗ одинаковы, поэтому
∫
H1 (s, v)P1∗ (ds) = −
[0,1]
∫
H1 (v, s)P2∗ (ds) ≥ 0, v ∈ [0, 1].
[0,1]
Сравнивая данные неравенства с неравенством (11), видим, что стратегии P1∗ и P2∗ оптимальны, при этом цена игры d = 0. Докажем единственность оптимальных стратегий
на множестве смешанных стратегий с носителем, состоящим из двух точек. Возьмем
произвольную стратегию P с носителем из двух точек {a1 , a2 }, a1 < a2 и вероятностями
P {a1 } = p1 , P {a2 } = p2 , p1 + p2 = 1, p1 ≥ 0, p2 ≥ 0.
Для того чтобы смешанная стратегия P была оптимальна для игрока 2, необходимо
и достаточно выполнение неравенства
∫
H1 (u, s)P (ds) ≤ 0
(12)
[0,1]
для любого u ∈ [0, 1].
Если (12) выполнено, то стратегия P оптимальна также для игрока 1, действительно, H1 (u, v) = −H1 (v, u) и
∫
H1 (s, v)P (ds) ≥ 0,
[0,1]
26
Верно и обратное, если стратегия P оптимальна для игрока 1, то она оптимальна и для
игрока 2. Следовательно (P, P ) - ситуация равновесия в игре Γ.
Выясним условия, при выполнении которых неравенство (12) справедливо при любом u ∈ [0, 1].
Подставим u = a1 в (12):
∫
H1 (a1 , s)P (ds) = qp1 H1 (a1 , a1 ) + qp2 H1 (a1 , a2 ) ≤ 0
[0,1]
или
H1 (a1 , a2 ) ≤ 0.
(13)
Подставим u = a2 в (12), тогда
∫
H1 (a2 , s)P (ds) = qp1 H1 (a2 , a1 ) + qp2 H1 (a2 , a2 ) ≤ 0
[0,1]
или
H1 (a2 , a1 ) = −H1 (a1 , a2 ) ≤ 0.
(14)
Сравнивая (13) и (14), приходим к условию
H1 (a1 , a2 ) = q(a2 − a1 )(2a2 − a1 − 1) = 0.
(15)
Условие (15) равносильно условию
a2 =
a1 + 1
.
2
Для u ∈ (a1 , a2 ) получаем
∫
H1 (u, s)P (ds) = p1 H1 (u, a1 ) + p2 H1 (u, a2 ) = qp1 (u − a1 )(1 + a1 − 2u)+
[0,1]
+qp2 (a2 − u)(2a2 − u − 1) = 2qp1 (u − a1 )(a2 − u) + p2 q(a2 − u)(a1 − u) =
= q(u − a1 )(a2 − u)[2p1 − p2 ] = q(u − a1 )(a2 − u)(2 − 3p2 ) ≤ 0
и приходим к условию
p2 ≥
27
2
.
3
(16)
Для u ∈ [0, a1 ] находим
∫
H1 (u, s)P (ds) = p1 H1 (u, a1 ) + p2 H1 (u, a2 ) = qp1 (a1 − u)(2a1 − u − 1)+
[0,1]
+qp2 (a2 − u)(2a2 − u − 1) = q(a1 − u)[p1 (2a1 − u − 1) + p2 (a2 − u)] =
3
= q(a1 − u)[−u + (2a1 − 1) + p2 (a2 − 2a1 + 1)] = q(a1 − u)[−u + (2a1 − 1) + p2 (1 − a1 )] ≤ 0.
2
Для того чтобы неравенство было выполнено при всех u ∈ [0, a1 ], должно выполняться
неравенство
p2 ≤
2(1 − 2a1 )
.
3(1 − a1 )
(17)
Для u ∈ (a2 , 1] имеем
∫
H1 (u, s)P (ds) = p1 H1 (u, a1 ) + p2 H1 (u, a2 ) = qp1 (u − a1 )(1 + a1 − 2u)+
[0,1]
+qp2 (u − a2 )(1 + a2 − 2u) = −2p1 q(u − a1 )(u − a2 ) + p2 q(u − a2 )(1 + a2 − 2u) =
= q(u − a2 )[−2u + 2p1 a1 + p2 (1 + a2 )] = q(u − a2 )[−2u + 2a1 − 2a1 p2 + p2 (1 + a2 )] =
= q(u − a2 )[−2(u − a2 ] − 2(a2 − a1 ) + p2 (1 − a1 + a2 − a1 ) ≤ 0.
Для того чтобы неравенство было выполнено при всех u ∈ (a2 , 1], должно выполняться
условие
p2 ≤
2(a2 − a1 )
(1 − a1 )
2
=
= .
(1 − a1 ) + (a2 − a1 )
3
(1 − a1 ) + 21 (1 − a1 )
(18)
Из неравенства (17) следует, что a1 ≤ 12 , кроме того, неравенства (16)-(18) могут быть
выполнены только при a1 = 0 и p2 = 23 , следовательно, p1 = 13 , a2 = 12 . Стратегия P
оптимальна, если P = P1∗ = P2∗ .
Теорема доказана.
Модель конкурентного прогнозирования. Игра с ненулевой суммой. Рассмотрим игру с ненулевой суммой. Введем выигрыш игрока 1 в зависимости от конкретной реализации случайной величины τ следующим образом:
f1 (x, y, τ ) = (G(y) − G(x))I{x ≤ τ < y} + (G(x) − G(y))I{y < x ≤ τ < ∞},
Q
28
аналогично определим выигрыш игрока 2:
f2 (x, y, τ ) = (G(x) − G(y))I{y ≤ τ < x} + (G(y) − G(x))I{y < x ≤ τ < ∞}.
Q
После замены переменных u = 1q F (x), v = 1q F (y), ζ = 1q F (τ ) приходим к выигрышам
вида
f1 (u, v, ζ) = (v − u)I{u ≤ ζ < v} + (u − v)I{v < u ≤ ζ},
H
f2 (u, v, ζ) = (u − v)I{v ≤ ζ < u} + (v − u)I{u < v ≤ ζ}.
H
Как и раньше, в качестве функций выигрыша выберем математические ожидания
f1 (u, v, τ ), H2 (u, v) = E H
f2 (u, v, ζ).
H1 (u, v) = E H
Нетрудно убедиться, что
u < v,
q(u − v)2 ,
0,
u = v,
H1 (u, v) =
q(u − v)(1 − u), u > v,
соответственно
q(v − u)(1 − v), u < v;
0,
u = v;
H2 (u, v) =
q(u − v)2 ,
u > v.
Определена игра Γ =< U, V, H1 , H2 >, где U = V = [0, 1] - множества чистых стратегий,
Hi , i = 1, 2, - функция выигрыша игрока i.
Теорема 9. В игре Γ имеются две ситуации равновесия в чистых стратегиях:
(0, 12 ) и ( 12 , 0).
Д о к а з а т е л ь с т в о. Пусть игрок 2 выбирает стратегию v = 12 , тогда очевидно,
что наилучший ответ для игрока 1 заключается в выборе стратегии u = 0, при таком
выборе игрока 1 игроку 2 не имеет смысла отказываться от выбранной им стратегии.
Аналогично рассматривается вторая пара стратегий.
Замечание. Выигрыш обоих игроков при реализации стратегий одинаков и не
зависит от выбранного равновесия.
Выводы. В работе уточняются и обобщаются результаты работы [14] на случай
несобственного распределения прогнозируемой случайной величины. Точность прогноза оценивается в шкале пропорциональной функции распределения. Найдены опти29
мальные стратегии и доказана их единственность в некоторых классах стратегий. Все
результаты раздела 2.1 взяты из работы [11].
30
2.2 Теоретико-игровая модель тендера
В разделе 2.2 предложена новая теоретико-игровая модель тендера на основе математических моделей конкурентного прогнозирования [11, 14-16]. Найдены равновесия
в чистых стратегиях для случая двух и трех фирм [12].
Близкие в идейном плане задачи были ранее рассмотрены в [18, 19].
Теоретико-игровая модель с ненулевой суммой для двух фирм. Предположим, что две фирмы участвуют в тендере. Каждая из фирм назначает свою цену xi ,
i = 1, 2, для выполнения некоторых работ или поставки конкретного товара. Все поданные заявки проходят экспертизу, в результате которой устанавливается минимальная
пороговая цена τ . По мнению экспертов она является пороговой, заявки с меньшей
ценой отклоняются, как не удовлетворяющие требованиям, предъявляемым к потенциальным контрагентам.
Цена τ формируется в зависимости от текущих экономических условий и благодаря компромиссу между экспертами, в связи с чем цену τ можно считать случайной
величиной с известным законом распределения.
Кроме того, возможна ситуация, когда в силу особых форс-мажорных обстоятельств,
после экспертизы тендер может быть отменен, тогда будем считать, что произошло событие τ = ∞.
Вероятность осуществления такого события предполагается отличной от нуля и известной, пусть
P {τ = ∞} = 1 − q.
Предположим, что случайная величина τ подчиняется распределению с непрерывной функцией распределения F (z), причем на некотором интервале (α, β), −∞ ≤ α <
β ≤ ∞, функция распределения F (z) строго монотонна и может быть несобственной
функцией распределения [1]
lim F (z) = q ≤ 1,
z→∞
при этом F (α) = 0, F (β) = q.
31
Если распределение случайной величины τ является несобственным, то будем предполагать, что P {τ = ∞} = 1 − q.
Кроме того, для каждой из фирм имеется свой минимально допустимый уровень
цены ai , i = 1, 2, ниже которого фирма назначить цену не может по экономическим
причинам.
Без ограничения общности будем предполагать, что xi ∈ (α, β), ai ∈ (α, β),
i = 1, 2.
В качестве математической модели тендера будем рассматривать игру двух лиц, в
которой побеждает фирма i, если выполнено условие
{τ < ∞} ∩ {max{τ, ai } ≤ xi } ∩ {̸ ∃k ̸= i : τ ≤ xk ≤ xi };
в игре отсутствует победитель, если обе фирмы назначают одинаковую цену или осуществляется событие {τ = ∞}.
Для более адекватного выбора функции выигрыша необходимо учесть важные экономические особенности рассматриваемой задачи. Цель фирмы i заключается в том,
чтобы выбрать наименьшую цену, но так, чтобы выполнялось следующее условие:
max{τ, ai } ≤ xi .
Кроме того желательно, чтобы цена значимо отличалась от цены другой фирмы, так
как при условии их совпадения или, если цены практически одинаковы, победа фирмы
в тендере не гарантирована.
Действительно, из экономического смысла теоретико-игровой модели тендера, следует, что, если наименьшая цена отличается от другой цены не существенно, то с экономической точки зрения, речь идет о ситуации, когда цены практически совпадают, в
этом случае, победителем тендера не обязательно будет выбрана фирма, назначившая
наименьшую цену.
Пусть, например, цена некоторой фирмы 100 у.е., а второй - 99 у.е.. С формальной
математической точки зрения, победителем является вторая фирма, но с точки зрения потребителя (организатора тендера), разница между этими ценами несущественна,
32
условно говоря, организатор тендера может посчитать, что цены практически равны и
дальнейший выбор осуществлять по каким-то дополнительным показателям.
Необходимо приблизить теоретико-игровую модель к реальной экономической практике. Поэтому для лучшего соответствия экономической природе задачи функция выигрыша должна зависеть от величины разности цен, выбираемых игроками, так как
наличие значительной разницы в выбранных ценах повышает уровень гарантий победы в тендере для фирмы, назначившей меньшую цену, что делает теоретико-игровую
модель более адекватной.
Функция распределения F (z) известна, потому, считая выполненным событие {τ <
∞}, проделаем следующие преобразования:
δ = (F (τ ))/q,
yi = (F (xi ))/q,
bi = (F (ai ))/q.
(19)
i = 1, 2.
Они являются взаимно однозначными, причем δ, yi , bi ∈ [0, 1],
i = 1, 2.
Найдем функцию распределения Fδ (t) случайной величины δ при t ∈ [0, 1):
Fδ (t) = P {δ < t} = P {F (τ ) < qt} = P {τ < F −1 (qt)} = F (F −1 (qt)) = qt,
функция распределения Fδ (t) = P {δ < t} должна быть непрерывна слева в каждой
точке, следовательно, Fδ (1) = q, при t > 1 полагаем Fδ (t) = q.
При этом с вероятностью 1 − q происходит событие {τ = ∞}, другими словами,
случайная величина δ не определена. Ее распределение также является несобственным
вероятностным распределением.
Рассчитаем ожидаемый выигрыш (математическое ожидание выигрыша) фирмы i
в теоретико-игровой модели с ненулевой суммой:
Hi (y1 , y2 ) = I{yi < y3−i }(y3−i − yi )P {{max{δ, bi } ≤ yi } ∩ {δ ≤ yi < y3−i }}+
+I{y3−i < yi }(yi − y3−i )P {{max{δ, bi } ≤ yi } ∩ {y3−i < δ ≤ yi }},
33
i = 1, 2.
Получим более удобные выражения для функций выигрыша игроков, с этой целью
найдем вероятности, входящие в формулы для ожидаемых выигрышей:
если bi > yi , то
P {{max{δ, bi } ≤ yi }&{δ ≤ yi < y3−i }} = 0,
если bi ≤ yi , то
P {{max{δ, bi } ≤ yi } ∩ {δ ≤ yi < y3−i }} = (P {δ < bi }+
+P {bi ≤ δ ≤ yi })I{yi < y3−i } = Fδ (yi )I{yi < y3−i } = qyi I{yi < y3−i }.
Аналогично, если bi > yi , то
P {{max{δ, bi } ≤ yi } ∩ {y3−i < δ ≤ yi }} = 0,
если bi ≤ yi , то
P {{max{δ, bi } ≤ yi } ∩ {y3−i < δ ≤ yi }} =
= I{y3−i < yi }(I{y3−i ≤ bi }(P {y3−i < δ ≤ bi } + P {bi < δ ≤ yi })+
+I{y3−i > bi }P {y3−i < δ ≤ yi }) = I{y3−i < yi }P {y3−i < δ ≤ yi } =
= I{y3−i < yi }q(yi − y3−i ).
Следовательно,
Hi (y1 , y2 ) = I{yi < y3−i }((y3−i − yi )qyi ) + I{y3−i < yi }(yi − y3−i )q(yi − y3−i ) =
I{yi < y3−i }q((y3−i − yi )yi )+
+I{y3−i < yi }q(yi − y3−i )2 ,
i = 1, 2.
Множество чистых стратегий Yi для игрока i имеет вид
Yi = [bi , 1].
34
Таким образом, определена игра двух лиц Γ =< Y1 , Y2 , H1 , H2 > с ненулевой суммой.
Теорема 10. Справедливы утверждения:
1) если 0 ≤ b1 ≤ 12 , 0 ≤ b2 ≤ 21 , то в игре Γ имеются две ситуации равновесия в
чистых стратегиях (1/2, 1) и (1, 1/2);
2) если 12 < b1 < 1, 12 < b2 < 1, то в игре Γ имеются две ситуации равновесия в
чистых стратегиях (b1 , 1) и (1, b2 );
3) если 0 ≤ b1 ≤ 12 , 12 < b2 < 1, то в игре Γ имеются две ситуации равновесия в
чистых стратегиях (1/2, 1) и (1, b2 );
4) если
1
2
< b1 < 1, 0 ≤ b2 ≤
1
2,
то в игре Γ имеются две ситуации равновесия в
чистых стратегиях (b1 , 1) и (1, 1/2).
Д о к а з а т е л ь с т в о. Докажем утверждение 1. Если игрок 2 выбирает y2 = 1,
то максимум функции y1 (1 − y1 ) достигается при y1 = 1/2. Наоборот, если игрок 1
выбирает y1 = 1/2, то из анализа функции выигрыша игрока 2 вытекает, что игроку
2 следует выбрать y2 = 1. Аналогичное рассмотрение можно провести в остальных
случаях.
З а м е ч а н и е 1. Для того, чтобы найти оптимальное поведение фирм 1 и 2 в
тендере, достаточно проделать обратное преобразование к преобразованиям (19).
Теоретико-игровая модель с ненулевой суммой для трех фирм. Предположим теперь, что в тендере на тех же условиях что и раньше, участвуют три фирмы.
Каждая из фирм назначает свою цену xi ,
i = 1, 2, 3, для выполнения некоторых работ
или поставки конкретного товара.
Все заявки проходят экспертизу, в результате которой определяется минимальная
пороговая цена τ . Как и в случае двух фирм, цену τ можно считать случайной величиной с известным несобственным законом распределения вероятностей F (z) = P {τ <
z},
F (α) = 0,
F (β) = q.
Для каждой из фирм имеется свой минимально допустимый уровень цены ai , i =
1, 2, 3, ниже которого фирма назначить цену не может по экономическим причинам. Без
ограничения общности будем предполагать, что xi ∈ (α, β),
ai ∈ (α, β),
i = 1, 2, 3.
В качестве математической модели тендера будем рассматривать игру трех лиц, в
которой побеждает фирма i, если выполнено условие:
35
{τ < ∞} ∩ {max{τ, ai } ≤ xi } ∩ {̸ ∃k ̸= i : τ ≤ xk ≤ xi };
если осуществляется событие {τ = ∞} или, хотя бы две фирмы назначили одинаковые
цены, причем их цены меньше, чем цена третьей фирмы, но не меньше, чем пороговая,
то в игре отсутствует победитель.
Считая выполненным событие {τ < ∞}, проделаем следующие преобразования:
δ = (F (τ ))/q,
В (20) δ, yi , bi ∈ [0, 1],
yi = (F (xi ))/q,
bi = (F (ai ))/q,
i = 1, 2, 3.
(20)
i = 1, 2, 3. Функция распределения Fδ (t) случайной величины
δ была найдена выше.
Ожидаемый выигрыш (математическое ожидание выигрыша) фирмы i в теоретикоигровой модели с ненулевой суммой для трех фирм i, j, l определяется выражением
Hi (y1 , y2 , y3 ) = I{yi < min{yj , yl }}(min{yj , yl } − yi )×
×P {{max{δ, bi } ≤ yi } ∩ {δ ≤ yi < min{yj , yl }}+
+I{max{yj , yl } < yi }(yi − max{yj , yl })P {{max{δ, bi } ≤ yi } ∩ {max{yj , yl } < δ ≤ yi }}+
+I{yl < yi < yj }(yj − yi )P {{max{δ, bi } ≤ yi } ∩ {yl < δ ≤ yi }}+
+I{yj < yi < yl }(yl − yi )P {{max{δ, bi } ≤ yi } ∩ {yj < δ ≤ yi }},
i = 1, 2, 3.
Найдем вероятности, входящие в формулы для ожидаемых выигрышей. Если bi >
yi , то
P {{max{δ, bi } ≤ yi } ∩ {δ ≤ yi < min{yj , yl }}} = 0,
если bi ≤ yi , то
P {{max{δ, bi } ≤ yi } ∩ {δ ≤ yi < min{yj , yl }}} =
= (P {δ < bi } + P {bi ≤ δ ≤ yi })I{yi < min{yj , yl }} =
= Fδ (yi )I{yi < min{yj , yl }} = qyi I{yi < min{yj , yl }}.
36
Если bi > yi , то
P {{max{δ, bi } ≤ yi } ∩ {max{yj , yl } < δ ≤ yi }} = 0,
если bi ≤ yi , то
P {{max{δ, bi } ≤ yi } ∩ {max{yj , yl } < δ ≤ yi }} =
= I{max{yj , yl } < yi }(I{max{yj , yl } ≤ bi }(P {max{yj , yl } < δ ≤ bi }+
+P {bi < δ ≤ yi }) + I{max{yj , yl } > bi }P {max{yj , yl } < δ ≤ yi }} =
= I{max{yj , yl } < yi }P {max{yj , yl } < δ ≤ yi } =
= I{max{yj , yl } < yi }q(yi − max{yj , yl }).
Если bi > yi , то
P {{max{δ, bi } ≤ yi } ∩ {yl < δ ≤ yi }} = 0,
если bi ≤ yi , то
P {{max{δ, bi } ≤ yi } ∩ {yl < δ ≤ yi }} = I{yl < yi }P {yl < δ < yi } =
= I{yl < yi }q(yi − yl ).
Если bi > yi , то
P {{max{δ, bi } ≤ yi } ∩ {yj < δ ≤ yi }} = 0,
если bi ≤ yi , то
P {{max{δ, bi } ≤ yi } ∩ {yj < δ ≤ yi }} = I{yj < yi }P {yj < δ < yi } =
= I{yj < yi }q(yi − yj ).
Следовательно,
37
Hi (y1 , y2 , y3 ) = I{yi < min{yj , yl }}(min{yj , yl } − yi )qyi +
+I{max{yj , yl } < yi }(yi − max{yj , yl })q(yi − max{yj , yl })+
+I{yl < yi < yj }(yj − yi )q(yi − yl )+
+I{yj < yi < yl }(yl − yi )q(yi − yj ) =
= I{yi < min{yj , yl }}qyi (min{yj , yl } − yi )+
+I{max{yj , yl } < yi }q(yi − max{yj , yl })2 +
+I{yl < yi < yj }q(yj − yi )(yi − yl )+
+I{yj < yi < yl }q(yl − yi )(yi − yj ),
i = 1, 2, 3.
Множество чистых стратегий Yi для игрока i имеет вид
Yi = [bi , 1].
Таким образом, определена игра трех лиц Γ =< Y1 , Y2 , Y3 , H1 , H2 , H3 > с ненулевой
суммой. Найдем равновесия в чистых стратегиях в игре Γ.
Теорема 11. Если выполнены неравенства b1 ≤ 1/3, b2 ≤ 1/3, b3 ≤ 1/3, то любая
перестановка компонент вектора ( 1/3, 2/3, 1) представляет собой точку равновесия
в игре Γ.
Д о к а з а т е л ь с т в о. Из вида функций выигрыша Hi , i = 1, 2, 3, следует, что при
выполнении условия y1 < y2 < y3 для того, чтобы вектор (y1 , y2 , y3 ) представлял собой
точку равновесия, необходимо и достаточно выполнение условий y3 = 1, y1 = y2 /2, y2 =
(y1 + 1)/2. Есть единственное решение данной системы уравнений: y3 = 1, y1 = 1/3, y2 =
2/3.
З а м е ч а н и е 2. Если какие-то из условий теоремы 11 нарушены, то некоторые
равновесия могут сохраниться. Например, если b3 > 1/3, то сохранятся равновесия из
теоремы 11 со значениями третьей компоненты 2/3 и 1.
Теорема 12. Если выполнены неравенства 1 > b1 > 1/2, 1 > b2 > 1/2, 1 > b3 > 1/2,
то в игре Γ существуют следующие ситуации равновесия в чистых стратегиях:
38
1) если b2 ≤ (b1 + 1)/2, то в игре Γ имеется ситуация равновесия в чистых стратегиях (b1 , (b1 +1)/2, 1), если b2 > (b1 +1)/2, то в игре Γ имеется ситуация равновесия
в чистых стратегиях (b1 , b2 , 1);
2) если b1 ≤ (b2 + 1)/2, то в игре Γ имеется ситуация равновесия в чистых стратегиях ((b2 +1)/2, b2 , 1), если b1 > (b2 +1)/2, то в игре Γ имеется ситуация равновесия
в чистых стратегиях (b1 , b2 , 1);
3) если b3 ≤ (b1 + 1)/2, то в игре Γ имеется ситуация равновесия в чистых стратегиях (b1 , 1, (b1 +1)/2), если b3 > (b1 +1)/2, то в игре Γ имеется ситуация равновесия
в чистых стратегиях (b1 , 1, b3 );
4) если b1 ≤ (b3 + 1)/2, то в игре Γ имеется ситуация равновесия в чистых стратегиях ((b3 +1)/2, 1, b3 ), если b1 > (b3 +1)/2, то в игре Γ имеется ситуация равновесия
в чистых стратегиях (b1 , 1, b3 );
5) если b3 ≤ (b2 + 1)/2, то в игре Γ имеется ситуация равновесия в чистых стратегиях (1, b2 , (b2 +1)/2), если b3 > (b2 +1)/2, то в игре Γ имеется ситуация равновесия
в чистых стратегиях (1, b2 , b3 );
6) если b2 ≤ (b3 + 1)/2, то в игре Γ имеется ситуация равновесия в чистых стратегиях (1, (b3 +1)/2, b3 ), если b2 > (b3 +1)/2, то в игре Γ имеется ситуация равновесия
в чистых стратегиях (1, b2 , b3 ).
Д о к а з а т е л ь с т в о. Рассмотрим ситуацию, когда y1 < y2 < y3 . Очевидно, что
y3 = 1 представляет собой оптимальный выбор игрока 3. Оптимальный выбор игрока
1 таков:
y1 =
y2
,
2
но b1 > 12 , поэтому оптимальной стратегией игрока 1 будет выбор
y1 = b1 ,
оптимальное решение для игрока 2 заключается в выборе
(
)
b1 + 1
y2 = max b2 ,
.
2
Аналогично исследуются все остальные варианты.
З а м е ч а н и е 3. При конкретном наборе значений bi , i = 1, 2, 3, всегда можно
найти равновесия в чистых стратегиях, если они существуют для имеющегося набора
39
параметров bi , i = 1, 2, 3. Проделывая преобразования, обратные к преобразованиям
(20), находим оптимальное поведение фирм в тендере.
Выводы. В разделе 2.2 сформулирована теоретико-игровая модель тендера для
двух и трех фирм, установлены ситуации равновесия в чистых стратегиях. Все результаты раздела 2.2 взяты из работы [12].
40
2.3 Теоретико-игровая модель конкуренции двух фирм
Все результаты раздела 2.3 были получены в работе [13].
Предположим, что имеются две фирмы, выполняющие однотипные работы по заказам клиентов. Совокупность потенциальных клиентов задана и предполагается, что
общая стоимость работ,выполняемых по заказу каждого из клиентов, полностью определяется их объемом. Каждая из двух фирм выбирает пороговую цену отсечения, то
есть такую цену, при которой заказ меньшей стоимости, чем цена отсечения, фирмой
не принимается.Предположим, что фирма 1 выбирает в качестве цены отсечения величину x, а фирма 2 выбирает цену отсечения y. Стоимость заказа очередного клиента на
рынке двух фирм представляет собой, вообще говоря, случайную величину τ , которая
подчиняется распределению с непрерывной функцией распределения F (z), причем на
некотором интервале (α, β), −∞ ≤ α < β ≤ ∞, функция распределения F (z) строго
монотонна и может быть несобственной функцией распределения [1]:
lim F (z) = q ≤ 1,
z→∞
при этом F (α) = 0, F (β) = q.
Если распределение случайной величины τ является несобственным, то будем предполагать, что P {τ = ∞} = 1 − q. Событие {τ = ∞} будем интерпретировать как
отсутствие клиента в текущий момент времени. Тогда из сформулированных определений вытекает, что с вероятностью 1 − q в текущий момент времени потенциального
клиента нет. Далее будем рассматривать теоретико-игровую модель, в которой фирмы
1 и 2 являются игроками.
Предположим, что поведение клиента определяется следующим правилом, если цена заказа клиента превышает цену отсечения для обеих фирм, то клиент всегда выбирает фирму, цена отсечения которой выше. Такое поведение клиента объясняется тем,
что клиент считает, что у фирмы с более высокой ценой отсечения очередь меньше и
качество выполнения заказа выше.
Таким образом, клиент с ценой заказа τ выбирает фирму 1, с ценой отсечения x,
41
при выполнении следующих событий: y < x ≤ τ < ∞ или x ≤ τ < y. Потенциальный
клиент с ценой заказа τ выбирает фирму 2, с ценой отсечения y, если выполняется
одно из следующих двух событий: x < y ≤ τ < ∞ или y ≤ τ < x.
Для того, чтобы сформулировать теоретико-игровую модель, необходимо задать
функции выигрыша игроков. Если множество потенциальных клиентов у обеих фирм
одно и то же, то клиент, обратившийся в одну из двух фирм, при условии, что его заказ
принят, потерян для другой фирмы. С учетом сказанного,в качестве теоретико-игровой
модели будем рассматривать игру с нулевой суммой, в которой выигрыш одной фирмы
по абсолютной величине совпадает с проигрышем другой фирмы.
По постановке рассматриваемая задача близка к задаче конкурентного прогнозирования [14]. Выигрыш каждой из фирм возможен только при успешном прогнозировании значения случайной величины τ , при этом, если цены отсечения совпадают, то
естественно считать, что выигрыш фирм равен нулю. Проигрыш любой из двух фирм
означает упущенную прибыль в конкурентной борьбе с другой фирмой.
Следует отметить, что издержки фирм, связанные с выполнением заказа, вообще
говоря, не известны, что согласуется с экономической реальностью, когда каждая из
фирм обеспечивает защиту служебной информации. Поэтому в теоретико-игровой модели имеет смысл рассматривать функции выигрыша, которые зависят только от известной информации, то есть от цен отсечения и от распределения случайной величины
F (z).
Следуя [14], введем в рассмотрение шкалу точности прогноза, которую будем определять с помощью функции G(z) , удовлетворяющей следующим аксиомам:
1. функция G(z) ≥ 0, z ∈ (−∞, ∞), непрерывна на числовой прямой, строго монотонна на интервале (α, β);
2. существуют пределы: lim G(z) = 0, lim G(z) = g, при этом G(α) = 0, G(β) = g;
z→−∞
z→∞
3. если x1 < y1 , x2 < y2 и P {x1 ≤ τ < y1 } = P {x2 ≤ τ < y2 }, то G(y1 ) − G(x1 ) =
G(y2 ) − G(x2 ).
42
Третья аксиома означает, что при условии одинаковой вероятности двух прогнозов относительное качество этих прогнозов должно быть одинаковым. В разделе 2.1
доказана теорема 7. Для удобства изложения приведем ее формулировку.
Теорема 7. Если выполнены аксиомы 1, 2, 3, то G(z) = gq F (z), при любом z ∈ R.
Из теоремы следует, что при условии справедливости сформулированных аксиом,
функция G(z) должна быть пропорциональна функции распределения F (z). Будем далее предполагать, что с выбором каждого клиента связана теоретико-игровая модель,
причем в этой теоретико-игровой модели выигрывает та фирма, в которую обратился
очередной клиент, при этом величину выигрыша фирмы определим как абсолютную
величину разности значений G(x) и G(y). Такое определение величины выигрыша позволяет учесть относительную точность прогноза значения случайной величины τ.
Запишем выигрыш фирмы 1 в зависимости от конкретной реализации случайной
величины τ :
f1 (x, y, τ ) = (G(y) − G(x))I{x ≤ τ < y} − (G(y) − G(x))I{x < y ≤ τ < ∞}−
Q
−(G(x) − G(y))I{y ≤ τ < x} + (G(x) − G(y))I{y < x ≤ τ < ∞},
положим
f2 (x, y, τ ) = −Q
f1 (x, y, τ ),
Q
здесь предполагается, что x, y ∈ (α, β).
Кроме того, предполагается, что при осуществлении события {τ = ∞} выигрыш
обоих игроков равен нулю.
f1 (x, y, τ ) и Q
f2 (x, y, τ ) задают выигрыш соответственно первого и втоФункции Q
рого игроков в зависимости от выбранных ими цен отсечения x, y ∈ (α, β) и в зависимости от реализовавшегося значения случайной величины τ . Для полного задания
теоретико-игровой модели необходимо перейти к ожидаемым выигрышам, то есть необходимо вычислить математические ожидания выигрышей относительно распределения
случайной величины τ и, следовательно, получить усредненные значения выигрышей
по всей совокупности возможных значений. В начале осуществим замену переменных,
43
которая позволит перейти к стандартизованному заданию множество игровых стратегий и далее рассматривать теоретико-игровую модель на квадрате.
Введем переменные u =
1
q F (x),
v =
1
q F (x)
и случайную величину ζ =
1
q F (τ ).
Нетрудно заметить, что случайная величина ζ принимает значения из промежутка
[0,1], кроме того u, v ∈ [0, 1].
Найдем функцию распределения случайной величины ζ:
Fζ (t) = P {ζ < t} = P {F (τ ) < qt} = P {τ < F −1 (qt)} = F (F −1 (qt)) = qt,
при t ∈ [0, 1).
Функция распределения Fζ (t) = P {ζ < t} непрерывна слева в каждой точке числовой прямой, поэтому Fζ (1) = q.
Будем полагать, что Fζ (t) = q при t > 1. С вероятностью 1 − q не появляются реализации случайной величины ζ. Другими словами, будем считать, что при появлении
события {τ = ∞} случайная величина ζ не определена, выигрыш обоих игроков при
этом равен нулю.
Нетрудно видеть, что в новых переменных выигрыш игрока 1, зависящий от реализации τ , может быть записан в виде
f1 (x, y, τ ) = g(v − u)I{u ≤ ζ < v} − g(v − u)I{u < v ≤ ζ} − g(u − v)I{v ≤ ζ < u}+
Q
f1 (u, v, ζ),
+g(u − v)I{v < u ≤ ζ} = g H
f2 (u, v, ζ) = −H
f1 (u, v, ζ).
кроме того, H
В качестве функций выигрыша обеих фирм будем рассматривать математические ожидания построенных выше выражений относительно распределения случайной величины
τ:
f1 (u, v, ζ), H2 (u, v) = E H
f2 (u, v, ζ)
H1 (u, v) = E H
Нетрудно показать, что функция выигрыша игрока 1 имеет вид:
q(v − u)(2v − u − 1), u < v;
0,
u=v;
H1 (u, v) =
q(u − v)(v + 1 − 2u), u > v.
44
Множества стратегий фирм представляют собой промежуток [0, 1] = U = V .
Определена игра на квадрате Γ =< U, V, H1 (u, v) >, где функция выигрыша второго
игрока H2 (u, v) = −H1 (u, v). Сформулированная игра представляет собой теоретикоигровую модель выбора фирмы клиентом, в которой фирмы являются игроками.
Теорема 13. В игре Γ существует ситуация равновесия в смешанных стратегиях
(P1∗ , P2∗ ), причем оптимальные стратегии игроков имеют вид
P1∗ (0) = P2∗ (0) =
(1)
(1) 2
1
, P1∗
= P2∗
= .
3
2
2
3
Ситуация равновесия (P1∗ , P2∗ ) единственна в классе смешанных стратегий с носителем, состоящим из двух точек.
Проделывая обратное преобразование, получаем ситуацию равновесия в исходной
игровой модели.
Выводы. В разделе 2.3 сформулирована теоретико-игровая модель конкуренции
двух, найдены ситуации равновесия в чистых стратегиях. Результаты раздела 2.2 были
получены в работе [13].
45
Заключение.
В работе рассмотрены задачи выбора возможных значений изучаемых показателей
в условиях неопределенности. В первой главе изучаются задачи прогнозирования момента осуществления некоторого события в условиях неопределенности при наличии
различных уровней информированности. Во второй главе рассматриваются задачи конкурентного прогнозирования в рамках некоторых теоретико-игровых моделей. Общей
объединяющей идеей всех рассмотренных в первой и второй главах задач является
идея использования несобственных вероятностных распределений. Несобственные вероятностные распределения были введены В. Феллером в его фундаментальной монографии [1] в связи с задачами теории восстановления и теории надежности. В данной
работе применение несобственных распределений систематически обсуждается в задачах прогнозирования в условиях неопределенности и в условиях возможной конкуренции в рамках теоретико-игровых моделей. В работе получены оптимальные решения по
сформулированным критериям оптимальности для рассмотренных задач выбора. Все
результаты данной работы были ранее опубликованы в статьях [4, 5, 6, 11, 12, 13].
46
Литература
1. Феллер В. Введение в теорию вероятностей и её приложения: в 2 т./пер. с англ.
Ю.В. Прохорова; под ред. Б.Б. Дынкина. М.: Мир, 1984. Т. 2, 752 с.
2. Якушев В. П., Буре В. М. Методологические подходы к оценке оптимального момента времени проведения агротехнологических мероприятий // Докл. Рос. академии
сельскохоз. наук, 2001. № 4, С. 27–29.
3. Якушев В. П., Буре В. М. Статистическая оценка распределения оптимального
момента времени проведения агротехнологических мероприятий // Докл. Рос. Академии сельскохоз. наук, 2002. № 3, С. 11–13.
4. Буре А. В. Оценка момента времени кризисного состояния больного по медицинским базам // Труды XLIII междунар. науч. конференции аспирантов и студентов /
Под ред. Н. В. Смирнова, Т. Е. Смирновой. СПб: Изд-во С.-Петерб. ун-та, 2012. С. 272–
276.
5. Буре А. В. Оценка момента времени появления события // Вестн. С.-Петерб.
ун-та. Сер. 10. Прикладная математика, Информатика, Процессы управления. Вып. 1.
2014. С. 23 – 29.
6. Буре А. В. Задача оценивания момента времени наступления события для квадратичной функции потерь // Вестн. С.-Петерб. ун-та. Сер. 10. Прикладная математика,
Информатика, Процессы управления. Вып. 2. 2016. С. ???????.
7. Kash Barker, Yacov Y. Haimes Assessing uncertainty in extreme events: Applications
to risk-based decision making in interdependent infrastructure sectors // Reliability
Engineering and System Safety. 2009. Vol. 94, issue 4. P. 830–837.
8. Gordon J. Savage and Young Kap Son
An Extreme-Value Event Approach for
Frequency-Domain Performance Reliability//IEEE TRANSACTIONS ON RELIABILITY,
2015, Vol. PP, is. 99, pp. 1-11 (DOI: 10.1109/TR.2015.2491601)
9. Rajesh Ganesan, PoornimaBalakrishna, Lance Sherry Improving quality of prediction
in highly dynamic environments using approximate dynamic programming // Quality and
Reliability Engineering International, Volume26, Issue 7, November2010, Pages: 717–732
47
10. A. Mancuso, M. Compare, A. Salo, E. Zio, T. Laakso Risk-based optimization of
pipe inspections in large underground networks with imprecise information // Reliability
Engineering and System Safety, Volume 152, August 2016, Pages 228-238
11. Буре А. В. Конкурентное прогнозирование в случае несобственного распределения вероятностей // Вестн. С.-Петерб. ун-та. Сер. 10. Прикладная математика,
Информатика, Процессы управления. Вып. 2. 2014. С. 19 – 26.
12. Буре А. В. Об одной теоретико-игровой модели тендера // Вестн. С.-Петерб.
ун-та. Сер. 10. Прикладная математика, Информатика, Процессы управления. Вып. 1.
2015. С. 25 – 32.
13. Карелин В. В., Буре А. В. Теоретико-игровая модель конкуренции двух фирм с
несобственным распределением стоимости заказа // Сборник трудов VII Международной конференции «Современные методы прикладной математики, теории управления
и компьютерных технологий (ПМТУКТ-2014)», Воронеж, 14 – 21 сентября, 2014/ Воронеж: изд. «Научная книга», 2014, с. 180 - 183.
14. Буре В. М., Смолянская Е. А. Конкурентное прогнозирование // Вестн. С.Петерб. ун-та. Сер. 1. Математика, Механика, Астрономия. Вып. 1. 2000. С. 16 - 20.
15. Sakaguchi M., Szajowski K. Competitive prediction of a random variable // Math.
Japonica. 1996. Vol. 43, N 3. P. 461-472.
16. Мазалов В. В., Сакагучи М. Равновесиевбескоалиционнойигре n лицс выбором
момента времени // Математическая теория игр и ее приложения. 2009. Т.1. Вып. 1.
С. 67 – 86.
17. Петросян Л. А., Зенкевич Н. А., Шевкопляс Е. В. Теория игр. СПб.: БХВПетербург, 2012, 432 с.
18. Mazalov V. V., Nosalskaya T. E., Tokareva J. S. Stochastic Cake Division Protocol
// Intern. Game Theory Review. 2014, Vol. 16, N 2. - P.1440009.
19. Мазалов В. В., Токарева Ю. С. Теоретико-игровые модели проведения конкурсов
//Математическая теория игр и ее приложения. 2010. Т. 2, вып 2. С. 66-78.
48
Отзывы:
Авторизуйтесь, чтобы оставить отзыв