Санкт-Петербургский государственный университет
Кафедра математической теории игр и
статистических решений
Касимова Яна Александровна
Выпускная квалификационная работа
бакалавра
Теоретико-игровые модели
конкуренции в области исследований и
разработок
Направление 010400
Прикладная математика, фундаментальная информатика
и основы программирования
Научный руководитель,
кандидат физ.-мат. наук,
доцент
Зенкевич Н. А.
Санкт-Петербург
2016
Содержание
Введение . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
Постановка задачи . . . . . . . . . . . . . . . . . . . . . .
6
Обзор литературы . . . . . . . . . . . . . . . . . . . . . .
8
Глава 1. Теоретико-игровая модель патентной гонки пуассоновского типа . . . . . . . . . . . . . . . . . . . . . .
10
1.1. Стохастический процесс . . . . . . . . . . . . . . .
10
1.2. Пуассоновский процесс . . . . . . . . . . . . . . . .
11
1.3. Построение и анализ модели . . . . . . . . . . . . .
12
1.4. Решение числового примера . . . . . . . . . . . . .
18
1.5. Результаты численного анализа чувствительности
равновесия по Нэшу от параметров модели . . . .
20
Глава 2. Стохастическая дифференциальная игра патентной гонки . . . . . . . . . . . . . . . . . . . . . . . . .
23
2.1. Экспоненциальная игра . . . . . . . . . . . . . . .
24
2.2. Постановка стохастической дифференциальной игры 25
2.3. Решение дифференциальной игры . . . . . . . . .
27
2.4. Результаты численного анализа чувствительности
равновесия по Нэшу от параметров модели . . . .
30
Глава 3. Стохастическая многошаговая игра патентной
гонки . . . . . . . . . . . . . . . . . . . . . . . . . . . .
34
3.1. Постановка стохастической многошаговой игры . .
34
2
3.2. Решение стохастической многошаговой игры . . .
37
3.3. Решение числового примера стохастической многошаговой игры . . . . . . . . . . . . . . . . . . . . .
41
Выводы . . . . . . . . . . . . . . . . . . . . . . . . . . . .
46
Заключение . . . . . . . . . . . . . . . . . . . . . . . . . .
47
Список литературы . . . . . . . . . . . . . . . . . . . . .
48
Приложение 1. Программа решения игры патентной гонки пуассоновского типа. . . . . . . . . . . . . . . . . .
52
Приложение 2. Программа решения дифференциальной
игры. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
53
Приложение 3. Программа решения стохастической игры.
54
3
Введение
Инновации в наше время являются главным конкурентным
преимуществом на рынке среди фирм, нацеленных на постоянное развитие, устойчивый рост, и лидерство на рынке. Это объясняется, в частности, ускорением темпа изменений, которые
происходят в глобальной экономике. Новые технологии быстро
устаревают, а вкусы потребителей меняются, что вынуждает
фирмы постоянно пересматривать стратегии управления исследованиями и разработками. В наше время остро стоит проблема эффективного управления исследованиями и разработками
при различных условиях на рынке. Положим, что на рынке
есть монополист и фирма, которая только собирается выйти на
рынок. Тогда инновации могут послужить фирме-новичку пропуском на рынок, и в тоже время пошатнуть позиции фирмымонополиста. Но может быть и наоборот инновации укрепят
позиции монополиста и обеспечат уверенностью, что на рынок
не проникнет ни одна фирма-новичок. Таким образом монополист и фирма-новичок будут вовлечены в соревнования, целью
которых является сделать открытие, которое приведет к производству нового продукта или улучшит технологию производства старого продукта. Такие соревнования мы будем называть
патентными гонками. Но патентные гонки ведутся не только
4
между монополистом и новичком, в них могут участвовать и
фирмы, которые занимают схожие позиции на рынке. Тогда открытие может привести к укреплению позиций на рынке фирмы победителя.
Патентные гонки, чаще всего, обладают неопределенной
продолжительностью и требуют больших вложений, поэтому
фирме, участнику патентной гонки, важно найти оптимальную
стратегию, которая максимизирует прибыль фирмы. В связи с
этим исследуются модели патентных гонок, наиболее приближенных к реальным условиям, которые помогают найти оптимальную стратегию поведения фирмы в области исследований
и разработок.
5
Постановка задачи
Целью моего исследования является анализ математических
моделей патентных гонок, а именно: патентной гонки пуассоновского типа, патентной гонки в форме стохастической дифференциальной игры, и дискретной модели патентной гонки
марковского типа. Для достижения поставленных целей предполагается решить следующие задачи
1. Исследование модели патентной гонки пуассоновского типа и нахождение равновесия по Нэшу;
2. Исследование модели патентной гонки в форме стохастической дифференциальной игры, численный анализ чувствительности равновесия по Нэшу от параметров модели;
3. Построение дискретной модели патентной гонки в форме
стохастической многошаговой игры марковского типа;
4. Разработка и программная реализация решения стохастической многошаговой игры.
5. Расчет численных примеров, решения моделей.
Работа организована следующим образом: Глава 1 посвящена
описанию модели патентной гонки пуассоновского типа, ее анализу и поиску равновесия по Нэшу в этой модели. В Главе 2
6
описана модель патентной гонки в форме стохастической дифференциальной игры и проведен анализ численный анализ чувствительности решения от параметров задачи. Глава 3 посвящена построению дискретной модели патентной гонки марковского типа и алгоритма нахождения равновесия по Нэшу. В
приложении приведены программы численных расчетов примеров.
7
Обзор литературы
В данной работе рассматриваются две модели патентных гонок: патентная гонка пуассоновского типа и патентная гонка
как стохастическая дифференциальная игра. Концептуально
модель пуассоновской патентной гонки впервые была сформулирована Tirole в [1] и развита в работе Agnion [2]. Эта модель
основана на более ранних работах по анализу конкуренции в области исследований и разработок (ИР) [3–5]. В последнее время
интерес к такого рода моделям опять вырос, поскольку они лежат в основе стохастических дифференциальных игр в области
исследований и разработок [6–8]. Также использовалась работа Шевкопляс Е.В.[9] по исследованию стохастических дифференциальных игр со случайной продолжительностью, в которой подробно разобрана функция выигрыша игрока. Вторая
модель патентной гонки в форме стохастической дифференциальной игры между N -лиц была предложена Dockner [10].
Данная модель основана на ранних работах Reinganum[11], где
игроки выбирали свои стратегии независимо от знаний, которые игроки накопили за прошедшее время. Однако в работах
Mehlmann[12] стратегии игроков уже зависели от накопленных
опыта и знаний. Данная модель получила развитие в работе
Keller [13] и послужила построению новой модели, описанной в
8
работе Doraszleski[14], где время уже имело распределение, отличное от экспоненциального. Различные модификации данной
модели патентной гонки были рассмотрены в [15], где прибыль
участников патентной гонки зависела от времени, т.е. имела
ставку дисконтирования. Построенная в третьей главе модель
патентной гонки в форме стохастической многошаговой игры
марковского типа была основана на работах Fudenberga [16], где
патентная гонка состояла из двух стадий. Результатом первой
стадии являлось промежуточное (вспомогательное) открытие.
Затем гонка переходила на вторую стадию, окончанием которой было само открытие и получение патента. При разработке
алгоритма использованы результаты работы [17], в которой построено равновесие для игры марковского типа.
9
Глава 1. Теоретико-игровая модель
патентной гонки пуассоновского типа
В данной главе мы рассмотрим простую модель патентной гонки пуассоновского типа, решим числовой пример и проведем
анализ чувствительности равновесия по Нэшу от параметров
модели. Для построения модели патентной гонки пуассоновского типа нам потребуются понятия стохастического [13] и пуассоновского процесса.
1.1. Стохастический процесс
Определение 1.1 Дано вероятностное пространство hΩ, z, P i,
где Ω — это множество элементарных событий, z — это σалгебра подмножеств множества Ω, а P — это вероятностная
мера, заданная на z. Пусть T — это временной промежуток,
T ⊂ R+. Тогда стохастический процесс это набор случайных
величин {xt}t∈T̃ , определенных на hΩ, z, P i, и xt ∈ Rn. Стохастический процесс можно представить при помощи случайной
функции:
(t, ω) 7→ x(t, ω) : T × Ω 7→ Rn.
где t ∈ T̃ .
Определение 1.2 Если мы зафиксируем t ∈ T то получим
10
случайную величину:
ω 7→ xt(ω), ω ∈ Ω.
Для каждого элементарного события ω ∈ Ω, траектория случайного процесса определяется по формуле:
t 7→ xt(ω), t ∈ T.
Определение 1.3 Стохастический процесс xt — стационарный,
если xt1 , ..., xtn и xt(1+s) , ..., xt(n+s) имеют одинаковые вероятностные характеристики (плотность распределения, функция распределения) для любого n и s, т.е. вероятностные характеристики не меняется при изменении начала отсчета времени наблюдения на произвольную величину s.
1.2. Пуассоновский процесс
Рассмотрим стационарный случайный процесс — пуассоновский процесс [18].
Определение 1.4 Пуассоновским процессом с параметром λ > 0 называют случайный процесс x(t, ω), t ∈ T = [0, ∞),
обладающий свойствами:
1. x(0, ω) ≡ 0;
11
2. для любых N > 1 и tk ∈ T , k = 1, ..., N : 0 = t0 < t1 <
... < tN случайные величины x(tk , ω) − x(tk−1, ω), будут
независимыми
3. для любых t1, t2 ∈ T , таких, что 0 6 t1 < t2, случайная величина x(t2, ω) − x(t1, ω) распределена по закону Пуассона
с параметром λ (t2 − t1), т.е.
[λ (t2 − t1)]k e−λ(t2−t1)
P [x(t2, ω)−x(t1, ω) = K] =
,
k!
k = 0, ..., N.
1.3. Построение и анализ модели
В данной главе рассмотрена модель патентной гонки пуассоновского типа между монополистом(игрок 1, А) и новичком(игрок 2, Е). В ней мы учитываем затраты на текущие
ИР и не берем в рассмотрение опыт, накопленный двумя игроками раннее, что существенно упрощает нам анализ данной
модели. Патентная гонка пуассоновского типа дает ответ на
вопрос, является ли монополист более склонным к инновациям, чем новичок. Сам патент, за который борются игроки, может послужить как улучшению технологии производства определенного продукта, так и созданию нового товара в сегменте
рынка, который до инновации занимала первая фирма - монополист. Предполагается, что фирма, которая первой осваивает
12
новую технологию, приобретает и использует патент, который
имеет неограниченный срок действия. Конкуренция в области
ИР между двумя фирмами характеризуется интенсивностями
инвестиций на исследования, заданными в виде функций времени x1(t) ∈ R+1 и x2(t) ∈ R+1, t ∈ [0, ∞). В каждый момент t,
если ни одна из фирм не сделала открытие, игра, начавшаяся
в этот момент, идентична первоначальной. Поэтому стратегии
игроков x1 и x2 не зависят от времени. Так как мы рассматриваем патентную гонку без памяти, то время, когда фирма i
сделает открытие будет иметь экспоненциальное распределение
и вероятность для фирмы сделать открытие в момент t будет
зависеть только от интенсивности ее инвестиций в этот период.
Будем предполагать, что функция распределения Fi(x, t) того,
что фирма i сделает открытие до момента t при уровне инвестиций x имеет вид:
Fi(xi, t) = P(Ti(x) 6 t) = 1 − e−h(x) t, t ∈ [0, ∞),
(1.1)
где Ti(xi) - время, когда фирма i сделает открытие, h(x)
— заданная дважды дифференцируемая функция, удовлетворяющая следующим условиям:
h(x) ≥ 0, x ≥ 0,
(1.2)
h00(x) ≤ 0 , x ≥ 0,
(1.3)
13
h0(x) ≥ 0 , x ≥ 0,
(1.4)
lim h0(x) = 0 = h(0).
(1.5)
x→∞
В предположениях модели:
P(Ti(xi) ∈ (t, t + dt||Ti(xi) > t)) = h(xi) dt, t ∈ [0, ∞).
(1.6)
Формула (1.6) следует из свойства экспоненциального распределения, позволяющего не учитывать опыт и знания, которые
фирмы накопили ко времени t, т.е. h(xi) dt — это условная вероятность того, что открытие произошло во временном промежутке (t, t + dt) если до момента t открытия не было.
Пусть игра начинается в момент t0 и заканчивается, когда одна из фирм сделала первой открытие, т.е выиграла патентную
гонку. Пусть Tbi-время, когда фирма i первой сделает открытие
в патентной гонке, т.е. Tbi=minj6=i T (xj ). Тогда Tbi также имеет
экспоненциальное распределение F (t). По определению функции распределения:
F (t) = P (Tbi < t).
По свойству распределения вероятностей
P (Tbi < t) = 1 − P (Tbi > t)
По условию, что Tbi = minj6=i T (xj ),получаем
P (Tbi > t) = P (min T (xj ) > t).
j6=i
14
P (min T (xj ) > t) =
j6=i
= P (T (x1) > t) P (T (x2) > t)...(P (T (xi−1) > t))(P (T (xi+1) > t))...
P (T (xn) > t).
Так как Ti(xi) — независимые величины. Используем снова
определение функции распределения
P (T (x1) > t) P (T (x2) > t)...(P (T (xi−1) > t))(P (T (xi+1) > t))...P (T (x
= (1 − F1(t))(1 − F2(t))...(1 − Fi−1(t))(1 − Fi+1(t))...(1 − Fn(t)).
т. е
Y
F (t) = 1 − 1 − (1 − Fj (t))
j6=i
Тогда
Y
F (t) = 1 − (1 − (1 − e−h(xj ) t)).
j6=i
−
F (t) = P (Tbi 6 t) = 1 − e
P
j6=i
h(xj ) t
.
(1.7)
Пусть P1A прибыль монополиста до получения патента, P1W его
прибыль, если он выиграл патентную гонку и P1L если проиграл, P2E прибыль новичка, если он первый сделал открытие.
Тогда интегральный выигрыш в игре с предписанной продолжительностью [t0, T ], выражается следующим образом:
Z T
W
L
P
P
P1A − x1 + h(x1) 1 + h(x2) 1 e−r t dt.
r
r
t0
15
(1.8)
где r ≥ 0 - заданная процентная ставка.
Так как в нашей постановке момент окончания игры Tbi — величина случайная, то под выигрышем в игре будем понимать
математическое ожидание от (1.8), т. е:
T
Z
E
t0
W
L
P
P
P1A − x1 + h(x1) 1 + h(x2) 1 e−r t dt .
r
r
(1.9)
Таким образом, ожидаемый выигрыш представляет собой следующий интегральный функционал:
V 1(x1, x2) =
Z
∞Z t
t0
t0
W
L
P
P
P1A − x1 + h(x1) 1 + h(x2) 1 e−r t dt dF (t).
r
r
(1.10)
Далее, как было показано в [9], с помощью перестановки интегралов в интегральном функционале (1.10), ожидаемый выигрыш может быть представлен в виде:
Z
∞
t0
W
L
P
P
P1A − x1 + h(x1) 1 + h(x2) 1 e−r t (1 − F (t))dt.
r
r
(1.18)
т. е:
1
Z
V (x1, x2) =
∞
−(h(x1 )+h(x2 )) t
e
×[P1A−x1+h(x1)
0
P1L
P1W
+h(x2)
]×e−r t d
r
r
(1.11)
Рассуждая аналогично, ожидаемая прибыль новичка вычисляется следующим образом
16
Интегральный выигрыш новичка:
Z T
P2E
(h(x2)
− x2) e−r t dt
r
t0
Ожидаемый выигрыш новичка:
Z T
P2E
E
(h(x2)
− x2) e−r t dt ⇒
r
t0
Z ∞Z T
P2E
2
V (x1, x2) =
(h(x2)
− x2) e−r t dt dF (t)
r
t0
t0
Переходим от двойного интеграла к следующему виду:
Z ∞
P2E
− x2) e−r t (1 − F (t))dt
(h(x2)
r
t0
т. е:
2
Z
∞
−(h(x1 )+h(x2 )) t
e
V (x1, x2) =
0
P2E
× (h(x2)
− x2) × e−r t dt.
r
(1.12)
Вычисляя интегралы в (1.11) и (1.12), мы получаем выигрыши
игроков в явном виде:
V 1(x1, x2) =
P1A
P1W
h(x1) r
L
− x1 +
+ h(x2) Pr1
,
r + h(x1) + h(x2)
(1.13)
PE
h(x2) r2 − x2
2
V (x1, x2) =
.
r + (h(x1) + h(x2))
(1.14)
В итоге мы построим бесконечную игру двух лиц в нормальной
форме: G2 = hX, X, V 1, V 2i , где X={x|x ≥ 0} - множества
стратегий игрока 1,и 2, а функции выигрыша V 1, V 2 заданы
17
(1.13) и (1.14) соответственно.
Рассмотрим вторые частные производные от V 1 и V 2:
2
1
00
∂ V (x1, x2) h
=
∂ 2 x1
(x1)(P1W
+
P1W
h(x2) r
P1A
−
+ x1 −
(r + h(x1) + h(x2))4
P1L
h(x2) r )
,
(1.15)
P2E
∂ 2V 2(x1, x2) h00(x2)(P2E + h(x1) r − x2)
=
,
∂ 2 x2
(r + h(x1) + h(x2))4
(1.16)
Учитывая полученные результаты (1.15) - (1.16) и предположения (1.2) - (1.5), а также теорему[17], в игре G2 существует
равновесие по Нэшу в чистых стратегиях, которое находится
из условий первого порядка:
1
(h0(x∗1 ) + h0(x∗1 ) h(x∗2 )) P1W − h0(x∗1 ) P1A − r−
r
L
∗
∗
∗ P1
− h(x1 ) − h(x2 ) − h(x2 )
+ x1 h0(x∗1 ) = 0; (1.17)
r
1
(h0(x∗2 ) + h0(x∗2 ) h(x∗1 )) P2E − r − h(x∗1 ) − h(x∗2 ) + x∗2 h0(x∗2 ) = 0
r
(1.18)
В общем случае система, из условий (1.17) - (1.18) не имеет
аналитического решения.
1.4. Решение числового примера
В данном подразделе мы рассмотрим базовый пример при значениях постоянных задачи, удовлетворяющих всем ограниче18
ниям, которые были получены при нахождении ее решений.
Подсчеты, результаты которых будут приведены в этом подразделе, осуществлялись при помощи программы, написанной
в среде MATLAB (см.приложение 1).
Свойствам (1.2)-(1.5), заданным для h(x) удовлетворяет класс
1
функций: h(x) = a x k , при k ∈ Z, k > 1, a > 0, который и
выбран в качестве базового примера:
1
h(x) = a x k ≥ 0, x ≥ 0,
h0(x) =
a
− k−1
k
≥ 0, x ≥ 0,
kx
a (k − 1)
h00(x) = −
≤ 0, x ≥ 0,
− 2k−1
2
k x k
a
lim h0(x) =
= 0.
− k−1
x→∞
kx k
(1.19)
(1.20)
(1.21)
(1.22);
Для данного класса функций h(x) численно найдено равновесие
по Нэшу.
В частности, если:a= 1; k= 2; P1W = 11; P2E = 6; P1L= 4; P1A=
5; r= 0,9;
то равновесие по Нэшу имеет вид x
b1= 1,6985 , x
b2= 0,9864,
а выигрыши в равновесии равны: Vb 1= 0 , Vb 2= 4,6947 соответственно (см.приложение 1).
Прибыль монополиста, если он сделает открытие, больше чем
его прибыль до открытия и больше чем прибыль новичка, если
19
открытие сделает новичок. Это значит, что расходы монополиста на ИР будут больше чем у новичка. Но так как процентная
ставка близка к единице, выигрыш новичка в ситуации равновесия по Нэшу будет больше, чем у монополиста.
1.5. Результаты численного анализа чувствительности
равновесия по Нэшу от параметров модели
Анализ чувствительности представляет собой оценку влияния
параметров модели на ожидаемые выигрыши игроков в положении равновесия по Нэшу. Для численного анализа мы выбрали параметры r, k, поскольку от них величины V 1(r, k) и
V 2(r, k) зависят не линейно. В этом параграфе численный анализ чувствительности проведен для изложенного базового примера в §1.4. Рассмотрим зависимость между прибылью монополиста в положении равновесия по Нэшу V 1 от процентной
ставки r, т. е зафиксируем все остальные параметры модели и
будем изменять только параметр r. Пусть r у нас изменяется
от 0.1 до 0.9, по определению процентной ставки, при ее увеличении уменьшается ожидаемый доход, и, действительно, при
возрастании процентной ставки мы видим как прибыль монополиста в положении равновесия по Нэшу уменьшается. Это
можно заметить на рис. 1.1(a). Прибыль новичка в положении
20
равновесия по Нэшу, аналогично прибыли монополиста в положении равновесия, уменьшается при возрастании процентной
ставки r от 0.1 до 0.9, что видно на рис.1.1(b). Изучим зависимость прибыли монополиста в положении равновесия по Нэшу от параметра k, напомним что параметр k входит в состав
функции h(x)
h(x) = a x1/k
Учитывая ограничения на параметр k, что k ∈ Z, k > 1, зафиксируем все остальные параметры модели и будем изменять k от
2 до 10. Зависимость прибыли монополиста в положении равновесия от параметра k представляет собой кусочно-линейную
функцию, как видно на рис.1.2(a), но поскольку масштаб оси
ординат — 10−11, то колебания незначительны и прибыль монополиста в положении равновесия приблизительно равна нулю.
Рассмотрим зависимость прибыли новичка в положении равновесия по Нэшу от параметра k. Также, учитывая ограничения на k, будем изменять данный параметр в таком же диапазоне, как и в случае с прибылью монополиста, т. е от 2 до 10.
Заметим, что при увеличении параметра k уменьшается прибыль новичка в положении равновесия по Нэшу, что видно на
рис.1.2(b).
21
Рис. 1.1: Зависимость V 1 (r) и V 2 (r) от параметра r
Рис. 1.2: Зависимость V 1 (k) и V 2 (k) от параметра k
22
Глава 2. Стохастическая
дифференциальная игра патентной гонки
Теоретико-игровой подход к ИР рассматривает инновации
как нечто развивающееся в конкурентной среде. Иногда одна мысль, порожденная ИР служит началом технологическому
прорыву. Усилия, которые фирма тратит на ИР, влияют на вероятность, что данная фирма первой сделает открытие. Когда
фирма выигрывает патентную гонку предполагается, что она
занимает позицию монополиста на рынке[10].
Стохастическая дифференциальная игра в области ИР основывается на трех предположениях. Во-первых, ни одна из фирм
заранее не знает сколько она должна потратить на ИР. Вовторых, возможны несколько путей, приводящих к победе в
патентной гонке. В-третьих, область ИР требует затрат, но она
приводит к накоплению опыта и знаний, которые повышают
вероятность победы.
В данной главе мы рассмотрим стохастическую дифференциальную игру в области ИР, модель которой была предложена
в [10], а затем развита в [13], найдем ее решение и проведем
анализ чувствительности равновесия по Нэшу от параметров
модели. Для анализа модели нам потребуется понятие экспоненциальной игры[10].
23
2.1. Экспоненциальная игра
Рассмотрим подкласс стохастических дифференцированных
игр — экспоненциальные игры. Это класс дифференциальных
игр, в которых уравнение, описывающее состояние системы
представимо в виде:
ẋ(t) = f (u1(t), ..., uN (t), t),
(2.1)
где ui(t) ∈ Rm, ∀i = 1, ..., n — это управления (положим, что в
игре участвуют N игроков), x(t) ∈ Rn — вектор, описывающий
состояние системы в момент времени t. Функция выигрыша игрока i равна:
i
Z
J =
T
e−r t Li(u1(t), ..., uN (t), t) e−λi x(t) dt,
(2.2)
0
где λi ∈ Rn — постоянный вектор. Особенность экспоненциальных игр, заключается в том, что вектор, описывающий состояние системы x(t) входит в функцию выигрыша в качестве
степени экспоненты. Экспоненциальную игру можно преобразовать в линейную игру, т. е вектор x(t) будет входить в функцию выигрыша линейно:
y i(t) = e−λi x(t),
24
i = 1, 2.
(2.3)
Дифференцируя (2.1) по времени, получим функцию выигрыша в виде:
i
Z
J =
T
e−r t Li(u1(t), ..., uN (t), t) y i(t) dt.
(2.4)
0
Таким образом, из экспоненциальной игры мы получили линейную игру.
2.2. Постановка стохастической дифференциальной игры
Пусть N фирм(игроков) участвуют в патентной гонке.
Время, когда i-ая фирма сделает открытие — это случайная величина τi, имеющая распределение вероятностей Fi(t) = P(τi 6
t). Предположим, что между фирмами не происходит обмена
знаний и опыта в области ИР, тогда τi стохастически независима. Обозначим время, когда одна из фирм сделала первой
открытие τ =min(τi | i=1,2,...,N). Фирма, пусть будет под номером k, у которой τk =τ , является победителем в патентной
гонке:
P(τ 6 t) = 1 −
N
Y
[1 − Fi(t)].
(2.5)
i=1
Пусть ui(t)> 0 описывает сколько усилий фирма i потратила на
ИР. И рассмотрим (условную)вероятность что фирма i первой
сделает открытие в момент t, при условии, что ранее ни одна из
25
фирм не сделала открытие, также предполагается, что данная
вероятность пропорциональна ui(t). Тогда имеем:
Ḟi(t)
= λ ui(t) = hi(t),
[1 − Fi(t)]
Fi(0) = 0
(2.6)
где λ> 0 константа.
Пусть PI — это чистая прибыль, которую получит фирма, сделавшая открытие первой, предполагается что PI константа,
следовательно не зависит от момента времени, когда произошло открытие. PF — это чистая прибыль, которую получат
остальные участники патентной гонки после открытия, предполагается что PF также константа.
Предположим, что PI >PF , а момент окончания патентной гонки фиксирован и равен T . Затраты на ИР равны ui(t)2, тогда
ожидаемая прибыль игрока i равна:
Z T
X
e−r t
E
PI hi(t) + PF
hj (t) −
ui(t)2 dt .
2
0
(2.7)
j6=i
Преобразуем по теореме о двойных интегралах [3] и подставим
(2.6) в (2.7) получим:
Z T
N
−r t
X
Y
e
2
λ PI ui(t) + λ PF
uj (t) −
ui(t)
[1 − Fi(t)] dt.
2
0
i=1
j6=i
(2.8)
Первое слагаемое в формуле (2.8) отражает чистую прибыль
игрока при условии, что он сделал открытие первым, второе
26
слагаемое отражает чистую прибыль игрока, если он проиграл,
а третье слагаемое — это затраты игрока на ИР.r — это процентная ставка.
Таким образом мы получили стохастическую дифференциальную игру, где u1,u2,...,uN — это управления(стратегии).
Предположим, что в самом начале патентной гонки игроки находились в состоянии равном нулю, затем когда i-ая фирма
сделала первой открытие, состояние перешло в i и осталось там
навсегда. Время переключения из одного состояния в другое —
τ.
2.3. Решение дифференциальной игры
Проинтегрировав (2.6) получаем:
− ln(1 − Fi(t)) = λ mi(t).
(2.9)
где:
ṁi(t) = ui(t),
mi(0) = 0.
(2.10)
подставляя (2.9) в (2.8) получим:
N
Z T −λ P
mj (t)
X
e−r t
j=1
e
λ PI ui(t) + λ PF
uj (t) −
ui(t)2 dt
2
0
j6=i
(2.11)
mi(t) описывает состояние i-ого игрока в момент времени t,
т.е. сколько опыта и знаний накопил i-ый игрок ко времени t.
27
Введем новую переменную y(t):
N
P
−λ
y(t) = e
mj (t)
j=1
.
(2.12)
Игроки не знают в каком состоянии находятся их соперники,
т.е. сколько опыта они накопили к моменту t, но они знают
значение y(t) в каждый момент t, которое описывает сколько
в целом игроки накопили опыта и знаний в заданной области
ИР.
Дифференцируя (2.12) по t получаем:
ẏ(t) = −λ y(t)
N
X
ui(t), y(0) = 1.
(2.13)
j=1
Таким образом мы перешли от экспоненциальной игры к линейной следующего вида:
Z T
X
e−r t
y(t) λ PI ui(t) + λ PF
uj (t) −
ui(t)2 dt,
2
0
j6=i
ẏ(t) = −λ y(t)
N
X
ui(t), y(0) = 1.
j=1
Для нахождения равновесия по Нэшу воспользуемся принципом максимума Понтрягина[7]
Построим гамильтониан для i=1,2,...,N:
i
H (y(t), ui(t), µi(t), t) = y(t) λ PI ui(t) + λ PF
X
j6=i
28
e−r t
ui(t)2
uj (t) −
2
−µi(t) λ y(t) ui(t) +
N
X
uj (t)
(2.14)
j6=i
Так как по построению гамильтониана H i(y(t), ui(t), µi(t), t)
видно, что он вогнут по ui(t) то мы можем найти максимум
из условий первого порядка.
Тогда используем условие оптимального управления:
∂H(y(t), ui(t), µi(t), t)
=0
∂ui(t)
(2.15)
Продифференцировав H i(y(t), ui(t), µi(t), t) по ui(t) получим:
ui(t) = λ er t (PI − µi(t)),
(2.16)
Уравнения Эйлера-Лагранжа:
∂H i(y(t), ui(t), µi(t), t)
µ̇i(t) = −
,
∂y(t)
µi(T ) = 0.
ui(t) = −b(t) λ er t.
(2.17)
(2.18)
Таким образом мы получили 2 N + 1 уравнений для 2 N + 1
переменных y, µi, ui, i = 1, 2, ..., N .
Подставим (2.17) в (2.13) и получим:
ẏ(t) = −λ2 y(t) N b(t) er t,
y(0) = 1.
(2.19)
Используя (2.17), (2.18) и (2.19) приходим к уравнению Бернул29
ли:
λ2 er t
ḃ(t) = −
{(2 N −1) b2(t)+2 b(t) (1−N )(PF −PI )},
2
b(T ) = −PI .
(2.20)
которое решаем при помощи замены g(t) =
b(t) =
1
g(t)
1
b(t) .
Подставим
в уравнение (2.20), получаем:
λ2 er t
λ2 er t
ġ(t) − 2 (1 − N )(PF − PI )
g(t) =
(2 N − 1). (2.21)
2
2
приходим к линейному дифференциальному уравнению первого порядка, решив которое методом вариации постоянной, получаем решение:
b(t) = −
2 PI (PI − PF ) (N − 1)
(2 N − 1) PI − [PI + 2 (N − 1) PF ] e
1
r
(PI −PF )(N −1) λ2 (er t −er T )
.
(2.22)
Подставив данное решение в (2.17) получим:
2 λ PI (PI − PF ) (N − 1) er t
∗
u (t) =
(2 N − 1) PI − [PI + 2 (N − 1) PF ] e
1
r
(PI −PF )(N −1) λ2 (er t −er T )
(2.23)
Из (2.23) видно, что стратегии у игроков одинаковые в ситуации
равновесия по Нэшу.
2.4. Результаты численного анализа чувствительности
равновесия по Нэшу от параметров модели
Получив формулу (2.23) мы можем провести анализ зависимости u∗(t), µ∗(t) от времени, а также проанализировать зависи30
.
мость u∗(r, PI , PF ) от параметров модели r, PI и PF . Рассмотрим зависимость ui(t) от времени t. Изменяя t 0.1 до 1, при
фиксированных параметрах модели:PI = 50, PF = 2, r = 0.1,
T = 1, λ = 7, а количество игроков N = 5. На рис. 2.1(а) видно,
что u∗(t) возрастает, а поскольку расходы игроков на ИР равны u∗(t)2, то тогда можно сделать вывод, что расходы игроков
на ИР возрастают с увеличением времени. Теперь по формуле
(2.16):
u∗(t)
µ (t) = PI −
.
λ er t
∗
(2.24)
поскольку мы знаем u∗(t), подставим его в (2.24):
µ∗(t) =
−2 PI (PI − PF ) (N − 1)
(2 N − 1) PI − [PI + 2 (N − 1) PF ] e
1
r
(PI −PF )(N −1) λ2 (er t −er T )
+ PI (2.31)
Рассмотрим зависимость µ∗(t) от t, изменяя t 0.1 до 1, при аналогичных значениях параметров модели. На рис.2.1(b) видно,
что µ∗(t) убывает при увеличении времени, действительно, так
как:
u∗(t) = −b(t) λ er t,
µ∗(t) = bi(t) + PI .
то при увеличении времени t u∗(t) будет возрастать, а µ∗(t) будет убывать. Проанализируем зависимость u∗(λ, PI , PF ) от параметров λ, PI и PF . Пусть параметр λ изменяется от 1 до 10,
31
+
а другие параметры модели имеют значения:PI = 50, PF = 2,
r = 0.1, T = 1, t = 0.1, N = 5. Воспользуемся формулой
(2.23) и получим, что при увеличении λ увеличивается и u∗(λ),
что видно на рис. 2.2(а). Пусть теперь изменяется параметр
PF от 10 до 40, при заданных значениях других параметров
модели:PI = 50, r = 0.1, T = 1, λ = 7, N = 5. На рис. 2.2(b)
видно, что при увеличении данного параметра, уменьшается
u∗(PF ), т. е уменьшаются расходы игроков на ИР. Положим,
что теперь изменяется параметр PI , при заданных значениях
других параметров модели:PF = 2, r = 0.1, T = 1, λ = 7,
N = 5. На рис.2.3 видно, что при увеличении параметра PI ,
увеличивается и u∗(PI ), действительно, при увеличении выигрыша, увеличивается и заинтересованность игроков в победе и,
следовательно, они тратят на ИР больше.
Рис. 2.1: Зависимость u∗ , µ∗ от t
32
Рис. 2.2: Зависимость u∗ (t)от r, PF
Рис. 2.3: Зависимость u∗ (t) от PI
33
Глава 3. Стохастическая многошаговая игра
патентной гонки
В данной главе представлена модель патентной гонки в форме стохастической многошаговой игры марковского типа межу
N игроками,построенная на основании рассмотренных моделей
патентных гонок и модели, описанной в [16]. Также представлен разработанный алгоритм для нахождения равновесия по
Нэшу. В конце главы представлен пример игры двух лиц, для
которой получена в явном виде ситуация равновесия по Нэшу.
3.1. Постановка стохастической многошаговой игры
Рассмотрим стохастическую многошаговую игру марковского
типа на графе[17]. Для этого введем несколько определений.
Определение 3.1 Пара (X, E) называется графом, если
X — конечное множество,элементы которого называют вершинами или узлами, а E — множество упорядоченных пар на X,
т.е. подмножество множества X × X, элементы которого называют ориентированными ребрами или дугами.
Ребро, концы которого совпадают, т.е. e = (x, x), где e ∈ E,
называется петлей. Граф будем обозначать символом G
Определение 3.3 Последовательность e = (e1, e2, ..., ek , ...)
34
дуг, такая, то конец каждой предыдущей дуги совпадает с началом следующей называется путем в графе G. Длина пути
e = (e1, e2, ..., ek ) — это число l(e) = k равное количеству дуг в
последовательности e.
Определение 3.5 Взвешенный граф — это граф, каждому ребру которого поставлено в соответствие некоторое значение (вес ребра)
Связным графом будем называть граф, в котором между любой парой вершин существует как минимум один путь.
Рассмотрим патентную гонку в форме стохастической
многошаговой игры марковского типа Γ̃, на связном взвешенном графе G, в котором существует единственная вершина x0,
такая, что не существует ребра e = (y, x0), для ∀y ∈ X. Причем
будем предполагать, что D = {0, ε, 2 ε, 3 ε, ..., 1} — это множество состояний игроков, где dl c k ∈ D — состояние игрока l на
c-ом шаге в k-ом узле графа G. На первом шаге игры все игроки
находятся в узле x0 и в состоянии di00 = 0, для ∀i = {1, ..., n},
т.е. они не имеют накопленного опыта и знаний в области ИР.
Игра состоит из θ шагов, т.е. максимальное количество шагов,
которое может быть в игре. Получаем, что θ равна:
θ=
1
2 − 1.
ε
(3.1)
На первом шаге, как говорилось ранее, состояния игроков
35
di00 = 0. Однако при каждом переходе на следующий шаг игрок может изменить свое текущее состояние увеличив его на
ε либо остаться в текущем состоянии, т.е. игрок либо получает опыт и знания необходимые для патента, либо нет. Когда у
игрока i состояние dic k = 1 то значит на c-ом шаге он сделал
открытие и выиграл патентную гонку. На каждом шаге игры
игроки узнают информацию о состоянии своих соперников, т.е.
рассматривается игра с полной информацией. Целью каждого игрока, как и в прошлых моделях патентных гонок, будет
являться максимизация ожидаемой прибыли.
Рассмотрим поподробнее структуру графа G.
Каждый j-ый узел графа G (j = 1, 2, 3...) состоит из:
1. Игрового элемента — игры n лиц в нормальной форме Γj
Γj = hN̄ , U1j , ..., Unj , V1j , ..., Vnj i,
где N̄ — множество игроков, одинаковое для всех игр Γj ,
j = 0, 1, 2, ..., m, где m — количество узлов в графе G, Uij
(i = 1, ...n) — множество стратегий i-ого игрока в игре Γj ,
Vij — функция выигрыша i-ого игрока в игре Γj . Будем
полагать, что uij — это расход i-ого игрока на ИР, Uij конечно для любого игрока и любого игрового элемента.
2. Информации о состоянии игроков в патентной гонке —
36
d1c j , ..., dnc j .
Будем предполагать, что самый длинный путь в графе G называется длиной игры Γ, т.е. максимальное количество шагов
в игре Γ
3.2. Решение стохастической многошаговой игры
Для построения алгоритма нахождения равновесия по Нэшу
[177] в стохастической многошаговой игре марковского типа
нам потребуется ввести несколько определений
Определение 3.6 Информационное множество Li+1 —
множество узлов графа G, в которые игроки могут перейти
при переходе из i-ого шага игры в i + 1 шаг.
Определение 3.7 Ситуация в игре Γ u∗ = (u1∗, ..., un∗),
∗
где u1∗ = (u10 , ..., u1m∗) называется равновесием по Нэшу,если
имеет место неравенство
Ki((u1∗, ..., ui∗, ..., un∗) > Ki((u1∗, ..., ui, ..., un∗)
для всех ui ∈ Ui, i ∈ N . Поскольку мы рассматриваем многошаговую игру, то нам необходимо ввести определение подыгры
[17]
Определение 3.8 Подыгра Γˆz это часть игры Γ̃, удовлетворяющая следующим условиям:
37
1. Γˆz начинается в узле xz , где xz ∈ E;
2. Подыгра Γˆz разыгрывается на графе, который содержит
все узлы исходного графа, в которые можно попасть из
узла xz за произвольное число шагов.
Определение 3.9 Ситуация в игре Γ̃ u∗ = (u1∗, ..., un∗),
∗
где u1∗ = (u10 , ..., u1m∗) — абсолютное равновесие по Нэшу[17]
в игре Γ̃, где m — количество узлов с игровыми элементами,
если u∗z = (u1∗z , ..., un∗z ) — равновесие по Нэшу в подыгре Γˆz ,
где ui∗z — сужение стратегии u1∗ на подыгру Γˆz .
Поскольку мы рассматриваем многошаговую игру с полной информацией на конечном графе, то по теореме [19]в игре
будет существовать ситуация абсолютного равновесия по Нэшу.
Если в j-ом узле хотя бы одна из mic j = 1 (i = 1, 2, ..., n),
то в данном узле не разыгрывается игра Γj , а сразу приписываются выигрыши каждому из игроков, исходя из состояния
игроков в j-ом узле:
Vi j =
V ,
mi j = 1
0,
mic j 6 1.
c
(3.2)
где c — это количество игроков, у которых mic j = 1, т.е. количество игроков, которые сделали открытие. V — это прибыль
от открытия.
38
Вес ребра, соединяющего вершины xs и xk — это вероятность перехода игроков из s-ой вершины графа, находящейся
в информационном множестве Lc в k-ую вершину, обозначим
эту вероятность ps k c. ps k c зависит от стратегий, которые игроки выбрали в игре Γs, т.е. ps k c = ps k c(u1s, ..., uns), причем при
заданном наборе стратегий u1s, ..., uns в s-ой вершине вероятности перехода из этой вершины в сумме дают единицу.
X
ps k c = 1.
k∈Lc+1
Заметим, что если k-ый узел не принадлежит Lc+1, то вероятность перехода из вершины xs ∈ Lc в вершину xk ps k c = 0.
Поскольку в данной главе мы рассматриваем патентную гонку как многошаговую игру, то воспользуемся принципом оптимальности Беллмана: управление, в нашем случае это стратегия игрока uij , на каждом шаге должно быть оптимальным
с точки зрения процесса в целом, т.е. с какой бы вершины
мы не начали, оптимальное управление останется оптимальным. На основании принципа оптимальности, абсолютное равновесие по Нэшу определяется методом обратной индукции начиная с j-ого узла, который принадлежит информационному
множеству Lθ−1, в котором игроки находятся в состояниях —
(d1θ−1 j = 1−ε, ..., dnθ−1 j = 1−ε). В нем разыгрывается игровой
39
элемент Γj . Функция выигрыша игрока i будет иметь вид
j
Vi =
X
pj q θ−1(u1j , ..., unj ) (Viq − uij )
(3.3)
q∈Lθ
где Viq определяются по формуле (3.2). Решая игру Γj в результате получаем ситуацию равновесия по Нэшу в Γj и выигрыши
∗
в ситуации равновесия V1j , ..., Vnj
Vi
j∗
=
X
∗
∗
∗
∗
pj q θ−1(u1j , ..., unj ) (Viq − uij ).
(3.4)
q∈Lθ
∗
где uij — это оптимальная по Нэшу стратегия игрока i. Затем
рассматриваем узел xk ∈ Lθ−2, в котором у игрока i состояние
diθ−2 j = 1 − 2 ε, а у остальных игроков состояния идентичны
их состояниям в узле xj , т.е игроки находятся в состояниях —
(d1θ−2 j = 1 − ε, ..., di−1θ−2 j = 1 − ε, diθ−2 j = 1 − 2 ε, di+1θ−2 j =
1 − ε, ..., dnθ−2 j = 1 − ε). В узле xk функция выигрыша игрока
i будет иметь вид
k
Vi =
X
pj q θ−2(u1k , ..., unk ) (Viq − uik )
(3.5)
q∈Lθ−1
где Viq определяются по формуле (3.2) и (3.4), т.е. выигрыш
игрока i в ситуации равновесия по Нэшу в узле xj входит в
∗
формулу (3.5) в качестве Viq , т.е. Viq = Vij , где q = k. Решаем
игру Γk и получаем ситуацию равновесия по Нэшу и выигрыши
∗
∗
в ситуации равновесия V1k , ..., Vnk . Аналогично рассматриваем все узлы графа G, которые принадлежат информационному
40
множеству Lθ−2, затем переходим к информационному множеству Lθ−3 и т.д. В итоге приходим в вершину x0 ∈ L0 и решая
игру Γ0 получаем ситуацию абсолютного равновесия по Нэшу
(u1∗, ..., un∗) в игре Γ̃ и выигрыши игроков в ситуации абсолют∗
∗
ного равновесия V10 , ..., Vn0 .
3.3. Решение числового примера стохастической многошаговой игры
Рассмотрим пример стохастической многошаговой игры между
двумя игроками на графе G, при условии, что ε = 0.5
Положим, что у игроков есть две стратегии: низкие и высокие инвестиции — это s̄ и s соответственно, причем V >> s̄.
Следовательно множества стратегий 1 и 2-ого игрока: U1j =
(s̄, s), U2j = (ȳ, y). Вероятности перехода из вершины x0, которая принадлежит L0 в вершины x1, x2, x3 ∈ L1, в нашем случае,
равны:
p0 1
0
p(u20) (1 − p(u10))
=
,
p(u10) + p(u20) − p(u20) p(u10)
где p(uij ) — вероятность что состояние i-ого игрока увеличится
на ε. Здесь есть вероятность 1−p(u10), поскольку первый игрок
не изменил своего состояния при переходе из вершины x0 в x1:
p0 2
0
(1 − p(u20)) p(u10)
.
=
p(u10) + p(u20) − p(u20) p(u10)
41
p0 3
0
p(u20) p(u10)
.
=
p(u10) + p(u20) − p(u20) p(u10)
Аналогично вычисляются вероятности перехода и из других
вершин. На рис.3.1 изображен граф G, где в каждом j-ом узле
(j = 1, 2, ...) представлены (m1c j , m2c j ).
Рис. 2.4: Граф G
42
Здесь, максимальное количество θ = 4, следовательно у
нас четыре информационных множества. Рассмотрим функции
выигрыша 1 и 2 игрока во всех узлах графа G, заметим, что
игровые элементы в узле x6 и x3 совпадают.
В узле x6 функции выигрыша равны:
V1
6
V2
6
p(u16) (1 − p(u26))
6
=
)+
(V
−
u
1
p(u16) + p(u26) − p(u26) p(u16)
p(u26) (1 − p(u16))
+
(−u16)+
6
6
6
6
p(u1 ) + p(u2 ) − p(u2 ) p(u1 )
p(u16) p(u26)
V
6
+
(
−
u
),
1
p(u16) + p(u26) − p(u26) p(u16) 2
p(u16) (1 − p(u26))
(−u26)+
=
6
6
6
6
p(u1 ) + p(u2 ) − p(u2 ) p(u1 )
p(u26) (1 − p(u16))
6
(V
−
u
)+
+
2
p(u16) + p(u26) − p(u26) p(u16)
p(u16) p(u26)
V
+
− u26),
(
6
6
6
6
p(u1 ) + p(u2 ) − p(u2 ) p(u1 ) 2
В узле x2:
V1
2
p(u12) (1 − p(u22))
1
(V
−
u
)+
=
1
p(u12) + p(u22) − p(u22) p(u12)
p(u22) (1 − p(u12))
+
(V16 − u12)+
2
2
2
2
p(u1 ) + p(u2 ) − p(u2 ) p(u1 )
p(u12) p(u22)
+
(V − u12),
2
2
2
2
p(u1 ) + p(u2 ) − p(u2 ) p(u1 )
43
V2
2
p(u12) (1 − p(u22))
2
)+
(−u
=
2
p(u12) + p(u22) − p(u22) p(u12)
p(u22) (1 − p(u12))
+
(V26 − u22)+
2
2
2
2
p(u1 ) + p(u2 ) − p(u2 ) p(u1 )
p(u12) p(u22)
2
),
(−u
+
2
p(u12) + p(u22) − p(u22) p(u12)
Рассмотрим функции выигрыша игроков в узле x1:
V1
1
V2
1
p(u11) (1 − p(u21))
(V16 − u11)+
=
1
1
1
1
p(u1 ) + p(u2 ) − p(u2 ) p(u1 )
p(u21) (1 − p(u11))
1
+
)+
(−u
1
p(u11) + p(u21) − p(u21) p(u11)
p(u11) p(u21)
+
(−u11),
1
1
1
1
p(u1 ) + p(u2 ) − p(u2 ) p(u1 )
p(u11) (1 − p(u21))
(V26 − u21)+
=
1
1
1
1
p(u1 ) + p(u2 ) − p(u2 ) p(u1 )
p(u21) (1 − p(u11))
1
+
(V
−
u
)+
2
p(u11) + p(u21) − p(u21) p(u11)
p(u11) p(u21)
1
+
(V
−
u
),
2
p(u11) + p(u21) − p(u21) p(u11)
В узле x0:
V1
0
p(u10) (1 − p(u20))
2
0
(V
−
u
)+
=
1
1
p(u10) + p(u20) − p(u20) p(u10)
p(u20) (1 − p(u10))
+
(V11 − u11)+
0
0
0
0
p(u1 ) + p(u2 ) − p(u2 ) p(u1 )
p(u10) p(u20)
+
(V13 − u10),
0
0
0
0
p(u1 ) + p(u2 ) − p(u2 ) p(u1 )
44
V2
0
p(u10) (1 − p(u20))
0
2
)+
−
u
(V
=
1
2
p(u10) + p(u20) − p(u20) p(u10)
p(u20) (1 − p(u10))
+
(V21 − u11)+
0
0
0
0
p(u1 ) + p(u2 ) − p(u2 ) p(u1 )
p(u10) p(u20)
0
3
),
−
u
(V
+
1
2
p(u10) + p(u20) − p(u20) p(u10)
Задав, числовые значения параметрам модели, найдем численное решение многошаговой игры между двумя игроками по построенному алгоритму и при помощи алгоритма Лемке-Хаусона
[20], который будем использовать при нахождении равновесия
по Нэшу в игровых элементах Γj (см. Приложение 3). Зададим ε = 0.5: p(s̄) = p(ȳ) = 0.9, p(s) = p(y) = 0.25, V = 0.9,
s̄ = ȳ = 0.8, s = y = 0.2. Равновесие по Нэшу будет иметь вид:
u1∗ = (s̄, s, s, s, s), u2∗ = (ȳ, y, y, y, y), а выигрыши в ситуации
абсолютного равновесия по Нэшу равны: V1 = 0.25, V2 = 0.25
45
Выводы
На данный момент существует множество различных моделей
патентных гонок, начиная от простых моделей, которые не учитывают ранее накопленный опыт в области ИР и до моделей со
сложной структурой, предполагающей несколько стадий развития патентных гонок. В последних моделях учитывается и
опыт и ограниченность ресурсов фирм-участников патентных
гонок и другие факторы, влияющие на состояние фирм. На
основании проанализированных в данной работе моделей патентных гонок была построена новая, отличная от существующих модель патентной гонки. Данная модель представляет из
себя стохастическую многошаговую игру, в которой учитывается опыт, приобретенный ранее фирмами-участниками. Однако,
построенную модель можно развить, добавив ограничение на
ресурсы фирм. Также интересно проанализировать построенную модель без ограничения на состояния игроков, т.е. что при
переходе на следующий шаг, игроки могут остаться в том же состоянии, в котором были. Можно было бы попробовать ввести
ставку дисконтирования в построенную модель.
46
Заключение
В работе исследованы несколько моделей патентных гонок.
Первая — патентная гонка без памяти (пуассоновского типа).
Для нее было доказано, что в явном виде невозможно найти
равновесие по Нэшу. Проведен анализ модели, разработан и
программно реализован алгоритм численного решения задачи
нахождения равновесия по Нэшу. Для базового примера проведен анализ чувствительности равновесия в зависимости от
параметров модели. Вторая модель патентной гонки представляет собой стохастическую дифференциальную игру. Для данной модели был проведен анализ чувствительности равновесия
в зависимости от параметров модели. На основании рассмотренных моделей была построена стохастическая многошаговая
игра, моделирующая патентные гонки. Для нее был разработан
и программно реализован алгоритм нахождения равновесия по
Нэшу, также рассчитан базовый пример.
47
Список литературы
1. Tirole J. The Theory of Industrial Organization. London: The
MIT Press, 1990. P. 619–623.
2. Agnion P., Howwit P. A model of growth through creative
destruction // Econometrica, 1992. Vol. 60, No 2. P. 323–351.
3. Lee T., Wilde L. Market structure and innovation: a
reformulation // The Quart. J. Econ, 1980. Vol. 194. P. 429–
436.
4. Reinganum J. F. A dynamic game of R and D: patent protection
and competitive behavior // Econometrica, 1982. Vol. 50, No 3.
P. 71–688.
5. Dasguspta P., Stiglitz J. Uncertainty, industrial structure and
the speed of reseaching and development // Bell J. Econom,
1980. No 11. P. 1–28.
6. Sennewald K. Controlled stochastic differential equations under
poisson uncertainty and with unbounded utility // J. Econ.
Dynam. Control, 2007. No 31. P. 1106–1131.
7. Gayle P. G. Market structure and product innovation // Boulder
(Colorado) / University of Colorado, 2001. P. 1–15.
48
8. Sutton J. Technology and Market Structure. London: The MIT
Press, 2000. P 692.
9. Шевкопляс Е. В, Костюнин С. Ю Об упрощении интегрального выигрыша в дифференциальных играх со случайной продолжительностью // Вестник Санкт-Петербургского
университета. Серия 10: Прикладная математика. Информатика. Процессы управления. 2011. є 4. С. 47–56
10. Dockner
E. J.
Differential
Games
in
Economics
and
Management Science // Cambridge / Cambridge University
Press, 2000. P. 721.
11. Reinganum
and
D:
behavior
J. F.
patent
//
A
dynamic
protection
Econometrica,
1982.
game
and
Vol.
of
R
competitive
50,
No
3.
P. 71–688.
12. Mehlmann A. Applied Differential Games. New York: Plenum
Press, 1988. P 201.
13. Keller A. A. Stochastic differential games and queueing models
to innovation and patenting // Contributions to game theory
and management / Ed. by L. A. Petrosjan and N. A. Zenkevich.
St. Petersburg: Graduated School of Management St. Petersburg
State University, 2007. P. 245–269.
49
14. Doraszleski U. Rent Dissipation in R and D Races // The
Economics of Innovation, 2008. No 286. P. 3-13
15. Reinganum J. F. "The timing of Innovation: Research,
Development, and Diffusion"in R // Schamalensee and R.D.
Willig: Handbook of Industrial Organization(I). Amsterdam,
1989.
16. Fudenberg D., Gilbert R., Stiglitz J., Tirole J. Preemption,
leapfrogging and competition in patent races. // European
Economic Review, 1983. No 22. P. 3-31.
17. Петросян Л. А., Зенкевич Н. А., Шевкопляс Е. В. Теория
игр. СПб.: БХВ-Петербург, 2012. 432 с.
18. Петросян Л. А., Седаков А. А. Многошаговые сетевые игры
с полной информацией.// Управление большими системами.
2009. є 26-1. С. 121–132.
19. Волков И. К., Зуев С. М., Цветкова Г. М. Случайные
процессы: Учеб. для вузов / Под ред. Зарубина В. С., Крищенко А. П.-М:Изд-во МГТУ им. Баумана Н. Э., 1999. 448 с.
20. Петросян Л. А., Зенкевич Н. А., Янг Д. В. К. Динамические
игры и их приложения в менеджменте. СПб: Изд-во "Высшая школа менеджмента 2009. 415 с.
50
21. Набатова Д. С. О формировании процесса обучения решению биматричных игр с помощью алгоритма Лемке-Хоусона
// Труды МАИ, 2009. є 35. С. 1-14.
51
Приложение 1
x=fsolve(@t1,[1 1])
[k1 k2]=t1(x)
l=[1 2 3 4 5 6 7 8 9 10 ];
w1=[3.9968*10^(-15) ];
w2=[4.6947 ];
function [ y ] = h(x)
b=1;
y = b*x^(1/2);
end
function [ V1,V2 ] = t1(x)
r1=9/10;
b=11*(1/r1);
c=4*(1/r1);
d=6*(1/r1);
a=5;
s=1;
k=2;
V1=(r1*(s*(1/k))/(x(1))^(1/k)+((s*(1/k))/(x(1))^(1/k))*h1(x(2)))*b-s*(1/k)/(x(1))^(1/k)*a-r1-h1(x(1))-h1(x(2))-h1(x(2))*c+x(1)*s*(1/k)/(x(1))^(1/k);
V2=(r1*s*(1/k)/(x(2))^(1/k)+s*(1/k)/(x(2))^(1/k)*s*(x(1))^(1/k))*d-r1-s*(x(1))^(1/k)-s*(x(2))^(1/k)+x(2)*s*(1/k)/(x(2))^(1/k);
end
52
Приложение 2
p_i= 50;
p_f=2;
N=5;
r=0.1;
T=1;
lambda=7;
t=0;
u=(2*lambda*p_i*(p_i-p_f)*(N-1)*exp(r*t))/
((2*N-1)*p_i-(p_i+2*(N-1)*p_f)*exp(((p_i-p_f)*(N-1)*lambda^2*(exp(r*t)-exp(r*T)))/r))
s=zeros(1,10);
t=zeros(1,10);
for i=1:10
r1=i*0.1;
t(1,i)=r1;
s(1,i)=(2*lambda*p_i*(p_i-p_f)*(N-1)*exp(r*t(1,i)))/
((2*N-1)*p_i-(p_i+2*(N-1)*p_f)*exp(((p_i-p_f)*(N-1)*lambda^2*(exp(r*t(1,i))-exp(r*T)))/r));
end
s
plot(t,s,’r’)
53
Приложение 3
p1=0.9;
p2=0.25;
V=0.9;
x1=0.8;
x2=0.2;
r11=(1/(2-p1))*(p1*((V/2)-x1)+(1-p1)*(V-2*x1));
q11=(1/(2-p1))*(p1*((V/2)-x1)+(1-p1)*(V-2*x1));
r12=(1/(p1+p2-p1*p2))*(-(1-p1)*p2*(x1)+p1*(1-p2)*(V-x1)+p1*p2*((V/2)-x1));
q21=(1/(p1+p2-p1*p2))*((1-p2)*p1*(-x2)+p2*(1-p1)*(V-x2)+p1*p2*((V/2)-x2));
r22=(1/(2-p2))*(p2*((V/2)-x2)+(1-p2)*(V-2*x2));
q22=(1/(2-p2))*(p2*((V/2)-x2)+(1-p2)*(V-2*x2));
r21=q21;
q12=r12;
A=[r11 r12; r21 r22]
B=[q11 q12; q21 q22]
a1=0;
b1=0;
a=LemkeHowson(A,B)
b=a{2}
a=a{1}
m=r22;
k=q22;
m11=((1-p1)/(2-p1))*(-x1)+((1-p1)/(2-p1))*m+p1*(-x1)/(2-p1);
n11=((1-p1)/(2-p1))*(V-x1)+((1-p1)/(2-p1))*k+p1*(V-x1)/(2-p1);
m12=(((1-p1)*p2)/(p1+p2-p1*p2))*(-x1)+(1-p2)*p1*m/(p1+p2-p1*p2)+p1*p2*(-x1)/(p1+p2-p1*p2);
n12=(((1-p1)*p2)/(p1+p2-p1*p2))*(V-x2)+(1-p2)*p1*k/(p1+p2-p1*p2)+p1*p2*(V-x2)/(p1+p2-p1*p2);
m21=(((1-p2)*p1)/(p1+p2-p1*p2))*(-x2)+(1-p1)*p2*m/(p1+p2-p1*p2)+p1*p2*(-x2)/(p1+p2-p1*p2);
n21=(((1-p2)*p1)/(p1+p2-p1*p2))*(V-x1)+(1-p1)*p2*k/(p1+p2-p1*p2)+p1*p2*(V-x1)/(p1+p2-p1*p2);
m22=((1-p2)/(2-p2))*(-x2)+((1-p2)/(2-p2))*m+p2*(-x2)/(2-p2);
n22=((1-p2)/(2-p2))*(V-x2)+((1-p2)/(2-p2))*k+p2*(V-x2)/(2-p2);
A=[m11 m12; m21 m22];
B=[n11 n12; n21 n22];
a=LemkeHowson(A,B)
b1=a{2}
a1=a{1}
m1=m22;
k1=n22;
w11=((1-p1)/(2-p1))*m+((1-p1)/(2-p1))*(V-x1)+(p1/(2-p1))*(V-x1);
s11=((1-p1)/(2-p1))*k+((1-p1)/(2-p1))*(-x1)+(p1/(2-p1))*(-x1);
w12=((1-p1)*p2/(p1+p2-p1*p2))*m+((1-p2)*p1/(p1+p2-p1*p2))*(V-x1)+(p1*p2/(p1+p2-p1*p2))*(V-x1);
s12=((1-p1)*p2/(p1+p2-p1*p2))*k+((1-p2)*p1/(p1+p2-p1*p2))*(-x2)+(p1*p2/(p1+p2-p1*p2))*(-x2);
w21=((1-p2)*p1/(p1+p2-p1*p2))*m+((1-p1)*p2/(p1+p2-p1*p2))*(V-x2)+(p2*p1/(p1+p2-p1*p2))*(V-x2);
s21=((1-p2)*p1/(p1+p2-p1*p2))*k+((1-p1)*p2/(p1+p2-p1*p2))*(-x1)+(p2*p1/(p1+p2-p1*p2))*(-x1);
w22=((1-p2)/(2-p2))*m+((1-p2)/(2-p2))*(V-x2)+(p2/(2-p2))*(V-x2);
s22=((1-p2)/(2-p2))*k+((1-p2)/(2-p2))*(-x2)+(p2/(2-p2))*(-x2);
A=[w11 w12; w21 w22];
54
B=[s11 s12; s21 s22];
a=LemkeHowson(A,B)
b2=a{2}
a2=a{1}
m2=w22;
k2=s22;
p11=((1-p1)/(2-p1))*m1+((1-p1)/(2-p1))*m2+(p1/(2-p1))*m;
d11=((1-p1)/(2-p1))*k1+((1-p1)/(2-p1))*k2+(p1/(2-p1))*k;
p12=((1-p1)*p2/(p1+p2-p1*p2))*m1+((1-p2)*p1/(p1+p2-p1*p2))*m2+(p1*p2/(p1+p2-p1*p2))*m;
d12=((1-p1)*p2/(p1+p2-p1*p2))*k1+((1-p2)*p1/(p1+p2-p1*p2))*k2+(p1*p2/(p1+p2-p1*p2))*k;
p21=((1-p2)*p1/(p1+p2-p1*p2))*m1+((1-p1)*p2/(p1+p2-p1*p2))*m2+(p2*p1/(p1+p2-p1*p2))*m;
d21=((1-p2)*p1/(p1+p2-p1*p2))*k1+((1-p1)*p2/(p1+p2-p1*p2))*k2+(p2*p1/(p1+p2-p1*p2))*k;
p22=((1-p2)/(2-p2))*m1+((1-p2)/(2-p2))*m2+(p2/(2-p2))*m;
d22=((1-p2)/(2-p2))*k1+((1-p2)/(2-p2))*k2+(p2/(2-p2))*k;
A=[p11 p12; p21 p22]
B=[d11 d12; d21 d22]
a=LemkeHowson(A,B)
b0=a{2}
a0=a{1}
m0=p11
k0=d11
function nashEqbm = LemkeHowson(varargin)
if nargin < 2 || nargin > 4
error(’This function takes between two and four arguments’);
end
A = varargin{1};
B = varargin{2};
if any(size(A) ~= size(B))
error(’Matrices must have same dimension’);
end
[m,n] = size(A);
size_ = [m,n];
if nargin > 2
k0 = varargin{3};
if k0 < 1 || k0 > m+n
error([’Initial pivot must be in {1,...,’ num2str(n+m) ’}’]);
end
else
k0 = 1;
end
if nargin == 4
55
maxPivots = varargin{4};
if maxPivots < 1
error(’Maximum pivots parameter must be a positive integer!’);
end
else
maxPivots = 500000;
end
minVal = min( min(min(A)), min(min(B)) );
if minVal <= 0
A = A + ones(size(A))*(1-minVal);
B = B + ones(size(A))*(1-minVal);
end
Tab = cell(2,1);
Tab{1} = [B’,
eye(n), ones(n,1)];
Tab{2} = [eye(m), A,
ones(m,1)];
rowLabels = cell(2,1);
rowLabels{1} = m+1:m+n;
rowLabels{2} = 1:m;
k = k0;
if k0 <= m
player = 1;
else
player = 2;
end
numPiv = 0;
while numPiv < maxPivots
numPiv = numPiv+1;
LP = Tab{player};
[m_, ~] = size(LP);
max_ = 0;
ind = -1;
for i = 1:m_
t = LP(i,k) / LP(i, m+n+1);
if t > max_
ind = i;
max_ = t;
end
end
if max_ > 0
Tab{player} = pivot(LP, ind, k);
else
break;
56
end
temp = rowLabels{player}(ind);
rowLabels{player}(ind) = k;
k = temp;
if k == k0
break;
end
if player == 1
player = 2;
else
player = 1;
end
end
if numPiv == maxPivots
error([’Maximum pivot steps (’ num2str(maxPivots) ’) reached!’]);
end
nashEqbm = cell(2,1);
for player = 1:2
x = zeros(size_(player), 1);
rows = rowLabels{player};
LP = Tab{player};
for i = 1:length(rows)
if player == 1 && rows(i) <= size_(1)
x(rows(i)) = LP(i,m+n+1) / LP(i,rows(i));
elseif player == 2 && rows(i) > size_(1);
x(rows(i)-size_(1)) = LP(i,m+n+1) / LP(i,rows(i));
end
end
nashEqbm{player} = x/sum(x);
end
end
function B = pivot(A,r,s)
[m,~] = size(A);
B = A;
for i = 1 : m
if i == r
continue;
57
else
B(i,:) = A(i,:) - A(i,s) / A(r,s) * A(r,:);
end
end
end
58
Отзывы:
Авторизуйтесь, чтобы оставить отзыв