Санкт-Петербургский государственный университет
Кафедра Математической теории игр и статистических решений
Шмаргунова Елена Андреевна
Выпускная квалификационная работа бакалавра
Прогнозирование экспорта и импорта по
странам
Направление 010400
Прикладная математика и информатика
Научный руководитель,
кандидат физ.-мат. наук
ассистент
Панкратова Я. Б.
Санкт-Петербург
2016
Содержание
Введение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Постановка задачи . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Обзор литературы . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Глава 1. Выбор данных и предобработка . . . . . . . . . . . . . . . .
Выбор стран для анализа . . . . . . . . . . . . . . . . . . . . . . .
Проверка гипотез о случайности временного ряда . . . . . . . . .
Автокорреляционная функция (АКФ) и частная автокорреляционная функция (ЧАКФ) . . . . . . . . . . . . . . . . . . . . . . . .
Проверка на стационарность временного ряда . . . . . . . . . . .
Глава 2. Построение прогноза . . . . . . . . . . . . . . . . . . . . . .
Модель Бокса-Дженкинса (ARIMA) . . . . . . . . . . . . . . . . .
Экспоненциальное сглаживание . . . . . . . . . . . . . . . . . . .
Глава 3. Оценка моделей . . . . . . . . . . . . . . . . . . . . . . . . .
Выводы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Заключение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Список литературы . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Приложение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
3
4
5
6
6
8
12
13
15
15
22
26
28
31
32
33
Введение
В данной работе методы эконометрического анализа применяются с
целью моделирования и прогнозирования объемов экспорта и импорта России по различным странам. Актуальность исследования следует из необходимости анализа тенденций внешнеэкономической деятельности России
для задачи планирования внешней торговли.
Внешнеэкономические связи (ВЭС) предусматривают взаимодействие
всех секторов и отраслей экономики, фаз процесса национального воспроизводства, в значительной мере обеспечивая его сбалансированность и эффективность, и в то же время представляют собой подсистему мирового
хозяйства. Под ВЭС понимают различные направления, формы, методы
и средства перемещения материальных, финансовых и интеллектуальных
ресурсов между странами. ВЭС являются одной из наиболее сложных сфер
экономики любой страны, обеспечивающей ее приобщение к мировой науке
и технике, промышленности и культуре.
Практическое осуществление экономических связей хозяйствующими
субъектами данного государства с другими странами характеризуется как
внешнеэкономическая деятельность (ВЭД).
Главным направлением ВЭД является внешняя торговля. Она охватывает продажу товаров в другие страны и приобретение там нужных товаров. К внешней торговле относятся и оплачиваемые услуги в связи с
совершением внешнеторговых сделок купли-продажи товаров. Экспорт −
это продажа и вывоз товаров за границу для передачи их в собственность
иностранному контрагенту. Импорт − закупка и ввоз иностранных товаров для последующей реализации на внутреннем рынке страны-импортера.
Прогнозирование внешней торговли основывается на анализе отчетных статистических данных о предшествующем состоянии исследуемого объекта.
3
Постановка задачи
Целью данной работы является описание, моделирование и выявление тенденций временных рядов объемов экспорта и импорта России по
различным странам, а также построение прогноза на год (4 квартала). Также одной из задач работы является рассмотрение концепций применения
методов прогнозирования одновременно с вопросами их практической реализации в современных программных средствах. В первой главе данной
работы описывается проблема выбора стран для анализа. Рассматриваются
различные критерии проверки временных рядов на случайность и стационарность, также описан процесс построения автокорреляционной функции
и частной автокорреляционной функции. Во второй главе работы приведена классификация моделей, алгоритмы и технологии их построения, критерии выбора наиболее подходящей модели. Также непосредственно проводится исследование полученных временных рядов. Строится несколько
моделей для каждого ряда, из которых выбираются наиболее адекватные и
значимые. На основе выбранных моделей строится итоговый прогноз на год
по каждому ряду. Описываются тенденции и характер рядов и полученный
прогноз. Для нахождения параметров, оценок моделей, проведения тестов
на качество и значимость, а также для прогнозирования использовались
пакеты R и Excel.
С учётом актуальности проблемы изучения внешнеэкономической деятельности России сформулированы следующие задачи:
1. Выявить страны–лидеры по внешнеэкономической торговле с Российской Федерации, используя полученные данные;
2. Построить временные ряды для данных стран по обороту импорта и
экспорта;
3. Проверить качество и адекватность построенной модели;
4. Построить прогноз экспорта и импорта на 4 квартала.
Рассмотрение проблемы выбора и анализа данных и решение задачи
прогнозирования приведено в разных главах.
4
Обзор литературы
Внешнеэкономическая деятельность России яляется важной характеристикой качества жизни в любой стране. Этой сфере посвящено большое количество учебных пособий и журналов. Для понимания вопроса был
прочитан соответствующий раздел в работе под редакцией Булатова А. С.
[3, Глава 34] о развитии экономики нашей страны. В данной работе приведены основные определения и понятия в области мировой торговли.
На сайте Федеральной таможенной службы России [14] приведена вся
необходимая информация для исследования по внешней торговле России,
а также статистические данные, которые находятся в открытом доступе.
Одним из этапов работы была проверка временных рядов на случайность. Для этого были выбраны различные критерии. Их описание взято
из учебного пособия Айвазяна С. А., Енюкова И. С., Мешалкина Л. Д [1].
Вопрос об исследовании временных рядов изучен во следующих учебниках, статьях и методических пособиях [9–11] и [2, 5]. В них представлены методы построения различных моделей, способы задания параметров.
Заключительная часть работы состоит в построении прогнозирования временных рядов несколькими методами. Адаптивные методы подробно описаны в работе Лукашин Ю. П. [5]. В книге Бокса Дж., Дженкинса Г. [2]
рассматриваются наглядные примеры исследования нестационарных временных рядов.
Для решения одной из поставленных задач, определения качества
построенной модели, в работе применяются различные тесты. В учебнике
Магнуса Я. Р., Катышева П. К. [6] содержится необходимая теоретическая
информация о них.
В процессе реализации описанных методов была использована программная среда R. Функции, использованные для анализа, описаны в учебном пособии Шипунов А. Б., Балдин Е. М., Волкова П. А. и др. [8]. Также
это пособие использовалось для изучения функций для проверки качества
построенной модели.
Так как вычисления проводились не только в среде программирования R, а также в пакете Microsoft Office Excel, то для грамотного выполнения работы использовалось пособие Гавриленко В .В., Парохненко Л .М. [4].
5
Глава 1. Выбор данных и предобработка
Выбор стран для анализа
Для получения практически значимой информации решено выбрать
тройку стран–лидеров в сотрудничестве с Россией. Построена диаграмма
распределения оборотов экспорта (Рис.1). Страны, имеющие долю в экспорте с Россией меньше 3% на диаграме отмечены как ПРОЧИЕ.
Рис. 1: Распределение оборотов экспорта
Для дальнейшего изучения и анализа выбраны следующие страны:
• Нидерланды;
• Китай;
• Германия.
Аналогично построим диаграмму распределния импорта по странам
(Рис. 2). Страны, имеющие долю в экспорте с Россией меньше 2.5% на
диаграме отмечены как ПРОЧИЕ.
Для дальнейшего изучения и анализа выбраны следующие страны:
• Китай;
• Германия;
6
Рис. 2: Распределение оборотов импорта
• США.
Далее выбраны поквартальные данные с сайта Федеральной таможенной службы РФ [14] по обороту экспорта и импорта по этим странам
(в миллионах долларов США) с 1-го квартала 2005 года до 4-го квартала
2014 года (Приложение 1) и построены соответствующие временные ряды,
графики которых представлены ниже.
Рис. 3: Графики временных рядов оборотов экспорта
7
Рис. 4: Графики временных рядов оборотов импорта
Проверка гипотез о случайности временного ряда
Основные подходы к решению этой задачи основаны на статистической проверке гипотез. Критерии выявления компонент ряда основаны на
проверке гипотезы о случайности ряда. Выберем 3 критерия в качестве
проверки:
• критерий серий, основанный на медиане;
• "восходящих" и "нисходящих" серий;
• критерий "пиков" и "ям".
В качестве примера подробно рассмотрим их для ряда по оборотам экспорта в Нидерланды. Результаты по остальным рядам приведены ниже в виде
таблиц. Реализация данных критериев на языке R приведена в Приложении 2.
I. Критерий серий, основанный на медиане
Построим вариационный ряд (y(1) > y(2) > . . . > y(n) ), соответствующий данному временному и найдём медиану. Так как количество элементов
ряда n = 40 (чётно), медиану вычислим по формуле:
1
ỹmed = (y n2 + y n2 +1 ),
2
ỹmed = 13195.5615.
8
Сравнивая значения исходного ряда yt , t = 1, n с медианой ỹmed , составим
последовательность δt по формуле:
+, если yt > ỹmed ;
δt = 0, если yt = ỹmed ;
−, если y < ỹ , t = 1, n.
t
med
Далее в этой последовательности нули в рассмотрении не участвуют.
Определим 2 параметра: ν(n)-количество серий и τ (n)-длину наибольшей
серии:
ν(n) = 8,
τ (n) = 15.
Гипотеза о случайности отвергается для приблизительно 5% уровня значимости, если хотя бы одно из следующих неравенств отклоняется:
√
ν1 (n) > [ 1 (n + 1 − 1.96 n − 1)],
2
τ1 (n) < [3.3lg(n + 1)], где n-количество элеметов ряда.
Квадратные скобки означают целую часть числа. Для n = 40 данная система неравенств приобретает следующий вид:
(
ν1 (n) > 14,
τ1 (n) < 5.
Так как оба неравенства не выполняются, гипотеза о случайности (об отсутствии тренда) временного ряда отвергается.
Приведём результаты остальных рядов в виде следующей таблицы.
Ряд
ν(n) τ (n)
Экспорт
Китай
5
17
США
7
12
Импорт
Китай
3
18
Германия
7
15
США
5
15
Таблица 1: Значения ν и τ
Во всех случаях неравенства не выполняются, поэтому гипотезу об
9
отсутствии тренда отвергаем.
II. Критерий "восходящих" и "нисходящих" серий
Для исходного ряда y1 , y2 , . . . , yn построим соответствующую ему последовательность δ1 , δ2 , . . . , δn−1 по следующему правилу:
+, если yt+1 − yt > 0;
δt = 0, если yt+1 − yt = 0;
−, если y − y < 0, t = 1, n.
t+1
t
Аналогично предыдущему критерию найдем количество серий (ν(n))
и длину наибольшей серии (τ (n)), при этом не рассматриваем в анализе
последовательности нули.
ν2 (n) = 20,
τ2 (n) = 5.
Если нарушается хотя бы одно из следующих неравенств, то гипотеза о
случайности отвергается для приблизительно 5% уровня значимости:
r
1
ν(n) > [ (2n − 1) − 1.96 16n − 29 )],
3
90
τ (n) < τ , где n-количество элеметов ряда, а.
0
5, если n ≥ 26;
τ0 = 6, если 26 < n ≥ 153;
7, если 153 < n ≥ 1170.
Для n = 40 данная система неравенств приобретает следующий вид:
(
ν2 (n) > 21,
τ2 (n) < 6.
Очевидно, что первое неравенство системы не выполняется, поэтому гипотезу о случайности временного ряда отвергается.
Приведём значения ν(n) и τ (n) для остальных рядов ниже (Таблица
2).
Так как первое неравенство системы не выполняется для полученных
значений каждого ряда, гипотеза о случайности (об отсутствии тренда)
10
Ряд
ν(n) τ (n)
Экспорт
Китай
15
4
США
14
5
Импорт
Китай
14
3
Германия 14
3
США
17
3
Таблица 2: Значения ν и τ
временного ряда отвергается.
III. Критерий "пиков" и "ям"
Нужно определить уровень ряда:
• уровень временного ряда является максимальным, если
(
1, при yt−1 < yt > yt+1 ;
0, в остальных случаях.
• уровень временного ряда является минимальным, если
(
1, при yt−1 > yt < yt+1 ;
0, в остальных случаях.
yt − называется точкой поворота в ряду.
В случайном ряду математическое ожидание (p) и дисперсия (σp2 ) числа
точек поворота вычисляются по формулам:
2
p = (N − 2);
3
16N − 29
.
90
Критерием случайности с вероятностью 95% является неравенство:
"
#
r
2
16N − 29
p>
(N − 2) − 1.96
3
90
σp2 =
Для n = 40 данное неравенство приобретает следующий вид:
p > 20.
Значения p приведены в Таблице 3.
11
Ряд
Экспорт
Нидерланды
Китай
США
Импорт
Китай
Германия
США
p
15
13
13
14
14
16
Таблица 3: Значения p
Во всех случаях значение p не превосходит 20, таким образом, отвергается гипотеза о случайности ряда.
Автокорреляционная функция (АКФ) и частная
автокорреляционная функция (ЧАКФ)
Первым этапом исследования структуры временного ряда является
построение автокорреляционной и частной автокорреляционной функции.
Пусть даны последовательности y(t1 ), y(t2 ), . . . , y(tn ) и y(t1+k ), y(t2+k ), . . . , y(
которые сдвинуты относительно друг друга на k моментов времени или, подругому, с лагом k. Тогда можно определить уровень статистической зависимости между ними, вычислив оценку коэффициента автокорреляции
r(k) и построив корреллограмму. Оценка коэффициента автокоррелляции
вычислияется по следующей формуле:
n−1
n−1
n−1
P
P
P
(n − k)
yi yi+1 − ( yi )( yi+1 )
i=1
i=1
s i=1
r(k) = s
.
n−1
n−1
P 2
P
(n − k)( yi ) (n − k)( yi+1 )2
i=1
i=1
Последовательность коэффициентов корреляции r(k), где k = 1, 2, . . . , n,
как функция интервала k между наблюдениями называется автокорреляционной функцией (АКФ).
Частной автокорреляций называется автокорреляция, существующая
между разделенными временем τ членами ряда y(t) и y(t + τ ) при устранении влияния на эту взаимосвязь всех промежуточных значений ряда.
Величина τ называется порядком частной автокорреляции. Формула для
12
вычисления частной автокорреляции второго порядка:
r(2) − r2 (1)
rчастн (2) =
.
1 − r2 (1)
Частные автокорреляции более высоких порядков могут быть подсчитаны
аналогичным образом с использованием формулы:
Для стационарных рядов характерно "быстрое убывание" кореллограммы
и графика частной автокорреляционной функции с ростом k после нескольких первых значений. Так как графики построенных рядов (Приложение
3) убывают медленно, то есть основания предположить нестационарность
ряда. Проверим данное предположение с помощью теста Дики-Фуллера [6,
Глава 11].
Проверка на стационарность временного ряда
Для того, чтобы определить являются ли ряды стационарными или
нет, используем расширенный тест Дики-Фуллера (Dickey–Fuller test или
DF-тест). Подробное описание алгоритма и критические значения указаны в учебнике Яна Р. Магнуса [6, Глава 11]. Этот тест используют для
проверки наличия единичных корней в полиномах оператора сдвига. При
помощи этого теста проверяют значение коэффициента a в авторегрегрессионном уравнении первого порядка AR(1) (продробно об этом процессе
в Главе 2): yt = a · yt−1 + εt Для стационарности процесса необходимо и
достаточно, чтобы все корни характеристического уравнения лежали бы
внутри единичного круга, т.е. не превосходили бы по модулю единицу.
13
В тесте выдвигается гипотеза
H0 : a = 1
против альтернативной
H1 : a < 1
при 5% уровне значимости.
Для этого в программе R используем функцию adf.test из пакета
tseries. Результаты данного теста для каждого ряда в таблице:
t − statistic p − value
Экспорт
Нидерланды
-2.0559
0.5515
США
-1.8606
0.6282
Китай
-1.2725
0.8671
Импорт
Китай
-1.9867
0.5787
Германия
-1.208
0.8843
США
-1.8871
0.6178
Таблица 4: Значения статистики Дики — Фуллера
Все ряды можно считать нестационарными (гипотеза о наличии единичного корня не опровергнута), так как p-value превышает уровень значимости 0.05, а значения статистика Дики − Фуллера не превышает критического.
Переходим к следующему этапу исследования − построение моделей
прогнозирования.
14
Глава 2. Построение прогноза
Модель Бокса-Дженкинса (ARIMA)
Первым методом построения модели временного ряда является модель Бокса-Дженкинса (Box-Jenkins approach). Часто эту модель называют моделью авторегрессии ¯ проинтегрированного скользящего среднего
(АРПСС) или в англоязычном варианте AutoregRessive Integrated Moving
Average mode (ARIMA) [2, Глава 4].
Процедуры оценки параметров и прогнозирования, предполагают, что
математическая модель процесса известна. В реальных данных часто нет
отчетливо выраженных регулярных составляющих. Отдельные наблюдения содержат значительную ошибку, что мешает не только выделить регулярные компоненты, но также построить прогноз. Методология ARIMA,
разработанная Боксом и Дженкинсом, позволяет это сделать. Данный метод чрезвычайно популярен во многих приложениях, и практика подтвердила его мощность и гибкость.
В модели рассматривают 2 основных процесса:
1. Процесс авторегрессии (AR):
Если временной ряд содержит элементы, которые последовательно зависят друг от друга, то эту зависимость можно представить в следующим виде:
yt = ν + a1 yt−1 + a2 yt−2 + a3 yt−3 + . . . + εt ,
где: ν − константа (свободный член), а a1 , a2 , a3 . . . − параметры авторегрессии.
Видно, что каждый элемент ряда является суммой случайной компоненты и линейной комбинации предыдущих наблюдений.
2. Процесс скользящего среднего (MA):
В отличие от предыдущего процесса, в процессе скользящего среднего
на каждое наблюдение оказывается суммарное воздействие предыдущих ошибок. Такой процесс имеет следующий вид:
yt = µ + et − b1 εt−1 − b2 εt−2 − b3 εt−3 − . . . ,
15
где: µ − константа, b1 , b2 , b3 . . . − параметры скользящего среднего.
Значит текущее наблюдение ряда является суммой случайной компоненты в этот момент и линейной комбинации случайных воздействий
в предыдущие моменты времени.
В эконометрических исследованиях чаще всего используют модели
ARIMA(p, d, q), значения параметров которой принимают значения не
больше числа 2. При этом параметры p и q определяют порядок авторегрессионной составляющей и порядок скользящего среднего (для этого
рассматривают модели ARMA(p, q)–модели авторегрессии cо скользящими средними) соответственно, а параметр d-порядок разности (дискретной
производной).
Общий вид ARIMA модели имеет вид:
d
∆ yt = c +
p
X
d
ai ∆ yt−i +
i=1
q
X
bj εt−j + εt ,
j=1
где εt -стационарный временной ряд, c, ai , bj − параметры модели, а ∆d −
оператор разности.
Для преобразования ряда к стационарному используют сдвиг ряда с
фиксированным лагом. Чаще всего используют сдвиг с лагом равным 1 или
2. В этом случае ряд преобразуется следующим образом: ∆yt = yt − yt−1
для всех значений t = 1, n для первой разности и ∆2 yt = ∆yt − ∆yt−1 для
второй. Этот порядок и определяет коэффициент d.
Для того, чтобы определить сколько параметров выбрать для каждого ряда, будем использовать графики АКФ и ЧАКФ (Приложение 3) и
их свойства, представленные в следующей таблице.
Функция
АКФ
ARMA(1, 0)
Экспоненциально затухает
ЧАКФ
Пик на лаге 1
ARMA(2, 0)
Экспоненциально
затухает
или
имеет
форму
синусоидальной
волны
Пики на лагах 1 и
2
ARMA(0, 1)
Пик на лаге 1
ARMA (0, 2)
Пики на лагах 1 и
2
ARMA (1, 1)
Экспоненциально
затухает от значения r(1)
Экспоненциально затухает
Экспоненциально
затухает
или
имеет
форму
синусоидальной
волны
Экспоненциально
затухает от значения rp (1)
Таблица 5: Свойства АКФ и ЧАКФ
Каждый временной ряд рассмотрен отдельно, так как все они не являются стационарными (по тесту Дики − Фуллера), то первым шагом явля16
ется построение последовательных разностей первого порядка и аналогичная проверка на стационарность. Если полученный ряд также не стационарен, то процесс продолжается. Далее построены графики АКФ и ЧАКФ
для последовательных разностей, после которых установлена стационарность ряда. Пунктирной линией на графиках обозначена граница "белого
шума" (случайная последовательность значений с математическим ожиданием равным нулю). Исходя из них, выбраны наиболее подходящими
параметры p, d и q. Использована функция arima в пакете tseries с различными параметрами.
Для получения достоверного результата сравним качество модели
с другими возможными по информационному критерию Акаике (Akaike
information criterion–AIC) [7]:
P
n
2
y
t=1 t
p+q
.
+ ln
AIC = 2
n
n
Данное значение расчитывается автоматически при построении модели в
R. Смысл данного критерия заключается в том, что, если существует несколько адекватных моделей для построения прогноза, лучше выбрать ту, в которой содержится меньше параметров (принцип "экономии мышления").
Ряды по экспорту
1. Нидерланды:
Так как ряд не является стационарным, то применим к нему процедуру
последовательных разностей и проведём тест Дики–Фуллера. Полученный ряд стационарный (p-value = 0.04462).
model
ARIMA(1, 1,
ARIMA(1, 1,
ARIMA(0, 1,
ARIMA(0, 1,
0)
1)
1)
0)
AIC
722.1721
723.5065
722.0814
721.9906
Таблица 6: Значение коэффициента AIC (Нидерланды)
В таблице сравнения (Таблица 6) видно, что наименьшее значение коэффициент AIC принимает в модели ARIMA(0, 1, 0). Данная модель
является случайным блужданием (простейшей моделью стохастическо17
го тренда). Выберем её для построения прогноза.
∆yt = εt .
Год 1 квартал 2 квартал 3 квартал 4 квартал
2015
16830
17853
18638
19299
Таблица 7: Прогноз построенной модели
2. Китай:
После вычисления второй разности значение теста Дики − Фуллера
даёт основания о принятии гипотезы стационарности ряда (p-value <
0.01).
ARIMA(1,
ARIMA(1,
ARIMA(0,
ARIMA(0,
2,
2,
2,
2,
0)
1)
1)
0)
632.2458
622.5750
620.6273
641.9093
Таблица 8: Значение коэффициента AIC (Китай)
Из таблицы 8 видно, что модель с наименьшим значением AIC − ARIMA(0,
2, 1):
∆2 yt = c + b1 εt−1 + εt ,
b1 = −0.9346,
c = 6174.30315.
Прогноз построенной модели
Год 1 квартал 2 квартал 3 квартал 4 квартал
2015
9749
10252
10687
11086
Таблица 9: Прогноз построенной модели
3. США:
Применим аналогичные действия к уже другому ряду. После применения последовательной разности 1 порядка также видно, что новый ряд
представляет собой стационарный процесс. Сравнивая коэффициенты
критерия AIC (Таблица 10), получаем, что лучшая модель ARIMA(0, 1,
18
ARIMA(1,
ARIMA(1,
ARIMA(0,
ARIMA(0,
1,
1,
1,
1,
0)
1)
1)
0)
624.2185
625.3417
624.1674
622.2300
Таблица 10: Значение коэффициента AIC (США)
0)(аналогично первому случаю (Нидерланды)–случайное блуждание)
∆yt = εt .
Прогноз построенной модели
Год 1 квартал 2 квартал 3 квартал 4 квартал
2015
3448
3732
3951
4135
Таблица 11: Прогноз построенной модели
Ряды по импорту
1. Китай:
Построим графики АКФ и ЧАКФ для первых разностей и проверим
данный ряд на стационарность методом Дики-Фуллера. Значение p −
value = 0.5537, что превышает допустимый уровень значимости. Таким образом, нужно построить ещё одну разность ∆2 yt = ∆yt − ∆yt−1
и также проверим его на стационарность. Ряд, к которому дважды
применили последовательную разность, является стационарным (т.к.
p − value = 0.03555). Рассмотрены несколько моделей ARIMA, в котором параметр d равен 2 (Таблица 12).
ARIMA(1,
ARIMA(1,
ARIMA(0,
ARIMA(0,
2,
2,
2,
2,
0)
1)
1)
0)
695.2857
677.5065
675.8104
693.5984
Таблица 12: Значение коэффициента AIC (Китай)
Выберем для построения прогноза модель с наименьшим значением
AIC (ARIMA(0, 2, 1)). Значения приведены в Таблице 12. Она имеет
следующий вид:
∆2 yt = c + b1 εt−1 + εt ,
b1 = −1,
19
c = 8632.3.
Год 1 квартал 2 квартал 3 квартал 4 квартал
2015
14849
15844
16697
17478
Таблица 13: Прогноз построенной модели
2. Германия:
После построения разностей первого и второго порядка значение p −
value превышало допустимый уровень 0.05% (после взятия первой разности p-value = 0.7461, после второй p-value = 0.2411). Таким образом,
для того чтобы преобразовать данный ряд в стационарный, нужно посчитать 3 последовательные разности, так как только на третьем шаге
тест Дики-Фуллера дает положительный результат о стационарности
(p − value < 0.01).
ARIMA(1,
ARIMA(1,
ARIMA(0,
ARIMA(0,
3,
3,
3,
3,
0)
1)
1)
0)
699.8567
678.6608
692.8274
730.5364
Таблица 14: Значение коэффициента AIC (Германия)
Модель с наименьшим значением AIC (ARIMA(1, 3, 1)) имеет вид:
∆3 yt = c + a1 ∆3 yt−1 + b1 εt−1 + εt ,
a1 = −0.5891891,
b1 = −0.9999177,
c = 7178.6824.
Прогноз данной модели:
Год 1 квартал 2 квартал 3 квартал 4 квартал
2015
9453
10346
11959
13689
Таблица 15: Прогноз построенной модели
3. США:
Данный ряд будет преобразован в стационарный после вычисления 2-х
последовательных разностей (тест Дики-Фуллера: p−value = 0.01718).
20
ARIMA(1,
ARIMA(1,
ARIMA(0,
ARIMA(0,
2,
2,
2,
2,
0)
1)
1)
0)
638.2392
620.2032
626.2533
661.0110
Таблица 16: Значение коэффициента AIC (США)
Модель с наименьшим значением AIC (ARIMA(1, 2, 1)) имеет вид:
∆2 yt = c + a1 ∆2 yt−1 + b1 εt−1 + εt
at = −0.43701,
bt = −1.00,
c = 2986.3819.
Прогноз данной модели:
Год 1 квартал 2 квартал 3 квартал 4 квартал
2015
5155
5250
5565
5761
Таблица 17: Прогноз построенной модели
Средняя ошибка прогноза
Одним из проверки критерия качества построенной модели является
средняя ошибка прогноза, которая вычисляется по формуле:
n
1 X |yt − ŷt∗ |
· 100%.
ε =
n t=1
yt
∗
Вычислим данную ошибку для ARIMA моделей, построенных выше.
Полученный результат занесём таблицу.
Временной ряд
Экспорт
Нидерланды
США
Китай
Импорт
Китай
Германия
США
ε∗
6.95%
9.23%
8.12%
7.71%
6.93%
7.38%
Таблица 18: Средняя ошибка прогноза (ARIMA модели) ε∗
21
Так как все значения не превышают 10% можно сделать вывод, что
модели достаточно хорошо аппроксимируют исследуемые данные.
Экспоненциальное сглаживание
В качестве альтернативного варианта построения прогноза рассмотрены адаптивные методы прогнозирования, в частности, различные типы
экспоненциального сглаживания.
I. Простое экспоненциальное сглаживание (Модель Брауна)
Особенность метода экспоненциального сглаживания состоит в том,
что во время выравнивания каждого наблюдения используются только значения предыдущих значений, взятых с определенным коэффициентом. Относительный вес каждого наблюдения уменьшается по экспоненте по мере
его удаления от момента, для которого определяется сглаженное значение.
Общая формула расчета экспоненциальной средней имеет вид:
St (y) = α · y1 + (1 − α) · St−1 (y), α ∈ (0; 1).
Теоретический анализ проблемы выбора постоянной сглаживания при
применении простейшей экспоненциальной модели для прогнозирования
стационарного процесса с автокорреляционной функцией вида rk = r1k . где
r1 — коэффициент автокорреляции при лаге 1, k ¯ лаг, проведен Д. Р.
Коксом [13] и Дж. Д. Кохеном [12]. Они показали, что минимум среднего
квадрата ошибки при прогнозировании такого ряда на 1 шаг вперед будет
при
3·r1 −1 , если 1 < r ≤ 1;
1
2r1
3
αopt =
0,
если −1 ≤ r1 ≤ 1 .
3
Вычислим значение αopt для каждого ряда, взяв значение автокорреляции
при лаге 1.
TS
Ned_exp
USA_exp
China_exp
China_imp
Ger_imp
USA_imp
αopt
0.875
0.728
0.955
0.924
0.812
0.802
Таблица 19: αopt
22
В качестве начальных данных (y0 ) первое значение временного ряда
(y1 ), построим модель, которая наиболее точно описывает данные и вычислим среднюю ошибку прогноза по формуле:
n
1 X |yt − ŷt∗ |
· 100%.
ε =
n t=1
yt
∗
Временной ряд
ε∗
Экспорт
Нидерланды
15.3%
США
19.15%
Китай
10.79%
Импорт
Китай
17.08%
Германия
17.97%
США
20.82%
Таблица 20: Средняя ошибка прогноза ε∗
Значение ошибки, которое лежит в промежутке 10 ≤ ε∗ ≤ 20, можно
оценить как недостаточно хорошую точность прогноза.
II. Метод Хольта
Так как на исследуемых данных существует линейный тренд, тогда
модель Брауна может не подходить для решения такой задачи. Чтобы
учесть влияние линейного тренда, используем модель Хольта (Holt) [10].
ŷt+d = at + d · bt ,
где at − прогноз, очищенный от тренда (экспоненциальное сглаживание),
bt − параметр линейного тренда.
at = α1 yt + (1 − α1 )(at−1 − bt−1 ),
bt = α2 (at − at−1 ) + (1 − α2 )bt−1 .
Важной проблемой является выбор коэффициентов α1 , α2 ∈ (0, 1),
которые определяют чувствительность модели. Чувствительная модель быстро реагирует на реальные изменения, а нечувствительная не реагирует на
шум и случайные отклонения. Проблема выбора параметров модели рас23
смотрена в книге Лукашина [5].
Подбор коэффициентов для всех моделей осуществляется надстройку
MS Excel «Поиск решения» по критерию «минимизация суммы квадратов
отклонений расчётных значений от фактических». Полученные коэффициенты α1 и α2 приведены ниже (Таблица 21).
Временной ряд
Экспорт
Нидерланды
США
Китай
Импорт
Китай
Германия
США
α1
α2
0.53 0.43
0.47 0.84
0.67 0.48
1 0.03
0.63 0.04
0.46 0.18
Таблица 21: коэффициенты α1 и α2
Также вычислим среднюю ошибку прогноза ε∗ (Таблица 22).
Временной ряд
ε∗
Экспорт
Нидерланды
14.9%
США
19.76%
Китай
11.09%
Импорт
Китай
18.38%
Германия
17.66%
США
20.97%
Таблица 22: Средняя ошибка прогноза ε∗
Среднюю ошибку аппроксимации только для нескольких рядов (Нидерланды по экспорту и Китай по импорту) можно считать допустимой.
Для остальных рядов аппроксимация является недостаточно хорошей.
III. Метод Хольта-Винтерса
Модель Хольта-Уинтерса является развитием модели Хольта, в ней
появляется сезонная составляющая, в результате чего получается система
уравнений с тремя постоянными сглаживания:
ŷt+d = (at + d · bt )ct−s+d ,
at = α 1
yt
+ (1 − α1 )(at−1 − bt−1 ),
ct−s
bt = α2 (at − at−1 ) + (1 − α2 )bt−1 ,
24
c t = α3
yt
+ (1 − α3 )ct−s .
at
Алгоритм построения модели заключается в том, что сначала рассчитываются коэффициенты a0 и b0 линейного тренда, далее рассчитываются
сезонные составляющие ct по формуле:
ct =
yt
.
a0 + b o t
При подборе коэффициентов с помощью функции HoltWinters в данной модели во всех рядах сезонность никак не адаптируется, так как α3 = 0.
Поэтому результат построенной модели будет совпадать с результатами,
полученными в предыдущем пункте. Таким образом данную модель не целесообразно использовать для исследуемых рядов.
25
Глава 3. Оценка моделей
Для разных видов моделей будем использовать различные критерии
проверки на адекватность.
1. Критерий Дарбина–Уотсона
Проверим независимости уровней ряда остатков в адаптивных моделях
(модель Брауна и модель Хольта). Выдвигается гипотеза H0 : автокорреляция в остатках отсутствует.
Вычислим значение статистики по формуле:
n
P
DW =
(et − et−1 )2
t=2
n
P
t=1
.
e2t
Дарбин и Уотсон доказали, что существуют 2 границы (обычно обозначают dl и du ), которые зависят только от n и уровня значимости и
обладают следующим свойством: если DW > du , то гипотеза H0 не отвергается, а если DW < dl , то, сооответственно, отвергается в пользу
альтернативной. В случае, когда dl < DW < du ситуация неопределенна (т.е. нельзя высказаться в пользу одной или другой гипотезы).
Вычислим значение статистики DW для каждого из исследуемых рядов и представим результат в виде таблицы. Все значения DW для
Временной ряд DW (Метод Брауна) DW (Метод Хольта)
Экспорт
Нидерланды
1.8135
1.541
США
1.523
1.965
Китай
1.72
1.944
Импорт
Китай
1.763
1.565
Германия
1.868
1.951
США
1.655
1.946
Таблица 23: Значение статистики Дарбина-Уотсона
двух методов превышют значение du (для n = 40 табличное значение
du = 1.49). Таким образом, нет оснований отвергнуть гипотезу об отсутствии автокорреляции в остатках моделей.
2. Q-тест Льюнга–Бокса
26
Так как критерий Дарбина-Уотсона не подходит для моделей автокорреляции, будем использовать другой метод. Проверим остатки полученных моделей на соответствие «белому шуму», для этого проведем
Q-тест Льюнга-Бокса для проверки гипотезы о том, что остатки случайны [6, Глава 11]. Значение статистики вычисляется следующим образом:
K
X
rk2
,
Q̃ = n(n + 2)
n
−
k
k=1
где n − количество наблюдений, rk − коэффициент автокорреляции с
лагом k, K − максимальный лаг автокорреляции.
Проверяется нулевая гипотеза H0 : данные являются случайными (т.е.
представляют собой белый шум). Данный тест проводится на остатках
модели ARIMA. Таким образом, нам надо сначала получить остатки
модели (residuals), а затем к получившимся коэффициентам применить
тест. Для этого будем использовать функцию Box.test с параметром
type = ”Ljung − Box” и f itdf = p + q. Результаты занесём в следующую таблицу: Результаты теста по всем исследуемым рядам (Таблица
Временной ряд p − value
Экспорт
Нидерланды
0.1445
США
0.9203
Китай
0.4723
Импорт
Китай
0.673
Германия
0.3747
США
0.2764
Таблица 24: Результаты Q-теста Льюнга—Бокса
20) показывают отсутствие автокорреляции остатков, таким образом
можно сделать выводы, что модель адекватна и её можно использовать для прогнозирования.
27
Выводы
В работе было проведено построение нескольких моделей с различными параметрами и прогнозирование временных рядов объемов экспорта
и импорта России с различными странами. Вычисления проводились с использованием поквартальных данных с 2005 г. по 2014 г.(включительно).
Прогноз строился на 2015 год. На Рис. 5 и 6 представлены графики временных рядов, а также отмечены полученные спрогнозированные значения.
Рис. 5: Построенный прогноз по экспорту
Рис. 6: Построенный прогноз по импорту
28
На момент написания работы на сайте Федеральной таможенной службы
были доступны данные за I квартал 2015 года. Сравним спрогнозируемые
результаты разными методами с реальным значением.
Страна
Нидерланды
США
Китай
Фактическое значение
15656.028
2199.888
6768.434
Модель Брауна
Опт.значение α
0.878
0.728
0.95
Прогнозное значение
14884.401
2755.489
8844.202
Абсолютная ошибка
771.626
555.6015
2075.768
Относительная ошибка
0.153
0.192
0.147
Модель Хольта
Опт.значение α1 , α2
0.53, 0.43
0.47, 0.84 0.67, 0.48
Прогнозное значение
15257.0762
2727.806
8814.180
Абсолютная ошибка
398.951
527.9181625 2045.746
Относительная ошибка
0.149
0.177
0.115
ARIMA модели
Вид модели
(0, 1, 0)
(0, 1, 0)
(0, 2, 1)
Прогнозное значение
16830
3448
9749
Абсолютная ошибка
1173.972
1248.112
2980.566
Относительная ошибка
0.075
0.167
0.44
Таблица 25: Сравнение построенного прогноза с фактически значением (экспорт)
Страна
Китай
Германия
США
Фактическое значение
14488.786
8123.322 4675.546
Модель Брауна
Опт.значение α
0.878
0.74
0.71
Прогнозное значение 14884.40197 8095.594 4273.961
Абсолютная ошибка 771.6260317
27.727
401.584
Относительная ошибка 0.153668453
0.0034
0.0858
Модель Хольта
Опт.значение α1 , α2
1, 0.03
0.63, 0.04 0.46, 0.18
Прогнозное значение
15257.08
8173.67
4460.62
Абсолютная ошибка
768.29
50.351
214.921
Относительная ошибка
0.053
0.00619
0.0459
ARIMA модели
Вид модели
(0, 2, 1)
(0, 3, 1)
(1, 2, 1)
Прогнозное значение
14849
9453
5155
Абсолютная ошибка
360.214
1329.678
479.454
Относительная ошибка
0.0248
0.163
0.102
Таблица 26: Сравнение построенного прогноза с фактически значением (импорт)
Опираясь на график, а также значения AIC, Дарбина-Уотсона, Qтеста Льюнга − Бокса можно сделать вывод, что лучшими моделями, описывающими исследуемые данные, является модели Бокса − Дженкинса
(ARIMA). Модели с выбранными параметрами удовлетворяют всем крите29
риям качества и адекватности. Таким образом, их можно использовать для
построения прогноза с целью получения наиболее достоверного результата.
30
Заключение
В работе исследование временных рядов было проведено с помощью
следующих моделей:
1. Различные ARIMA-модели;
2. Метод экспоненциального сглаживания (однопараметрический метод
Брауна и двухпараметрическая модель Хольта).
Для исследования структуры рядов и оценки качества построенных моделей использовались следующие тесты и критерии:
• Критерии случайности (критерий серий, основанный на медиане; "восходящих" и "нисходящих" серий; "пиков" и "ям");
• Информационный критерий Акаике (AIC);
• Тест Дики − Фуллера;
• Q-тест Льюнга − Бокса;
• Критерий Дарбина − Уотсона.
Результатом моделирования стало построение итоговых прогнозов и
их графиков. Работа может быть продолжена, так как рассмотрены только несколько из возможых методов прогнозирования. В дальнейшем можно применить GARCH (Generalized ARCH - обобщённая авторегрессионная
условная гетероскедастичность) модели для построения более точного прогноза, а также попытаться выделить сезонную компоненту, разделив ряд
на части.
31
Список литературы
[1] Айвазян С. А., Енюков И. С., Мешалкин Л. Д. Прикладная статистика:
Основы моделирования и первичная обработка данных. М.: Финансы
и статистика, 1983. 471 с.
[2] Бокс Дж., Дженкинс Г. Анализ временных рядов прогноз и управление
М.: Мир, 1974. 406 c.
[3] Булатов А. С. Экономика. М.: Экономист, 2002. 896 с.
[4] Гавриленко В .В., Парохненко Л .М. Решение задач аппроксимации
средствами Excel M: Компьютеры + программы, 2002.
[5] Лукашин Ю. П. Адаптивные методы краткосрочного прогнозирования
временных рядов. М.: Финансы и статистика, 2003. 416 с.
[6] Магнус Я. Р., Катышев П. К., Пересецкий А. А. Эконометрика. Начальный курс. М.: Дело, 2004. 576 с.
[7] Тихонов. Э. Е. Методы прогнозирования в условиях рынка. Невинномысск, 2006. 221 с.
[8] Шипунов А. Б., Балдин Е. М., Волкова П. А., Коробейников А. И., Назарова С. А., Петров С. В., Суфиянов В. Г. Наглядная статистика, используем R., ДМК Пресс, 2014.
[9] Brown R. G. Smoothing forecasting and prediction of discrete time series.
- N.Y., 1963.
[10] Holt C. C. Forecasting trends and seasonals by exponentially weighted
moving averages. O.N.R. Memorandum, Carnegie Inst. of Technology, 1957.
[11] Winters P .R. Forecasting sales by exponentially weighted moving averages
//Management Science, 1960. Vol. 6. №3.
[12] Cohen G. D., A note on exponential smoothing and autocorrelated inputs
Oper. Res., 1963. Vol. 11. - № 3.
[13] Cox D. R., Prediction by exponentially weighted moving averages and
related methods // J. of the Royal Stat. Soc. 1961. Vol. 2 3 . -№ 2.
[14] Федеральная таможенная служба. http://customs.ru
32
Приложение
1. Исследуемые данные
Период
Квартал
Январь - Март 2005г
Апрель - Июнь 2005г
Июль - Сентябрь 2005г
Октябрь - Декабрь 2005г
Январь - Март 2006г
Апрель - Июнь 2006г
Июль - Сентябрь 2006г
Октябрь - Декабрь 2006г
Январь - Март 2007г
Апрель - Июнь 2007г
Июль - Сентябрь 2007г
Октябрь - Декабрь 2007г
Январь - Март 2008г
Апрель - Июнь 2008г
Июль - Сентябрь 2008г
Октябрь - Декабрь 2008г
Январь - Март 2009г
Апрель - Июнь 2009г
Июль - Сентябрь 2009г
Октябрь - Декабрь 2009г
Январь - Март 2010г
Апрель - Июнь 2010г
Июль - Сентябрь 2010г
Октябрь - Декабрь 2010г
Январь - Март 2011г
Апрель - Июнь 2011г
Июль - Сентябрь 2011г
Октябрь - Декабрь 2011г
Январь - Март 2012г
Апрель - Июнь 2012г
Июль - Сентябрь 2012г
Октябрь - Декабрь 2012г
Январь - Март 2013г
Апрель - Июнь 2013г
Июль - Сентябрь 2013г
Октябрь - Декабрь 2013г
Январь - Март 2014г
Апрель - Июнь 2014г
Июль - Сентябрь 2014г
Октябрь - Декабрь 2014г
Нидерланды
4917.055
6454.612
6747.271
6496.675
6877.753
9732.15
9846.724
9439.221
8209.788
10306.783
11204.226
13146.812
13235.78
15329.603
18101.431
10259.942
6411.725
7761.621
10832.073
11303.378
12430.692
14136.189
12561.448
14842.337
13155.343
16781.25
15106.633
17636.619
18721.546
21228.576
17217.755
19683.519
17716.104
19362.743
15392.218
17655.027
16757.15
18149.254
18746.407
14360.599
Экспорт
США
1548.332
1532.786
1569.056
1674.994
1530.825
2621.731
2413.18
2283.655
1832.211
1946.594
2429.958
2044.569
2618.159
3112.293
4304.886
3395.188
1733.884
1789.252
2765.391
2885.828
1971.93
3329.442
3645.291
3386.533
2635.732
4169.076
5044.242
4598.122
3816.959
3252.645
2934.532
2921.74
2015.249
2776.908
3360.798
2982.154
2508.037
2516.844
2850.447
2760.348
Китай
2298.438
3474.272
3189.513
4090.964
3258.858
4072.811
4467.695
3957.689
3737.056
3948.004
3901.289
4305.926
5341.247
5127.608
5435.575
5239.178
3175.116
3924.544
4409.404
5168.623
5049.392
4762.665
4696.882
5819.698
8066.768
8162.886
8941.309
10062.16
9461.573
9287.172
8017.213
9000.871
8741.409
8575.245
9023.576
9285.19
9371.37
9682.064
9638.551
8802.322
Китай
1258.757
1363.961
1912.939
2732.69
2164.747
2345.491
3662.626
4738.883
3974.182
4844.204
7052.876
8542.315
7369.253
7994.905
10355.02
9047.65
4665.583
4529.259
6009.003
7647.549
6929.847
8740.371
11573.199
11809.872
10058.47
11263.323
13766.773
13141.47
11373.149
11887.381
14620.589
13886.575
12437.193
11997.929
14271.104
14466.86
12020.653
11857.649
14040.012
12937.694
Испорт
Германия
2467.52
3224.03
3533.116
4044.642
3258.903
4413.918
5026.565
5757.287
4973.276
6387.949
6853.728
8324.743
6905.675
9235.958
9277.048
8679.972
4282.372
4732.739
5498.681
6695.533
4535.66
6233.888
7412.343
8530.747
6878.924
9923.217
10125.742
10751.722
7880.676
9521.366
10157.984
10741.165
7921.335
9465.514
10091.202
10438.633
7648.955
8848.548
8559.854
7906.166
Таблица 27: Данные по оборотам экспорта и импорта
33
США
883.209
1218.675
1222.333
1238.609
1093.457
1545.676
1572.483
2192.482
1699.991
2196.643
2586.028
2984.487
2547.978
3471.654
3920.447
3841.471
1801.4
2019.407
2487.454
2874.607
1663.206
2698.45
3192.947
3581.215
2358.2
4077.294
3921.652
4246.277
3007.544
4026.482
3830.19
4455.333
3659.32
3967.389
4100.583
4774.693
3891.8
5968.952
4558.766
4076.492
2. Критерии случайности
I.Критерий серий, основанный на медиане выборки
l i b r a r y (" t s e r i e s ")
l i b r a r y ( " FitAR " )
l i b r a r y (" f o r e c a s t ")
Data <− r e a d . c s v ( " C o u n t r y . c s v " , h e a d e r = TRUE, s e p = " ; " )
n <− l e n g t h ( Data )
med <− median ( Data )
d e l t a _ 1 <− i n t e g e r ( n )
d e l t a _ 1 [ 1 : n ] <− 1
f o r ( i in 1 : n){
i f ( Data [ i ] < med ) {
d e l t a _ 1 [ i ] <− 0
}
}
c h a n g e s <− i n t e g e r ( n )
c h a n g e s [ 1 : n ] <− 1
f o r ( i in 1 : n){
i f ( d e l t a _ 1 [ i +1]==d e l t a _ 1 [ i ] ) {
c h a n g e s [ i ] <− 0
}
}
Max.element <− d e l t a _ 1 [ 1 ]
M a x . l e n g t h <− 1
Max.index <− 0
C u r r e n t . e l e m e n t <−
delta_1 [ 1 ]
C u r r e n t . l e n g t h <− 0
C u r r e n t . i n d e x <− 1
f o r ( i in 2 : n){
#Цепочка не закончилась
i f ( d e l t a _ 1 [ i ]== C u r r e n t . e l e m e n t ) {
C u r r e n t . l e n g t h <−
Current.length + 1
}
#Цепочка закончилась , она больше максимальной
i f ( C u r r e n t . l e n g t h > Max.length ){
M a x . l e n g t h <−
Current.length
}
#Новая цепочка
C u r r e n t . e l e m e n t <−
delta_1 [ i ]
C u r r e n t . l e n g t h <−
C u r r e n t . i n d e x <−
1
i
}
#Случай , когда последняя цепочка максимальная
i f ( C u r r e n t . l e n g t h > Max.length ) {
34
M a x . l e n g t h <−
Current.length
}
v1 <− sum ( c h a n g e s )
tau1 <− M a x . l e n g t h
i f ( ( tau1<=f l o o r ( 3 . 3 * l o g 1 0 ( n +1))) & ( v1>=f l o o r ( 0 . 5 * ( n+1−1 . 9 6 * s q r t ( n − 1 ) ) ) ) ) {
p r i n t ( " Good " )
}else
{
p r i n t ( " Bad " )
}
II.Критерий восходящий и нисходящих серий
Data <− a s . v e c t o r ( Ned )
d e l t a _ 2 <− i n t e g e r ( n )
d e l t a _ 2 [ 1 : n ] <− 1
f o r ( i i n 1 : n−1){
i f ( Data [ i ] > Data [ i +1]){
d e l t a _ 2 [ i ] <− 0
}
}
c h a n g e s 2 <− i n t ( n )
c h a n g e s 2 [ 1 : n ] <− 1
f o r ( i in 1 : n){
i f ( d e l t a _ 2 [ i +1]==d e l t a _ 2 [ i ] ) {
c h a n g e s 2 [ i ] <− 0
}
}
Max.element2 <− d e l t a _ 2 [ 1 ]
M a x . l e n g t h 2 <− 1
Max.index2 <− 0
C u r r e n t . e l e m e n t 2 <−
delta_2 [ 1 ]
C u r r e n t . l e n g t h 2 <− 0
C u r r e n t . i n d e x 2 <− 1
f o r ( i in 2 : n){
#Цепочка не закончилась
i f ( d e l t a _ 2 [ i ]== C u r r e n t . e l e m e n t 2 ) {
C u r r e n t . l e n g t h 2 <−
Current.length2 + 1
}
#Цепочка закончилась , она больше максимальной
i f ( C u r r e n t . l e n g t h 2 > Max.length2 ){
M a x . l e n g t h 2 <−
Current.length2
}
#Новая цепочка
C u r r e n t . e l e m e n t 2 <−
delta_2 [ i ]
C u r r e n t . l e n g t h 2 <−
C u r r e n t . i n d e x 2 <−
1
i
}
35
#Случай , когда последняя цепочка максимальная
i f ( C u r r e n t . l e n g t h 2 > Max.length2 ) {
M a x . l e n g t h 2 <−
Current.length2
}
v2 <− sum ( c h a n g e s 2 )
tau2 <− M a x . l e n g t h 2
tau_0<−5
i f ( ( v2 > f l o o r ( 1 / 3 * ( 2 * n−1)−1 . 9 6 * s q r t ( ( 1 6 * n −29)/90)))&( tau2<tau_0 ) ) {
p r i n t ( " Good " )
}else{
p r i n t ( " Bad " )
}
III.Критерий "пиков"и "ям"
d e l t a _ 1 <− i n t e g e r ( n )
d e l t a _ 2 <− i n t e g e r ( n )
d e l t a _ 1 [ 2 : n−1] <− 0
f o r ( i in 1 : n){
i f ( ( Data [ i ] < Data [ i +1])&( Data [ i ] < Data [ i − 1 ] ) )
{
d e l t a _ 1 [ i ] <− 1
}
}
sum1 <− 0
f o r ( i in 1 : n){
sum <− sum + d e l t a _ 1 [ i ]
}
sum2 <− 0
f o r ( i in 1 : n){
sum <− sum + d e l t a _ 2 [ i ]
}
sum <− sum1+sum2
d e l t a _ 2 [ 2 : n−1] <− 0
f o r ( i in 1 : n){
i f ( Data [ i ]>Data [ i +1] && Data [ i ]>Data [ i −1]){
d e l t a _ 1 [ i ] <− 1
}
}
i f ( ( p>f l o o r ( 2 / 3 * ( n−2)−1 . 9 6 * s q r t ( ( 1 6 * n − 1 ) / 9 0 ) ) {
p r i n t ( " Good " )
}else{
p r i n t ( " Bad " )
}
36
3. Графики АКФ и ЧАКФ для исходных рядов
Экспорт
Рис. 7: АКФ и ЧАКФ (Нидерланды)
Рис. 8: АКФ и ЧАКФ (США)
Рис. 9: АКФ и ЧАКФ (Китай)
Импорт
Рис. 10: АКФ и ЧАКФ (Китай)
37
Рис. 11: АКФ и ЧАКФ (Германия)
Рис. 12: АКФ и ЧАКФ (США)
4. Графики АКФ и ЧАКФ для последовательных разностей
Экспорт
Рис. 13: АКФ и ЧАКФ для ∆1 (Нидерланды)
Рис. 14: АКФ и ЧАКФ ∆2 (США)
38
Рис. 15: АКФ и ЧАКФ ∆1 (Китай)
Импорт
Рис. 16: АКФ и ЧАКФ ∆2 (Китай)
Рис. 17: АКФ и ЧАКФ ∆3 (Германия)
Рис. 18: АКФ и ЧАКФ ∆2 (США)
39
Отзывы:
Авторизуйтесь, чтобы оставить отзыв