ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ
«БЕЛГОРОДСКИЙ ГОСУДАРСТВЕННЫЙ НАЦИОНАЛЬНЫЙ
ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ»
( Н И У
« Б е л Г У » )
ИНСТИТУТ ИНЖЕНЕРНЫХ ТЕХНОЛОГИЙ И ЕСТЕСТВЕННЫХ НАУК
КАФЕДРА ПРИКЛАДНОЙ ИНФОРМАТИКИ И ИНФОРМАЦИОННЫХ
ТЕХНОЛОГИЙ
РАЗРАБОТКА ПРИКЛАДНОГО ПАКЕТА АНАЛИЗА И
ПРОГНОЗИРОВАНИЯ НА ОСНОВЕ ВРЕМЕННЫХ РЯДОВ
Выпускная квалификационная работа
обучающегося по направлению подготовки 09.03.03 «Прикладная
информатика»
очной формы обучения, группы 07001405
Паршина Ивана Игоревича
Научный руководитель:
к.т.н. Путивцева Н.П.
БЕЛГОРОД 2018
СОДЕРЖАНИЕ
ВВЕДЕНИЕ .............................................................................................................. 4
1 Аналитическая часть................................................................................ 6
1.1 Обзор методов анализа временных рядов .......................................... 6
1.2 Обзор эконометрических пакетов ..................................................... 17
1.3 Модель «Как есть», недостатки и проблемы ................................... 22
1.4 Постановка задачи .............................................................................. 29
2 Проектная часть.................................................................................................. 31
2.1 Модель «Как должно быть» ............................................................... 31
2.2 Структура программы ........................................................................ 33
2.3 Алгоритм работы ................................................................................ 35
3 Разработка и тестирование программного пакета и оценка эффективности43
3.1 Разработка пакета................................................................................ 43
3.2 Контрольный пример .......................................................................... 52
3.3 Оценка эффективности ....................................................................... 58
ЗАКЛЮЧЕНИЕ ..................................................................................................... 63
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ ........................................... 64
ПРИЛОЖЕНИЕ А ................................................................................................. 70
ПРИЛОЖЕНИЕ Б .................................................................................................. 71
ПРИЛОЖЕНИЕ В ................................................................................................. 75
3
ВВЕДЕНИЕ
В настоящее время дисциплина «Эконометрика» входит в учебные
планы многих направлений подготовки. Одним из ключевых разделов данной
дисциплины является «Временные ряды». В ходе изучения данного раздела
обучающиеся получают основные сведения и навыки
по анализу и
прогнозированию показателей путём применения методов регрессионного
анализ к временным рядам, содержащим соответствующие определённым
моментам времени показатели. Однако, данный раздел эконометрики зачастую
вызывает затруднения при изучении из–за сложности самостоятельной
проверки корректности расчётов, а также низкой их наглядности при
выполнении
вычислений
без
привлечения
средств
электронной
вычислительной техники. Данная проблема может быть решена путём
использования специализированных пакетов прикладных программ.
Однако, имеющиеся на данный момент программные пакеты зачастую
не позволяют произвести все операции, рассматриваемые в рамках раздела
«Временные ряды», а, если и позволяют, то зачастую требуют дополнительного
обучения для взаимодействия с данными системами. Также к основным
недостаткам существующих систем, реализующих данный функционал, можно
отнести отсутствие пояснений к получаемым результатам, что является
ключевым
в
необходимость
процессе
в
обучения.
разработке
новой
Данные
факторы
системы
с
учётом
обуславливают
обозначенных
недостатков существующих систем.
Объектом исследования является анализ временных рядов в процессе
обучения дисциплине «Эконометрика».
Предметом исследования является программное сопровождение анализа
временных рядов.
4
Целью данной работы является повышение эффективности процесса
обучения в рамках раздела «Временные ряды» дисциплины «Эконометрика».
В рамках данной работы были поставлены следующие задачи:
1) провести анализ предметной области;
2) провести моделирование процесса обучения «Как есть» и «Как
должно быть»;
3) осуществить проектирование программного пакета;
4) осуществить разработку программного пакета и оценить его
эффективность.
Критериями достижения цели являются:
значительное сокращение времени, затрачиваемого на выполнение
лабораторных работ по данной дисциплине по сравнению с выполнением
данных работ с использованием прикладного пакета MS Excel;
высокая степень удовлетворённости пользователей, использующих
программный продукт.
Данная работа содержит 3 раздела. Первый раздел данной работы
содержит обзор методов анализа временных рядов и инструментария
(статистических пакетов общего назначения и эконометрических пакетов) и их
сравнение. Второй раздел работы содержит: модель «Как должно быть»,
структуру программы, алгоритм работы. В третьем разделе представлены:
процесс
разработки
системы,
функционал
окон
разрабатываемого
программного пакета, результаты его тестирования (контрольный пример), а
также оценку его эффективности.
В приложениях изложены: таблица значений критериев Стьюдента,
обзор некоторых эконометрических методов и увеличенные пояснения
программы
Пояснительная записка изложена на 75 страницах и содержит 48
рисунков, 3 таблицы и 3 приложения.
5
1 Аналитическая часть
1.1 Обзор методов анализа временных рядов
Временной ряд (ряд динамики) – обобщённые статистические данные за
определённый период времени, отражающие значение тех или иных
параметров рассматриваемого процесса [5]. Главным отличием ряда динамики
от простой выборки данных при анализе является учёт связи его измерений с
моментом времени, а не только статистические характеристики[6]. Элемент
временного ряда называется отсчетом или измерением, также допустимо
название его уровнем в том случае, если вместе с ним указан момент времени.
Для каждого отсчета в ряду динамики должен указан соответствующий ему
временной период или порядковый номер его измерения[8].
Анализ временных рядов включает следующие операции[13]:
анализ ряда на стационарность;
определение структуры ряда;
аппроксимация;
построение тренда;
сглаживание.
При
анализе
параметрические,
ряда
на
стационарность
непараметрические
и
применяются
полупараметрические
различные
тесты.
наиболее часто применяемым относятся следующие методы и критерии[13]:
критерий KPSS;
метод выборочной медианы;
критерий Стьюдента;
тест Фишера.
6
К
Критерий
KPSS (критерий
Квятковского-Филлипса-Шмидта-Шина)
заключается в выдвижении двух гипотез:
H0 – временной ряд является стационарным;
H1 – временной ряд не является стационарным.
Если рассматриваемый ряд вида:
где
Yt ct * t et ,
(1.1)
ct ct 1 t ,
(1.2)
– коэффициент тренда;
et – стационарный процесс;
– некоторый независимый и одинаково распределенный с et процесс с
математическим ожиданием 0 и дисперсией 2
2
то при 2=0 подтверждается гипотеза H0, если 0 , то – гипотеза H1,
2
при этом вычисляется по формуле 1.3.
T
St 2
2
t 1
2
s *T
где
(1.3)
2 ,
T – размер выборки;
St e1 e2 ... et ;
s 2 – Стандартная ошибка в форме Нью-Уеста.
Метод выборочной медианы – метод анализа временного ряда на
стационарность, основанный на выборе медианы от временного ряда.
7
Если имеется временной ряд y (t ) , то он сортируется в порядке
возрастания. Далее, если в ряде нечетное число элементов, то в качестве
медианного значения
если – чётное, то
xmed берётся средний элемент отсортированного ряда,
xmed рассчитывается как среднее арифметическое значение
от двух средних элементов. Следующим шагом является построение ряда
y' (t ) xt xmed . После этого строится ряд серий s (t ) по следующим правилам:
если y't 0 , то s(t ) = -1;
если y't 0 , то s (t ) 1 ;
если y't 0 , то s (t ) пропускается.
После этого происходит подсчёт числа серий v и максимальной длины
серии l . При этом под серией понимается непрерывная последовательность
одинаковых элементов ряда s (t ) . Если последующий элемент меняет знак или
был пропущен, то серия прерывается.
Последним этапом является проверка двух условий:
1
* (n 1 - 1,96 * n 1) ;
2
v
l 3,3 * log(n 1) .
Если оба данных условия выполняются, то ряд стационарен и тренда не
имеет. Если нет – ряд нестационарен и имеет тренд. Данный метод прост в
реализации и применении и обладает достаточной точностью. К недостаткам
можно отнести невозможность расчёта вероятности, с которой гипотеза
подтверждается или опровергается.
Критерий Стьюдента – параметрический критерий стационарности ряда
[2]. Суть данного метода заключается в вычислении коэффициента Стьюдента
k b его последующим сравнением с табличным значением, соответствующим
2 степеням свободы, где n 2 – число элементов ряда.
Вначале выдвигаются две гипотезы:
H0 – временной ряд является стационарным;
8
H1 – временной ряд не является стационарным.
При расчёте значения критерия Стьюдента для временного ряда
происходит разбиение его на 2 части, состоящие из T1 и T2 элементов
соответственно. После чего происходит вычисление коэффициента Стьюдента
k по формуле 1.4.
k
где
M1 M 2
s12 s2 2
T1 T2
,
(1.4)
M1 – среднее значение первого субряда;
M1 – среднее значение второго субряда;
s12 –
стандартное отклонение первого субряда
s22 –
стандартное отклонение второго субряда.
После того как коэффициент был вычислен происходит его сравнение с
2 элементов таблицы значений критериев Стьюдента (Приложение А).
Если k 2 , то гипотеза H0 отбрасывается и принимается гипотеза H1,
что означает нестационарность ряда и наличие тренда. Если же k 2 , то ряд
стационарен и тренда не имеет. Данный метод имеет высокую точность, однако
является довольно сложным в применении и реализации. Кроме того, этот
метод
рекомендуется
использовать
только
для
рядов
с
нормальным
распределением, что не всегда возможно.
Тест Фишера – параметрический тест проверки постоянности дисперсии
(стационарности) временного ряда. Суть метода заключается в сравнении
расчётного значения критерия Фишера F c табличным значением F ( p*, n1, n2 ) ,
где P * – заданный уровень доверительной вероятности, n1 n 1 – число
9
степеней свободы ( n – число разбиений), n2 in1 (Ti ) n , где Ti – число
элементов на i – ом интервале разбиения.
В
начале
интервал
наблюдения
временного
ряда
y(t ), t = 1,2,....T разбивается на n интервалов разбиения, после чего происходит
расчёт значения критерия Фишера по формуле 1.5.
F
где
n
1
* T j*( y j y ) 2
n 1 j 1
s 2 ( n)
,
(1.5)
n – число частей разбиения интервала;
Tj
– количество элементов, входящих в интервал разбиения j;
y – среднее значение ряда;
2
s – среднее значение дисперсии, рассчитываемое по формуле 1.6.
2
s
где
sj
1
2
* nj 1 (T j 1) * s j ,
T 1
(1.6)
2
– дисперсия j – го интервала.
Если F F ( p*, n1, n2) , то ряд является стационарным с вероятностью
p*. К достоинствам этого метода отнести возможность подбора вероятности, с
которой ряд будет стационарен. К недостаткам можно отнести высокую
трудоёмкость и неоднозначность результата.
Для определения структуры ряда используется расчёт коэффициентов
автокорреляции. Коэффициент автокорреляции показывает тесноту связи
между уровнями ряда, сдвинутыми на 1 или более шаг. Расчёт коэффициента k
– ого порядка по формуле 1.7.
10
n
∑( yt - y1+ 2*(k -1) ) * ( yt -k - y2*k )
rk =
t = k +1
n
n
t = k +1
t = k +1
,
∑( yt - y1+ 2*(k -1) ) 2 * ∑( yt -k -
где
(1.7)
y2*k ) 2
n – число элементов в временном ряду y ;
rk – коэффициент автокорреляции rk порядка;
n
1
y1+ 2*( k -1) =
* ∑y
n - 1 t = k +1t
n
1
y2*k =
* ∑y
n - 1 t = k +1t -1
При определении структуры ряда, как правило, ограничиваются
расчётом коэффициентов автокорреляции для
n
порядка. После того как
4
коэффициенты были рассчитаны возможны 3 варианта:
r1 – наибольший – ряд имеет линейный тренд;
r1 = rτ – наибольшие – ряд имеет линейный тренд с сезонными
колебаниями периодичности τ ;
rτ – наибольший – ряд имеет нелинейный тренд с сезонными
колебаниями периодичности τ .
Аппроксимация временных рядов может быть подразделена на 2 вида:
линейную и нелинейную.[15]
Линейная аппроксимация предполагает сведение временного ряда к
линейному тренду y' (t ) b a * t t . Данная операция подразумевает расчёт
коэффициентов b и a.
Коэффициент a вычисляется по формуле 1.8.
11
n
n
n
i 1
n
i 1
n * ti * yi ( ti ) * yi
a
i 1
n
n * ti ( ti )
2
i 1
где
,
(1.8)
2
i 1
n – число элементов ряда;
ti – i – й момент времени;
yi – уровень временного ряда y(t ) в i – й момент времени.
Коэффициент b рассчитывается по формуле 1.9.
n
n
i =1
i =1
n * ∑yi - a * ∑ti
b=
n
(1.9)
,
После того как значения коэффициентов были найдены, происходит
расчёт значений y' (t ) для всех моментов времени t.
Нелинейная аппроксимация заключается в сведении временного ряда к
одному из нелинейных трендов. Наиболее часто используемыми при
аппроксимации временного ряда трендами являются:
экспоненциальный тренд;
гиперболический тренд;
степенной тренд;
полиномальный тренд второго порядка.
Экспоненциальный
y(t ) b * ea*t .
Для
тренд
вычисления
представляет
собой
коэффициентов
a
уравнение
и
b
вида
производят
преобразование нелинейной функции y(t ) в линейную функцию y' (t ) b'a'*t ' ,
где :
t'= t ;
y' = ln( y) ;
12
a = a' ;
b = eb ' .
Преобразование заключается в перерасчёте моментов времени t и
значений временного ряда y в соответствии с указанными преобразованиями.
После чего происходит расчёт коэффициентов a ' и b ' по формулам 1.8 и 1.9
соответственно.
Далее
коэффициентов
и
a'
b ' преобразовываются
в
коэффициенты a и b . Последним этапом является расчёт значений временного
ряда y для всех моментов времени.
Гиперболический
y (t ) = b +
a
+ ε.
t
Для
преобразование
тренд
вычисления
нелинейной
представляет
собой
коэффициентов
функции
y(t )
a
в
уравнение
и
b
линейную
вида
выполняют
функцию
y' (t ) b'a'*t ' ,где :
1
t'= ;
t
y' = y ;
a = a' ;
b = b' .
Преобразование заключается в перерасчёте моментов времени t и
значений временного ряда y в соответствии с указанными преобразованиями.
После чего происходит расчёт коэффициентов a ' и b ' по формулам 1.7 и 1.8
соответственно.
Далее
коэффициентов
a'
и
b ' преобразовываются
в
коэффициенты a и b . Последним этапом является расчёт значений временного
ряда y для всех моментов времени.
Степенной тренд представляет собой уравнение вида y(t ) = b * t a * eε .
Для вычисления коэффициентов a и b выполняется преобразование нелинейной
функции y(t ) в линейную функцию y' (t ) b'a'*t ' ,где :
13
t ' = ln(t ) ;
y' = ln( y) ;
a = a' ;
b = eb .
Преобразование заключается в перерасчёте моментов времени t и
значений временного ряда y в соответствии с указанными преобразованиями.
После чего происходит расчёт коэффициентов a ' и b ' по формулам 1.7 и 1.8
соответственно. Далее
коэффициентов
и
a'
b'
преобразовываются
в
коэффициенты a и b . Последним этапом является расчёт значений временного
ряда y для всех моментов времени.
Полиномиальный
тренд
представляет
собой
уравнение
y(t ) = a + b1 * t + b2 * t 2 + ε .
Для нахождения коэффициентов a , b1 и b2 составляется система
уравнений:
a * n + b1 * ∑t + b2 * ∑t 2 = ∑y
a * ∑t + b1 * ∑t 2 + b2 * ∑t 3 = ∑y * t
,
a * ∑t 2 + b1 * ∑t 3 + b2 * ∑t 4 = ∑y * t 2
после чего происходит решение данной системы уравнений методом
Крамера. Для этого рассчитываются следующие определители:
∑t ∑t 2
Δ = ∑t ∑t 2 ∑t 3 ;
∑t 2 ∑t 3 ∑t 4
n
14
∑y
∑t ∑t 2
Δ1 = ∑y * t ∑t 2 ∑t 3 ;
∑y * t 2 ∑t 3 ∑t 4
∑y ∑t 2
∑y * t ∑t 3 ;
Δ 2 = ∑t
∑t 2 ∑y * t 2 ∑t 4
∑t
∑y
Δ 3 = ∑t ∑t 2 ∑y * t .
∑t 2 ∑t 3 ∑y * t 2
n
n
Δ
Δ2
Δ3
Далее происходит расчёт коэффициентов a = 1 , b1 =
и b2 =
.
Δ
Δ
Δ
Последним этапом является расчёт значений временного ряда y для всех
моментов времени.
Для определения наиболее подходящего вида тренда из тех, к которым
был
сведён
временной
ряд,
выполняется
расчёт
средней
ошибки
аппроксимации и коэффициента детерминации.
Средняя ошибка аппроксимации показывает среднее отклонение
расчетных значений от фактических и вычисляется по формуле 1.10.
1 n yi - y'i
A= *∑
n i =1 yi
,
(1.10)
Коэффициент детерминации является статистической мерой согласия, с
помощью которой можно определить, насколько уравнение регрессии
соответствует реальным данным и рассчитывается по формуле 1.11.
15
n
∑( y 'i - y)
R 2 = i =n1
(1.11)
,
∑( yi - y)
i =1
где
y – среднее значение изначального ряда динамики;
y'i – расчётное значение ряда для момента времени i.
Сглаживание временного ряда – важный процесс, позволяющий
уменьшить воздействие значений, слишком сильно отличающихся от среднего.
Это позволит снизить влияние случайных факторов на результаты анализа и
прогнозирования. Наиболее используемыми методами сглаживания являются
метод
скользящего
среднего
и
метод
экспоненциально
взвешенного
скользящего среднего.[17]
При сглаживании Методом скользящего среднего сглаженное значение
временного ряда рассчитывается по формуле 1.12.
m
y ' (t ) =
∑w k * yt + k ,
(1.12)
k = -m
где
w – весовые коэффициенты нумерация которых начинается с –m и
заканчивается m c шагом 1.
Наиболее часто метод скользящего среднего применяют при значениях
m=1,2,3.
1 1 1
При m=1 используют ряд весовых коэффициентов w = { , , } .
3 3 3
При m=2 - ряд весовых коэффициентов w = {-
3 12 17 12 3
, , , ,- } .
35 35 35 35 25
При m=3 - ряд весовых коэффициентов w = {-
2 3 6 7 6 3 2
, , , , , ,- } .
21 21 21 21 21 21 21
Главным недостатком данного метода является потеря крайних 2*m значений.
16
Суть метода экспоненциально взвешенного скользящего среднего
(Метод Брауна) при сглаживании заключается в уделении большего внимания
недалеко отстоящим по времени значениям, т.е. принимается, что недавние
значения временного ряда будут иметь большое влияние на последующие.
Расчёт сглаженного методом Брауна значения временного ряда осуществляется
по формуле 1.13.
y' (t) =
где
1- λ
1- λ
*
y
+
λ
*
* y't -1 ,
t
t+1
t+1
1- λ
1- λ
(1.13)
t = 2,3...n – момент времени.
При этом y '1= y1 . Данный метод отличается от МСС в лучшую сторону
тем, что при сглаживании не теряются крайние значения. Недостатком же
является необходимость подбора коэффициента λ .
1.2 Обзор эконометрических пакетов
К наиболее часто используемым для анализа временных рядов
программным средствам можно отнести[17]:
Пакет MS Excel;
SPSS;
Statistica;
Eviews;
Stata.
Пакет SPSS для Windows на данный момент одним из лидеров среди
универсальных статистических пакетов. SPSS предоставляет широкий набор
средств, позволяющих осуществлять деятельность на всех стадиях анализа [1].
17
К возможностям и особенностям программного пакета SPSS можно
отнести:
удобный доступ к информации;
удобный сбор и ввод данных;
эффективный data - менеджмент;
широкий спектр статистических операций для анализа данных и
построения наиболее достоверных моделей;
– возможность публикации результатов в сети.
Обзор остальных эконометрических пакетов представлен в приложении
Б.
Так как сопоставить качества данных систем и закладываемые в
разрабатываемую
систему
функциональные
возможности
между
собой
достаточно сложно, было принято решение осуществить их сравнение методом
анализа иерархий Саати. Данный метод позволяет осуществить выбор
оптимальной альтернативы, основываясь не только на количественных, но и на
качественных критерий. Однако данный метод достаточно трудоёмок [35].
Использование программного средства позволило бы ускорить анализ с
помощью
данного
метода.
Программа,
обеспечивающая
необходимый
функционал была создана в рамках курса «Методы и системы поддержки и
принятия решений».
В рамках данного анализа можно выделить несколько наиболее
существенных критериев:
стоимость пакета;
функциональность;
удобство интерфейса;
удобность загрузки/выгрузки данных;
понятность пояснений.
Данные критерии и альтернативы были внесены как исходные данные в
разработанной программе, что проиллюстрировано рисунком 1.1.
18
Рисунок 1.1 – Ввод параметров
Далее
была
задана
матрица
парных
сравнений
критериев,
представленная на рисунке 1.2.
Рисунок 1.2 – Матрица парных сравнений критериев
Далее была задана матрица парных сравнений альтернатив для критерия
«Стоимость пакетов», представленная на рисунке 1.3.
19
Рисунок 1.3 – Матрица парных сравнений альтернатив для критерия
«Стоимость пакетов»
Далее была задана матрица парных сравнений альтернатив для критерия
«Удобность загрузки/выгрузки данных», представленная на рисунке 1.4.
Рисунок 1.4 – Матрица парных сравнений альтернатив для критерия
«Удобность загрузки/выгрузки данных»
20
Далее была задана матрица парных сравнений альтернатив для критерия
«Удобство интерфейса», представленная на рисунке 1.5.
Рисунок 1.5 – Матрица парных сравнений альтернатив для критерия «Удобство
интерфейса»
На последнем этапе было произведено подведение итоговой анализа,
заключающийся в расчёте веса каждой альтернативы, что проиллюстрировано
рисунком 1.6.
Рисунок 1.6 – Итог анализа
21
Максимальным весом среди рассмотренных альтернатив обладает
разрабатываемый пакет. Данный результат обусловлен акцентированием
внимания на удобство интерфейса, понятность пояснений и стоимости.
Преимущество
интерфейса
разрабатываемого
обусловлено
его
программного
пакета
русифицированностью
и
в
удобности
закладываемым
минимализмом. При разработке предполагается, что при выполнении анализа
пояснения будут на русском языке, а также будут давать пользователю
программы понятие о том, каким образом и по каким формулам было
рассчитано то или иное значение или принято решение. Преимущество в цене
обусловлено разработкой пакета в рамках ВКР, а также нацеленность пакета на
выполнение не слишком широкого спектра задач, рассматриваемым в рамках
раздела «Временные ряды» дисциплины «Эконометрика».
1.3 Модель «Как есть», недостатки и проблемы
Контекстная диаграмма процесса обучения дисциплине Эконометрика
«Как есть» представлена на рисунке 1.7.
22
Рисунок 1.7 – Контекстная диаграмма «Процесс обучения дисциплине
Эконометрика»
Процесс обучения дисциплине Эконометрика можно разбить на
следующие подпроцессы:
теоретическое обучение;
практическое обучение;
контроль обучения;
сглаживание тренда.[22]
Взаимосвязь перечисленных подпроцессов была изложена на диаграмме
декомпозиции процесса «Процесс обучения дисциплине Эконометрика»,
представленной на рисунке 1.8.
Рисунок 1.8 – Диаграмма декомпозиции процесса «Процесс обучения
дисциплине Эконометрика»
Так как в данной работе рассматривается улучшение практической части
обучения, то дальнейшая декомпозиция процессов «Теоретическое обучение» и
«Контроль обучения» не требуется.
23
Процесс практического обучения в рамках курса «Эконометрика»
предполагает выполнения практических заданий по следующим темам:
корреляционно – регрессионный анализ;
временные ряды;
системы одновременных уравнений;
вычисление значения коэффициента Автокорреляции первого порядка
по ряду из логарифмов.
Взаимосвязь перечисленных подпроцессов была изложена на диаграмме
декомпозиции процесса «Практическое обучения», представленной на рисунке
1.9.
Рисунок 1.9 – Диаграмма декомпозиции процесса «Временные ряды»
24
Анализ ряда на стационарность может быть разбит на следующие
подпроцессы:
определение медианного значения ряда;
построение ряда из разностей Xi-Xmed;
построение серий;
проверка по критерию выборочной медианы.
Взаимосвязь перечисленных подпроцессов была изложена на диаграмме
декомпозиции процесса «Анализ ряда на стационарность», представленной на
рисунке 1.10.
Рисунок 1.10 – Диаграмма декомпозиции процесса «Анализ ряда на
стационарность»
Определение структуры тренда может быть разбито на следующие
подпроцессы:
вычисление коэффициентов автокорреляции;
сравнение значений коэффициентов автокорреляции.
25
Взаимосвязь перечисленных подпроцессов была изложена на диаграмме
декомпозиции процесса «Определение структуры ряда», представленной на
рисунке 1.11.
Рисунок 1.11 – Диаграмма декомпозиции процесса «Определение структуры
ряда»
Определение структуры тренда может быть разбито на следующие
подпроцессы:
вычисление коэффициентов автокорреляции;
сравнение значений коэффициентов автокорреляции.
Взаимосвязь перечисленных подпроцессов была изложена на диаграмме
декомпозиции процесса «Подведение итогов», представленной на рисунке 1.12.
26
Рисунок 1.12 – Диаграмма декомпозиции процесса «Определение вида тренда»
Аппроксимация значений временного ряда может быть разбита на
следующие подпроцессы:
линейная аппроксимация;
экспоненциальная аппроксимация;
гиперболическая аппроксимация;
степенная аппроксимация;
полиномиальная аппроксимация второго порядка.
Взаимосвязь перечисленных подпроцессов была изложена на диаграмме
декомпозиции
процесса
«Аппроксимация
представленной на рисунке 1.13.
27
значений
временного
ряда»,
Рисунок 1.13 – Диаграмма декомпозиции процесса «Аппроксимация значений
временного ряда»
В процессе обучения предполагается применять следующие виды
сглаживания:
сглаживание по алгоритму МСС m=1;
сглаживание по алгоритму МСС m=2;
сглаживание по алгоритму МСС m=3;
сглаживание по методу Брауна;
При этом предполагается выполнять единовременно не боле 1 вида
сглаживания, что подразумевает выбор между ними. Для отображения этого,
диаграмма декомпозиции процесса «Сглаживание ряда» была выполнена в
нотации IDEF3. Данная диаграмма представлена на рисунке 1.14.
28
Рисунок 1.14 – Диаграмма декомпозиции процесса «Сглаживание ряда»
Описанная схема выполнения анализа и прогнозирования значений
временных рядов достаточно минималистична, однако, при выполнении этих
операций вручную или при помощи не специализированных программных
пакетов встаёт вопрос о пояснении всех выполняемых операций, так как
простое шаблонное повторение действий без вывод неэффективно с точки
зрения закрепления полученных навыков, что является ключевым в процессе
обучения.
1.4 Постановка задачи
По результатам анализа существующих эконометрических пакетом
можно прийти к выводу, что они не в полной мере отвечают критериям,
являющимся ключевыми при обучении в университете. В большей части
29
эконометрических пакетов не предусмотрено русской локализации, что
усложняет их освоение. Также следствием широких функциональных
этих
пакетов являются большие затраты при разработке, что обуславливает их
высокую
стоимость
при
приобретении.
Данный
функционал
является
избыточным при обучении раздела «Временные ряды» базового курса
дисциплины «Эконометрика». Однако ключевым недостатком данных пакетов
в рамках процесса обучения является отсутствие пояснений полученных
результатов.
Все перечисленные факторы делают разработку нового программного
пакета оптимальным решением, обеспечивающим сопровождение процесса
обучения. Это, в свою очередь, ставит задачу по реализации следующего
функционала:
загрузка и сохранение данных в файл;
анализ временного ряда на стационарность;
анализ структуры ряда;
определение вида тренда;
построение тренда;
сглаживание ряда методом Брауна, МСС при m=1,2,3;
прогнозирование значений ряда по оптимальному тренду;
вывод пояснений для каждой стадии анализа.
Выводы по первому разделу
В рамках данного раздела был произведён обзор основных методов
анализа временных рядов, рассмотрены и сравнены по существенным в рамках
процесса обучения критериям между собой и с разрабатываемым программным
пакетом. Было осуществлено построение модели процесса обучения «Как есть»
и выявлены его недостатки. Также была осуществлена постановка задачи и её
обоснование.
30
2 Проектная часть
2.1 Модель «Как должно быть»
Контекстная
диаграмма
«Как
должно
быть»
представлена
на
рисунке 2.1.
Рисунок 2.1 – Контекстная диаграмма
Диаграмма декомпозиции процесса «Процесса обучения дисциплине
Эконометрика» (Как должно быть) представлена на рисунке 2.2.
31
Рисунок 2.2 – Диаграмма декомпозиции процесса «Процесса обучения
дисциплине Эконометрика» (Как должно быть)
Диаграмма декомпозиции процесса «Практическое обучение» как
должно быть, представлена на рисунке 2.3.
Рисунок 2.3 – Диаграмма декомпозиции процесса «Практическое обучение»
(Как должно быть)
32
Диаграмма декомпозиции процесса «Временные ряды» (Как должно
быть) представлена на рисунке 2.4.
Рисунок 2.4 – Диаграмма декомпозиции процесса «Практическое обучение»
(Как должно быть)
Дальнейшая декомпозиция модели «Как должно быть» нецелесообразна,
так как ключевым изменением по сравнению с моделью «как есть» заключается
в добавление разработанного прикладного пакета. При этом было важно
отобразить, что данный пакет предназначен для улучшения качества обучения
и анализа в рамках раздела «Временные ряды», что подразумевает участие
данного механизма и в дальнейших декомпозициях процесса «Временные
ряды».
2.2 Структура программы
33
В программа предполагается иметь 8 блоков, блок загрузки и выгрузки
данных: блок анализа на стационарность, блок определения структуры ряда.
блок определения вида тренда. блок подведения итогов, блок сглаживания
значений ряда, блок прогнозирования значения тренда.[23]
Данная структура программы проиллюстрирована рисунком 2.5.
Блок анализа
На
стационарность
Блок
определения
структуры ряда
Блок
определения
вида тренда
Файл
Считанные
Данные
Блок загрузки и
Сохранения
данных
Значения
временного
ряда
Блок подведения
итогов
Записываеме данные
Блок
прогнозирования
значений тренда
Блок
сглаживания
значения ряда
Рисунок 2.5 – Структура программы
При работе программы её взаимодействие с внешними файлами
осуществляется через специализированный блок работы с файлами. Данный
34
блок осуществляет чтение и сохранение временного ряда из файла, а также
передачу данных в остальные блоки программы.
Блок анализа на стационарность осуществляет проверку ряда на
стационарность методом выборочной медианы.
Блок
определения
структуры
ряда
осуществляет
вычисление
коэффициентов автокорреляции и осуществляет выводы по структуре ряда,
основываясь на том, коэффициент какого порядка является максимальным.
Блок определения вида тренда осуществляет сведение исходного
временного
ряда
к
линейному,
экспоненциальному,
гиперболическому,
степенному и полиномиальному.
В блоке построения тренда осуществляется построение графиков по
сведённым трендам.
В блоке подведения итогов вывод данных по стационарности и
структуре ряда, а также рассчитываются коэффициенты автокорреляции и
детерминации.
В блоке сглаживания значения тренда осуществляется сглаживание
методом Брауна, методом скользящей средней с m=1, методом скользящей
средней с m=2, методом скользящей средней с m=3.
В блоке прогнозирования осуществляется расчёт прогнозных значений
временного
ряда
по
определённому
оптимальному
тренду
и
рассчитанных значений в виде графика.
2.3 Алгоритм работы
Общий алгоритм работы программы представлен на рисунке 2.6.
35
вывод
Начало
Ввод ряда
Проверка на
стационарность
Да
Ряд
стационарен?
Нет
Подведение
итогов
Определение
структуры ряда
Определение вида
тенда
Построение
тренда
Подведение
итогов
Выбрано
сглаживание
Сглаживание
значений ряда
Выбрано построение
тренда
Прогнозирование
Конец
Рисунок 2.6 – Общий алгоритм работы
В соответствии с общим алгоритмом работы прикладной пакет в ходе
своей работы выполняет следующие действия: осуществляется ввод значений
анализируемого временного ряда, после чего происходит проверка на
стационарность временного ряда на стационарность. Если проверка ряда на
стационарность показала, что ряд стационарен, то сразу же происходит вывод
итогов анализа, а также даётся возможность провести сглаживание значений
36
временного ряда. Если же ряд оказался нестационарным, то следующим этапом
становится определение структуры ряда. После определения структуры ряд
осуществляется определение вида тренда и его построение. После происходит
подведение итогов с условием, что ряд не является стационарным, после чего
становится возможным осуществить сглаживание значений временного и/или
значений тренда.
Алгоритм выполнения подпроцесса «Проверка на стационарность»
представлен на рисунке 2.7.
Проверка на
стационарность
Сортировка ряда
в порядке
возрастан ия
Вычисление
медианы
Составление ряда
разностей XiXmed
Составления ря да
серий
Вычислений V И l
Проверка по
критерию
выборочной
медианы
Передача
данных о
стаци онарн
ости в
другие
блоки
Конец
Рисунок 2.7 – Алгоритм проверки на стационарность
37
В соответствии с алгоритмом при проверке на стационарность
осуществляется следующая последовательность действий: вначале происходит
сортировка временного ряда по возрастанию. После чего осуществляется
расчёт медианного значения временного, равного или серединному элементу
отсортированного ряда, если количество членов ряда нечётное, либо среднему
арифметическому от двух серединных элементов ряда, если количество членов
ряда чётное. После это выполняется составление ряда из разниц Xi-Xmed, что в
дальнейшем необходимо для построения ряда серий. При составлении ряда
серий значение соответствующего элемента ряда серии приравнивается к -1,
если элемент ряда разниц меньше 0 , а к 1, если – больше, и пропускается, если
равно. После чего определяется число серий и их наибольшая длина. После
этого
по
критерию
выборочной
медианы
выносится
заключение
о
стационарности или нестационарности временного ряда.
Алгоритм выполнения подпроцесса «Определение структуры ряда»
представлен на рисунке 2.8.
Определение
структуры ряда
Вычисление
коэффици ен тов
автокорреляции
r1,r2,..rn
r
Тр енд
линеен
r1-max
Тр енд
линеен и
сезонен
r1=rt - max
rt - max
Тр енд
нелинеен и
сезонен
Конец
Рисунок 2.8 – Определение структуры ряда
38
В соответствии с алгоритмом при проверке на стационарность
происходит вычисление коэффициентов автокорреляции вплоть до порядка n/2,
где т – число элементов изначального ряда. После чего происходит
определение
максимального
максимальным
оказался
коэффициента
коэффициент
первого
автокорреляции.
порядка,
то
Если
выводится
информация о том, что ряд имеет линейный тренд, если r1 и rt максимальны, то
тренд тоже линеен, однако имеет сезонную составляющую, если же
наибольшим оказывается rt, то ряд имеет нелинейный тренд с сезонной
составляющей или просто сезонные колебания, поэтому нудна дополнительная
проверка на наличие нелинейного тренда.
Алгоритм
выполнения
подпроцесса
«Определение
представлен на рисунке 2.9.
Определение вида
тенда
Линейная
аппроксимация
Экспоненциальна
я аппроксимация
Гиперболическая
аппроксимация
Степенная
аппроксимация
Полиномальная
аппроксимация
второго порядка
Конец
Рисунок 2.9 – Определение вида тренда
39
вид
тренда»
В
соответствии
последовательности
с
алгоритмом
происходят
при
определении
линейные,
вида
тренда
экспоненциальные,
гиперболические, степенные и полиномиальные аппроксимации. После чего
осуществляется построение и вывод этих трендов.
Алгоритм выполнения подпроцесса «Подведение итогов» представлен
на рисунке 2.10.
Подведение
итогов
да
Ряд
стационарен?
Ряд
стационаре
н и тренда
не имеет
нет
Вывод
данных по
стационарн
ости
Вывод
данных по
структуре
ряда
Расчёт средних
ошибок
аппроксимации
Тренд с
наименьшей
ошибкой
аппроксимации
оптимален
Конец
Рисунок 2.10 – Алгоритм подведения итогов
40
В соответствии с алгоритмом при подведении итогов происходи вывод
информации о том, что ряд стационарен, если соответствующие данные
пришли из блока анализа ряда на стационарность. Если же пришедшие данные
говорят о нестационарности ряда, то данная информация выводится для
пользователя. После чего осуществляется вывод информации по расчётной
структуре ряда. Следующим этапом является расчёт средней ошибки
аппроксимации для рядов, составленных в блоке определения вида тренда.
После чего происходит выводится информация о тренде с наименьшей средней
ошибкой аппроксимации как о наиболее точно описывающем данный
случайный Процесс.
Алгоритм выполнения подпроцесса «Сглаживание ряда » представлен
на рисунке 2.11.
Сглаживание
значений ряда
Выбор метода
Выбрано сглаживание
методом Брауна
Сглаживание ряда
методом Брауна
Выбрано сглаживание
MСС m=1
Сглаживание
МСС , m=1
Сглаживание
МСС , m=2
Выбрано сглаживание
MСС m=2
Выбрано сглаживание MСС m=2
Сглаживание
МСС , m=3
Конец
Рисунок 2.11 – Алгоритм сглаживания
41
В соответствии с алгоритмом при подведении проведении сглаживания
существует возможность выбрать способ сглаживания из следующих:
сглаживание методом Брауна, сглаживание МСС при m=1, сглаживание МСС
при m=2, сглаживание МСС при m=3.
Последним
из
основных
подпроцессов
является
процесс
прогнозирования, алгоритм которого представлен на рисунке 2.12.
Прогн озирование
Ввод периода
прогнози рован ия t
Расчёт значений по
оптимальному тренду
Конец
Рисунок 2.12 – Алгоритм сглаживания
В соответствии с алгоритмом при подведении проведении сглаживания
сперва происходит ввод периода прогнозирования, после чего рассчитываются
дополнительно t значений по оптимальному тренду, определённому при
подведении итогов анализа.
Выводы по второму разделу.
В рамках данного раздела было проведено моделирование процесса
обучения «Как должно быть», построение структуры программы и разработка
алгоритма её работы, включая проверку ряда на стационарность, определение
структуры ряда, определение вида тренда, построение тренда, подведение
итогов, сглаживание по 4 – м алгоритмам и прогнозирование значений
временного
ряда.
42
3 Разработка и тестирование программного пакета и оценка
эффективности
3.1 Разработка пакета
При разработке в соответствии со структурой программы на главной
форме приложения были размещены вкладки:
временной ряд;
стационарность;
структура ряда;
вид тренда;
итог анализа;
сглаживание;
прогнозирование.
Каждая из данных вкладок соответствует определённому блоку
программы [3]. При запуске программы происходит открытие вкладки
«временной
ряд»
разработанного
приложения,
рисунком 3.1.
43
что
проиллюстрировано
Рисунок 3.1 – Вкладка «временной ряд»
На данной вкладке располагается элемент DataGridView, позволяющий
пользователю вводить и редактировать значения уровней ряда динамики. В
контекстном меню имеется 2 пункта: файл и провести анализ. Пункт файл
имеет подпункты «Открыть», «Сохранить» и «Сохранить как», позволяющие
осуществлять загрузку и выгрузку данных [33]. При инициализации открытия
пользователю становится доступно диалоговое окно, представленное на
рисунке 3.2.
Рисунок 3.2 – Окно открытия файла
Данное окно позволяет выбрать txt-файл, в котором были записаны
значения временного ряда. При успешном открытии файла меню приобретает
вид, представленный на рисунке 3.3.
44
Рисунок 3.3 – Вкладка «Временной ряд» с загруженными данными
При сохранении файла выводится окно, схожее с окном на рисунке 3.2.
При успешном сохранении выводится сообщение об успешной операции,
представленное на рисунке 3.4.
Рисунок 3.4 – Сообщение о сохранении
При инициализации анализа происходит проверка значений временного
ряда. Если элемент временного ряда окажется не числом, то будет выведено
соответствующее сообщение, представленное на рисунке 3.5.
45
Рисунок 3.5 – Сообщение о несоответствии элемента ряда
После того как анализ был инициализирован, пользователю станут
доступны вкладки «Стационарность», «Итоги» и «Сглаживание». Если при
проверке на стационарность ряд окажется нестационарным, то пользователю
станут доступны для просмотра и вкладки «Структура ряда», «Вид тренда»,
«Построение тренда» и прогнозирование. [4]
Вкладка
«стационарность»
при
проведении
анализа
введённого
временного ряд приняла вид, представленный на рисунке 3.6.
Рисунок 3.6 – Вкладка «Стационарность»
При проведении анализа в таблицу записываются значения исходного и
упорядоченного ряда, также разница элемента и медианы, ряд серий, а также
длина непрерывной серии для текущего элемента серии. В пояснении
выводится информация о медианном значении и о результате проверки ряда на
стационарность методом выборочной медианы. Вкладка «Структура ряда»
имеет вид, представленный на рисунке 3.7.
46
Рисунок 3.7 – Вкладка «Структура ряда»
Данная
вкладка
содержит
информацию
о
n/2
коэффициентах
автокорреляции и информацию о структуре ряда, выведенных в соответствии
со значениями данных коэффициентов.
Вклада «Вид тренда» имеет вид, представленный на рисунке 3.8.
Рисунок 3.8 – Вкладка Вклада «Вид тренда»
Данная вкладка содержит аппроксимированные значения временного
ряда.
47
Построение данных трендов происходит на вкладке «Построение
тренда», представленной на рисунке 3.9.
Рисунок 3.9 – Вкладка «Построение тренда»
Данная вкладка содержит графики всех аппроксимированных трендов и
исходного ряда. При этом имеется возможность выбирать, какие графики
должны быть отражены.
Итог анализа подводится на одноимённой вкладке, представленной на
рисунке 3.10.
Рисунок 3.10 – Итог анализа
48
Данная
вкладка
содержит
информации
о
средней
ошибке
аппроксимации и значении коэффициентов детерминации. Также на ней
происходит
выбор
наиболее
подходящего
тренда,
соответствующего
минимальному значению средней ошибки аппроксимации.
При открытии вкладка «Сглаживание» имеет вид, представленный на
рисунке 3.11.
Рисунок 3.11 – Вкладка «Сглаживание»
Данная вкладка позволяет выбрать один из четырёх способов
сглаживания значений временного ряда при нажатии на соответствующий
элемент меню. Ряд, сглаженный методом Брауна, представлен на рисунке 3.12.
49
Рисунок 3.12 – Метод Брауна
Ряд, сглаженный МСС при m=1, представлен на рисунке 3.13.
Рисунок 3.13 – Сглаживание МСС, m=1
Ряд, сглаженный МСС при m=2, представлен на рисунке 3.14.
50
Рисунок 3.14 – Сглаживание МСС, m=2
Ряд, сглаженный МСС при m=3 представлен на рисунке 3.15.
Рисунок 3.15 – Сглаживание МСС, m=2
Результат прогнозирования значения ряда для оптимального тренда
представлен на рисунке 3.16.
3.16 – Вкладка «Итоги»
51
3.2 Контрольный пример
В качестве контрольного примера был проведён анализ временного
ряда, представленного в таблице 3.1.
Таблица 3.1 – Временной ряд
Момент времени t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
Значение временного ряда
11,672
16,52
11,535
8,773
4,809
14,159
19,465
16,728
14,692
14,671
14,009
11,592
14,193
23,388
25,105
25,934
34,922
35,309
41,581
50,693
54,869
49,28
54,719
46,118
47,368
43,159
49,565
46,989
52
29
30
50,268
49,289
Результат анализа этого ряда представлен на рисунке 3.17.
Рисунок 3.17 – Результат анализа ряда на стационарность
Так как второе условие стационарности по критерию выборочной
медианы было нарушено, то ряд нестационарен и имеет тренд.
Анализ структуры ряда представлен на рисунке 3.18.
Рисунок 3.18 – Результат анализа структуры ряда
53
Так как коэффициент автокорреляции первого порядка является
максимальным и равным коэффициенту автокорреляции второго порядка, то
имеет место линейный тренд с сезонными колебаниями периодичности 2.
Результат определения вида тренда представлен на рисунке 3.19.
Рисунок 3.19 – Результат определения вида тренда
Результат построения аппроксимированных трендов представлен на
рисунке 3.20.
Рисунок 3.20 – Результат определения вида тренда
54
Итоги анализа представлены на рисунке 3.21.
Рисунок 3.21 – Результат определения вида тренда
По итогам анализа ряд является нестационарным, имеет линейный тренд
с сезонными колебаниями. Наиболее подходящим для описания временного
ряда трендом является линейный, так средняя ошибка аппроксимации для него
минимальна, а коэффициент детерминации достаточно близок к единице.
Результат сглаживания ряда методом Брауна представлен на рисунке
3.22.
Рисунок 3.22 – Результат сглаживания методом Брауна
55
Результат сглаживания ряда МСС с m=1 представлен на рисунке 3.23.
Рисунок 3.23 – Результат сглаживания МСС m=1
Результат сглаживания ряда МСС с m=2 представлен на рисунке 3.24.
Рисунок 3.24 – Результат сглаживания МСС m=2
Результат сглаживания ряда МСС с m=3 представлен на рисунке 3.25.
56
Рисунок 3.25 – Результат сглаживания МСС m=2
Из всех методов сглаживания МСС с m=1 является наиболее
оптимальным, так как тренд, сглаженный этим методом, наиболее приближен к
изначальному, а потери значений при этом минимальны.
Результат прогнозирования значений временного ряда по оптимальному
тренду на 10 моментов времени представлен на рисунке 3.26.
Рисунок 3.26 – Результат прогнозирования
Так как все расчёты, выполненные программой, корректны, то
разработанный программный пакет обеспечивает необходимый функционал.
Пояснения по работе каждой вкладки программы представлены в приложении
В.
57
3.3 Оценка эффективности
В качестве критериев эффективности были выбраны:
значительное сокращение времени, затрачиваемого на выполнение
лабораторных работ по данной дисциплине;
высокая степень удовлетворённости пользователей, использующих
программный продукт.
Для их оценки наиболее подойдут опросы пользователей.
Для проверки первого критерия был проведён опрос среди уже
использовавших программу студентов, содержащий 2 вопроса:
сколько приблизительно времени вы затрачивали на выполнение
лабораторных работ по разделу «Анализ временных рядов» дисциплины
«Эконометрика» в минутах;
сколько приблизительно времени вы затрачивали на выполнение этих
же лабораторных работ по дисциплине «Эконометрика» при использовании
программного пакета в минутах.[37]
Результат опроса представлен в таблице 3.2.
Таблица 3.2 – Результат опроса о затраченном времени.
Респондент
1
2
3
4
5
6
7
8
ЛР№1
Время Врем
до,
я
мин. после
, мин.
240
80
200
120
250
180
300
120
120
80
400
240
320
140
180
60
ЛР№2
Врем Врем
я до,
я
мин. после
, мин.
100
40
220
60
180
130
260
140
310
210
220
155
350
160
360
120
58
ЛР№3
Врем Врем
я до,
я
мин. после
, мин.
260
140
310
210
400
180
480
240
360
120
390
120
420
280
360
120
ЛР№4
Врем Врем
я до,
я
мин. после
, мин.
260
140
310
210
340
210
270
200
240
100
300
180
370
140
180
120
ЛР№5
Врем Врем
я до,
я
мин. после
, мин.
360
120
300
210
270
200
360
120
120
80
300
180
360
120
300
180
9
10
11
12
13
Среднее
Соотношение средних
Среднее
Соотношен
ие средних
210
120
410
250
330
256,1
150
90
180
140
90
128
1,994011976
300
120
220
300
300
249
180
45
90
220
150
130
1,905882353
300
420
280
360
330
359
180
240
140
200
90
173,8
2,066371681
360
340
270
360
330
302,3
120
230
145
120
90
154,2
1,960099751
320
270
250
360
330
300
180
200
180
200
90
158,5
1,893203883
1,963913929
При подсчете отношения между средними соотношениями средних
было получено значение 1.96, что говорит об оценочном сокращении времени
на выполнение лабораторных работ.
Для проверки второго критерия был создан опрос Google Forms и
разослан той же группе респондентов.[38;39]
Данный опрос представлен на рисунке 3.16.
59
Рисунок 3.16 – Опрос об удовлетворённости
Соотношении ответов на вопрос «Насколько удобен пользовательский
интерфейс пакета?» представлено на рисунке 3.17
60
Рисунок 3.17 – Ответы на первый вопрос
Соотношении ответов на вопрос «Насколько удобен пользовательский
интерфейс пакета?» представлено на рисунке 3.18
Рисунок 3.18 – Ответы на второй вопрос
Соотношении ответов на вопрос «Насколько функционал пакета
соответствует
содержанию
раздела
"Временные
"Эконометрика"?» представлено на рисунке 3.19
61
ряды"
дисциплины
Рисунок 3.19 – Ответы на третий вопрос
Соотношении ответов на вопрос «Насколько функционал пакета
соответствует
содержанию
раздела
"Временные
ряды"
дисциплины
"Эконометрика"?» представлено на рисунке 3.20
Рисунок 3.20 – Ответы на четвёртый вопрос
Анализирую ответы по данным четырём вопросам можно сделать вывод,
что пользователи в целом удовлетворены прикладным пакетом, так как
большинство ответов по ним составляют варианты «да» и «скорее да», однако
сохраняется широкий простор для последующего улучшения путём добавления
новых функциональных возможностей. Таким образом, в соответствии с
результатами данных опросов можно сделать вывод, что критерии достижения
цели достигнуты.
62
ЗАКЛЮЧЕНИЕ
В рамках работы был произведён анализ предметной области,
включающий: обзор наиболее употребляемых при анализе временных рядов
эконометрических методов и программных решений, сравнение их между
собой и с разрабатываемым программным пакетом по критериям стоимости,
удобства пользовательского интерфейса, удобства, а также моделирование
процесса обучения «Как есть» и постановка задачи. Таким образом была
выполнена задача по анализу предметной области.
В рамках проектирования были выполнены следующие операции:
моделирование процесса обучения «Как должно быть», описание структуры и
алгоритма работы программы. Это обеспечило выполнение задач по
проведению моделирования процесса обучения «Как есть» и «Как должно
быть» и по проектированию программного пакета.
В рамках разработки и тестирования было осуществлено описание
процесса разработки, выполнен контрольный пример, а также произведена
оценка
эффективности
разработанного
программного
пакета,
что,
в
совокупности, обусловило выполнение задачи по разработке пакета и оценке
его эффективности.
Так как в ходе оценки эффективности путём опроса было установлено,
что оценочное время на выполнение лабораторных работ по разделу
«Временные ряды» дисциплины «Эконометрика» существенно сократилось, а
пользователи в целом удовлетворены разработанным программным продуктом,
то можно сделать вывод, что цель выпускной квалификационной работы была
достигнута по выбранным критериям.
Таким
образом,
все
поставленные
в
рамках
квалификационной работы задачи был решены, а цель – достигнута.
63
выпускной
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
1
Multi-critera selection of a corporate system by using paired comparison
analysis [Текст] / V. V. Lomakin, N. P. Putivtseva, T. V. Zaitseva // Journal of
Fundamental an Applied Sciences Vol 9, No 7S (2017).
2
Эконометрика (базовый курс) НИУ «БелГУ» [Текст]: учебное
пособие / Н.П. Путивцева, Т.В. Зайцева, Е.В. Нестерова и др. – Белгород: ООО
«ГИК», 2013. – 203 с.
3
Разработка
специализированного
пакета
моделирования
экономических процессов [Текст] / Н.П. Путивцева, Т.В. Зайцева,
С.В.
Игрунова и др. // Информатика: проблемы, методология, технологии: сборник
материалов XVI международной научно-практической конференции, Воронеж,
11-12 февраля 2016 г. – Воронеж: Научно-исследовательские публикации,
2016.
4
О разработке пакета компьютерной поддержки принятия решений
для выбора корреляционно-регрессионных моделей анализа и прогнозирования
эмпирических данных [Текст] / Н.П. Путивцева, Т.В. Зайцева, С.В. Игрунова и
др. // Научные Ведомости Белгородского Государственного Университета.
Серия: ИСТОРИЯ. Политология. Экономика. Информатика. – Белгород: Изд-во
НИУ «БелГУ», 2015. – 11 с.
5
Елисеева, И.И. Эконометрика.Учебник. [Текст] / И.И. Елисеева. –
Москва: Финансы и статистика, 2003. – 344 с.
6
Артамонов, Н.В. Введение в эконометрику. [Текст] / Н.В.
Артамонов. – Москва: МЦНМО, 2011. – 202 с.
7
Белолипецкий, А.А. Экономико-математические методы. [Текст] /
А.А. Белолипецкий. – Москва: Академия, 2010. – 364 с.
8
Валентинов, В.А. Эконометрика. [Текст] / Валентинов В.А. –
Москва: Дашков и К, 2010. – 448 с.
64
9
Колемаев, В.А. Эконометрика. [Текст] / В.А. Колемаев. – Москва:
ИНФРА-М, 2010. – 160 с.
10 Гладилин, А.В. Эконометрика: Учебное пособие для студ. вузов по
спец. "Математические методы в экономике" и другим экономическим
специальностям. [Текст] / А.В. Гладилин. – Москва: КНОРУС, 2009. – 232 с.
11 Выявление структуры временного ряда [Электронный ресурс] / math.
studopedia.ru – Режим доступа: https://studopedia.ru/4_78226_viyavlenie-strukturivremennogo-ryada.html, свободный.
12 Айвазян, С. А. Эконометрика [Текст]/ С.А. Айвазян, С.С. Иванова. –
Москва: Маркет ДС, 2017. – 104 c.
13 Гладилин, А. В. Практикум по эконометрике / А.В. Гладилин, А.Н.
Герасимов, Е.И. Громов. – Москва: Феникс, 2016. – 336 c.
14 Подкорытова, О.А. Анализ временных рядов. Учебное пособие для
бакалавриата и магистратуры [Текст] / О.А. Подкорытова. – Москва: Юрайт,
2016. – 456 c.
15 Уравнение
math.semestr.ru
–
нелинейной
регрессии
Режим доступа:
[Электронный
ресурс]
/
https://math.semestr.ru/corel/noncorel.php,
свободный.
16 Эконометрическая
модель
как
основа
эконометрического
моделирования. Типы данных и виды переменных в эконометрических
исследованиях экономических явлений [Электронный ресурс] / studopedia.ru –
Режим доступа:
https://studopedia.ru/2_34934_ekonometricheskaya-model-kak-
osnova-ekonometricheskogo-modelirovaniya-tipi-dannih-i-vidi-peremennih-vekonometricheskih-issledovaniyah-ekonomicheskih-yavleniy.html, свободный.
17 Методы сглаживания временного ряда [Электронный ресурс] / math.
studopedia.ru
–
Режим доступа:
https://studopedia.ru/12_194491_metodi-
sglazhivaniya-vremennogo-ryada-videlenie-nesluchaynoy-komponenti.html,
свободный.
18 Мюллер, Г. Анализ временных рядов и прогнозирование. [Текст]/ Г.
Мюллер и др. – Москва: Финансы и статистика, 2012. – 320 c.
65
19 Садовникова, Н.А. Анализ временных рядов и прогнозирование /
Н.А. Садовникова, Р.А. Шмойлова. – Москва: МФПУ Синергия, 2016. – 152 c.
20 Афанасьев, В.Н. Анализ временных рядов и прогнозирование.
[Текст] / В.Н. Афанасьев. – Москва: Финансы и статистика, 2012. – 320 c.
21 Бодров,
О.А.
Предметно-ориентированные
экономические
информационные системы[Текст] / О.А. Бодров. – Москва: ГЛТ, 2013. – 244 c.
22 Маторин, С.И. Теория систем и системный анализ: Учебное пособие
[Текст] / С.И. Маторин, О.А. Зимовец. – Белгород: Изд-во НИУ «БелГУ», 2012.
– 288 с.
23 Паттерсон,
Д.
Архитектура
компьютера
и
проектирование
компьютерных систем[Текст] / Д. Паттерсон. – Москва: Питер, 2012. – 784 c.
24 Чистов, Д. В. Проектирование информационных систем. Учебник и
практикум. [Текст] / Д. В. Чистов. – Москва: Юрайт, 2016. – 258 с.
25 Регрессия в Excel [Электронный ресурс]: уравнение, примеры.
Линейная регрессия/ fb.ru – Режим доступа: http://fb.ru/article/322644/regressiyav-excel-uravnenie-primeryi-lineynaya-regressiya, свободный.
26 EViews [Электронный ресурс] / statmethods.ru – Режим доступа:
http://www.statmethods.ru/trainings/eviews.html, свободный.
27 Statgraphics Plus for Windows [Электронный ресурс] / statmethods.ru –
Режим доступа:https://studwood.ru/1940662/informatika/statgraphics_plus_window
s_obschie_unikalnye_svoystva, свободный.
28 Возможности пакета spss для работы с данными [Электронный
ресурс]
/
–
studfiles.net
Режим
доступа:
https://studfiles.net/preview/5862667/page:6 , свободный.
29 Пакет Stata [Электронный ресурс] / studopedia.ru – Режим доступа:
https://studopedia.ru/5_131342_paket-Stata.html, свободный.
30 Положение
о
выпускных
квалификационных
работах
дипломированного специалиста, бакалавра, магистра (утв. 30.06.2014 г.)
[Текст]. – Белгород: Изд-во БелГУ, 2014. - 20 с.
66
31 Виссер, Дж. Разработка обслуживаемых программ на языке C#
[Текст] / Дж. Виссер. – Москва: ДМК Пресс, 2017. – 194 c.
32 Шарп, Дж. Microsoft Visual C#. Подробное руководство. 8-е издание
[Текст] / Дж. Шарп. – Санкт – Петербург: Питер, 2017. – 848 с.
33 Ошероув, Р. Искусство автономного тестирования с примерами на
С# [Текст] / Р. Ошероув. – Москва: ДМК Пресс, 2014. – 360 с.
34 Албахари, Д. C# 6.0. Справочник. Полное описание языка [Текст] / Д.
Албахари. – Москва: Вильямс, 2016. – 1040 с.
35 Саати, Т. Принятие решений. Метод анализа иерархий. [Текст]. / Т.
Саати; пер. с анг. Р.Г. Вачнадзе. – Москва: Радио и связь, 1993. – 278 с.
36 Сухарев, М.Г. Методы прогнозирования. Учеб. пособие – Москва:
РГУ нефти и газа, 2009 г. – 208 с.
37 Батыгин,
Г.С.
Лекции
по
методологии
социологических
исследований [Текст] / Г.С. Батыгин. – Москва: Российский университет
дружбы народов (РУДН), 2016. – 295 c.
38 Обработка опросов в Google формах [Электронный ресурс] / math.
web-komfort.ru
–
Режим доступа:
http://web-komfort.ru/obrabotka-oprosov-v-
google-formah, свободный.
39 Все возможности Google forms [Электронный ресурс] / math.
netology.ru – Режим доступа: https://netology.ru/blog/google-formy, свободный.
40 Обзор
программного
обеспечения
эконометрического
моделирования [Электронный ресурс] / scienceforum.ru – Режим доступа:
https://www.scienceforum.ru/2015/802/7954, свободный.
41 ГОСТ
19.701-90
(ИСО
5807-85).
ЕДИНАЯ
СИСТЕМА
ПРОГРАММНОЙ ДОКУМЕНТАЦИИ (ЕСПД). Схемы алгоритмов, программ,
данных и систем. Обозначения условные и правила выполнения [Текст]. –
Взамен ГОСТ 19.002-80, ГОСТ 19.003-80; Введ. 01.01.1992.
42 ГОСТ 7.32-2001. Отчет о научно-исследовательской работе.
Структура и правила оформления [Текст]. - Взамен ГОСТ 7.32 - 91; Введ.
67
01.07.2002. – Москва: Стандартинформ, 2008. – 20 с. - (Система стандартов по
информации, библиотечному и издательскому делу).
43 Фот,
А.П.
Оформление
библиографических
ссылок
на
использованные источники в научных работах [Электронный ресурс]:
методические рекомендации соискателям ученых степеней / А.П. Фот. –
Электрон. документ. – Оренбург: ГОУ «ОГУ», 2005. – 24 с. – Режим доступа:
http://www.osu.ru/docs/official/nauka/bibllinks.doc, свободный.
44 Информационные технологии в эконометрических исследованиях
[Электронный
ресурс]
/
math.
studopedia.ru
–
Режим доступа:
https://studopedia.ru/19_246703_tema--informatsionnie-tehnologii-vekonometricheskih-issledovaniyah.html, свободный.
68
ПРИЛОЖЕНИЕ А
Таблица значений критерия Стьюдента
Таблица А.1 – Таблица значений критерия Стьюдента [36]
Степень свободы
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
∞
k
6,31
2,92
2,35
2,13
2,02
1,94
1,9
1,86
1,83
1,81
1,8
1,78
1,77
1,76
1,75
1,75
1,74
1,73
1,73
1,73
1,72
1,72
1,71
1,71
1,71
1,71
1,7
1,7
1,7
1,7
1,68
1,65
70
ПРИЛОЖЕНИЕ Б
Обзор эконометрических пакетов
Microsoft Excel предоставляет богатый набор инструментов для анализа
статистических данных [25]. К наиболее часто употребляемым для анализа
временных рядов функциям, реализованным в пакета Excel являются:
ЛИНЕЙН – осуществляет расчёт массив данных, описывающих
уравнение линейной множественной регрессии;
РОСТ – осуществляет расчёт будущий уровней ряда в соответствии с
экспоненциальной кривой;
ЛИНЕЙН – осуществляет расчёт значений временных рядов,
соответствующих уравнению линейной множественной регрессии.
ЛГРФПРИБЛ – осуществляет расчёт значений временных рядов,
соответствующих экспоненциального тренда;
Для более полного анализа используется вкладка анализ данных,
представленная на рисунке Б.1.
Рисунок Б.1 – окно «Анализ данных»
При этом существует возможность добавления линии тренда на сами
графики.
При
этом
можно
построить
71
экспоненциальный,
степенной,
гиперболический
,логарифмический
и
полиномиальный
тренды,
что
проиллюстрировано рисунком Б.2.
Рисунок Б.2 – построение тренда в excel.
К преимуществам регрессионного анализа посредством пакета MS Excel
можно отнести его интегрированности для работы с самим табличным
процессором и русифицированность интерфейса и результатов анализа. К
недостаткам данного пакета можно отнести невозможность подробного
просмотра процесса анализа.
К возможностям и особенностям программного пакета SPSS можно
отнести:
удобный доступ к информации;
удобный сбор и ввод данных;
эффективный data - менеджмент;
широкий спектр статистических операций для анализа данных и
построения наиболее достоверных моделей;
возможность публикации результатов в сети.
STATGRAPHICS Plus for Windows включает более 250 статистических и
системных процедур, применяющихся в бизнесе, экономике, маркетинге,
медицине, биологии, социологии, психологии, на производстве и в других
областях. [27]
72
Базовый пакет даёт большой выбор инструментальных средств для
анализа и прогнозирования данных, при этом обладая хорошей оптимизацией и
удобным интерфейсом.
Популярность пакета STATISTICA обуславливается продвинутыми
методами
визуализации
результатов,
высокая
степень
интеграции
с
прикладным пакетом MS Excel, дающая возможность удобного экспорта
данных и обращения к функциям Excel прямо из меню пакета STATISTICA.
Интерфейс пакета представлен на рисунке Б.3.
Рисунок Б.3 – Интерфейс пакета «Statistica»
Как видно из рисунка Б.3, интерфейс программы выполнен на
английском языке, что создаёт некоторые трудности при работе. Также к
недостаткам данного пакета можно отнести наличие модулей, излишних для
анализа временных рядов на уровне предусмотренной учебной программой.
EViews – пакет статистического анализа, используемый, в основном, для
анализа
эконометрических
данных
временных
рядов,
моделирования
панельных данных и построения регрессионных моделей. Интерфейс пакета
представлен на рисунке Б.4. [25]
73
Рисунок Б.4 – интерфейс пакета «EViews»
Данный пакет обладает следующими достоинствами:
включает в себя широкий выбор методов эконометрического анализа;
хорошо проработанная система справки;
хорошая оптимизация и высокая производительность;
возможность разработки собственных скриптов.
Недостатком данного пакета являются отсутствие русифицированной
версии.
Stata – пакет статистического анализа с широким спектром применения.
К достоинствам данной системы можно отнести:
широкий выбор средств для эконометрического анализа;
подробная система справки;
доступная цена;
наличие обучающих роликов.
Недостатками данной системы являются:
сложный командный синтаксис;
нерусифицированность интерфейса и справки. [29]
74
ПРИЛОЖЕНИЕ В
Пояснения по вкладкам приложения
Пояснения по вкладке «Стационарность» представлены на рисунке В.1.
Рисунок В.1 – Пояснения по вкладке «Стационарность»
Пояснения по вкладке «Структура ряда» представлены на рисунке В.2.
Рисунок В.2 – Пояснения по вкладке «Структура ряда»
75
Пояснения по вкладке «Вид тренда» представлены на рисунке В.3.
Рисунок В.3 – Пояснения по вкладке «Вид тренда»
Пояснения по вкладке «Подведение итогов» представлены на рисунке
В.4.
Рисунок В.4 – Пояснения по вкладке «Подведение итогов»
Пояснения по вкладке «Сглаживание» при применении сглаживания
методом Брауна представлены на рисунке В.5.
76
Рисунок В.5 – Пояснения по вкладке «Сглаживание» при применении
сглаживания методом Брауна
Пояснения по вкладке «Сглаживание» при применении сглаживания
МСС m=1 представлены на рисунке В.6.
Рисунок В.6 – Пояснения по вкладке «Сглаживание» при применении
сглаживания МСС m=1
77
Пояснения по вкладке «Сглаживание» при применении сглаживания
МСС m=2 представлены на рисунке В.7.
Рисунок В.7 – Пояснения по вкладке «Сглаживание» при применении
сглаживания МСС m=2
Пояснения по вкладке «Сглаживание» при применении сглаживания
МСС m=3 представлены на рисунке В.8.
Рисунок В.8 – Пояснения по вкладке «Сглаживание» при применении
сглаживания МСС m=3
78
Отзывы:
Авторизуйтесь, чтобы оставить отзыв