Санкт-Петербургский государственный университет
Кафедра математической теории игр и статистических решений
Лапин Александр Вадимович
Выпускная квалификационная работа бакалавра
Моделирование ВТО в зависимости от
развития экономики региона
Направление 010400
Прикладная математика и информатика
Научный руководитель,
кандидат физ.-мат. наук,
ассистент
Панкратова Я. Б.
Санкт-Петербург
2016
Содержание
Введение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Постановка задачи . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Обзор литературы . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Глава 1. Основные понятия и положения . . . . . . . . . . . . . . . .
Глава 2. Практическая реализация . . . . . . . . . . . . . . . . . . . .
2.1. Сбор данных и спецификация модели . . . . . . . . . . . . .
2.2. Построение модели экспорта с зарубежными странами . . .
2.3. Построение модели импорта со странами дальнего зарубежья
2.4. Построение модели экспорта со странами СНГ . . . . . . . .
2.5. Построение модели импорта со странами СНГ . . . . . . . .
Выводы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Заключение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Список литературы . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Приложение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Исходые данные . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Модели y2 x1 − y2 x13 . . . . . . . . . . . . . . . . . . . . . . . . .
Модели y3 x1 − y3 x13 . . . . . . . . . . . . . . . . . . . . . . . . .
Модели y4 x1 − y4 x13 . . . . . . . . . . . . . . . . . . . . . . . . .
Программная реализация на R . . . . . . . . . . . . . . . . . . .
2
3
5
7
8
10
10
11
20
24
29
35
36
37
39
39
41
41
41
41
Введение
Большинство стран мира развивается через процесс интернациональной торговли. Отклонение от этого процесса безусловно ведет к застою развития научной мысли, замедлению темпов научно-технического прогресса,
а также к объективному спаду в развитии экономики. Данного принципа
придерживаются в мире уже сотни лет, поэтому использование, изучение
и развитие внешнеэкономических связей является необходимым и для отечественной экономики.
Важно исследовать внешнеторговый оборот (ВТО) как страны в целом, так и отдельных регионов, ведь значения данного показателя характеризуют рост и повышение эффективности экономики, поэтому в качестве
предмета эконометрического исследования выбран внешнеторговый оборот
Санкт-Петербурга.
Эконометрика — это наука, изучающая количественные закономерности и связи в экономике методами математической статистики. В основе
эконометрики лежит построение эконометрической модели и определение
возможностей использования данной модели для описания, анализа и прогнозирования экономических процессов [12].
В работе использован такой математический инструментарий эконометрики, как математико-статистический методы регрессионного анализа,
решение проблем спецификации и идентификации моделей, тестирование
статистических гипотез.
Доля Санкт-Петербурга в общем объеме внешней торговли России
составляет 4,8%. Основой внешнеэкономического потенциала региона является высокоразвитая промышленность (в том числе машиностроение, металлообработка и др.). Также развитию внешнеэкономического потенциала
региона способствуют выгодное приграничное географическое положение
и хорошая транспортная инфраструктура, наличие крупнейшего морского
порта России. В результате этого изучение показателей внешнеторгового
оборота Санкт-Петербурга является актуальной задачей [4]. В географической структуре внешней торговли преобладают страны дальнего зарубежья (Рис 1.).
На развитие внешнеторговых отношений влияет множество различных факторов, и для изучения потенциала развития региона важно знать,
какие факторы оказывают наиболее сильное влияние на экспортно-импортные отношения.
В данной работе рассматриваются различные модели внешнеторгового оборота региона, выявляются факторы, оказывающие наибольшее влияние на показатели экспорта и импорта как со странами СНГ, так и со
странами дальнего зарубежья, проводится их сравнительный анализ и делаются выводы по развитию экономики Санкт-Петербурга.
3
Рис. 1: Структура внешней торговли Санкт-Петербурга
Информационно-эмпирическую базу исследования составляет статистический материал, опубликованный Федеральной службой государственной статистики РФ в ежегодных сборниках «Регионы России» [7]. Эконометрические расчеты проводились с использованием программно-инструментальных средств R и MS Excel.
4
Постановка задачи
Целью работы является построение эконометрических моделей внешнеторгового оборота Санкт-Петербурга. Учитывая структуру ВТО, указанную на Рис. 2, в качестве зависимых переменных выбираются: y1 — экспорт
со странами дальнего зарубежья (млн. $), y2 — импорт со странами дальнего зарубежья (млн. $), y3 — экспорт со странами СНГ (млн. $), y4 —
импорт со странами СНГ (млн. $), и исследуется их зависимость от различных факторов.
Рис. 2: Модель внешней торговли Санкт-Петербурга
В рамках данной работы решаются следующие задачи:
1. Определяются участвующие в моделях эконометрические характеристики;
2. Собираются требуемые данные, проверяется их сопоставимость и
достоверность;
3. Строятся однофакторные линейные модели, оценивается их значимость, они проверяются на адекватность и в результате выбираются лучшие из них;
4. Строятся многофакторные линейные модели, выявляется, какие
факторы стоит включать в модель, модели проверяются на адекватность
и выбираются лучшие из них;
5. Строятся нелинейные однофакторные модели, проверяется их адекватность и соответствие требованиям, выбираются лучшие модели, выбираются факторы, которые можно включать во множественную регрессию;
6. Строятся нелинейные многофакторные модели, проверяется их адекватность соответствие требованиям, выбираются лучшие модели;
7. Сравниваются полученные модели, делаются выводы относительно факторов, влияющих на те или иные зависимые переменные.
5
Ожидаемое решение должно отвечать следующим требованиям:
Построенные модели должны удовлетворять основным предположениям регрессионного анализа: должны быть значимы коэффициенты модели, модель должна быть значима в целом, коэффициент (индекс) детерминации должен быть больше 0.8, средняя ошибка аппроксимации должна
быть не более 10-15%, среднеквадратичные отклонения должны быть наименьшими, должна отсутствовать гетероскедастичность и автокорреляция
остатков.
6
Обзор литературы
Для понимания теоретических основ, задач и методов региональной
экономики были изучены учебник Плисецкого Е. Л., Глушковой В. Г. [1] и
учебник под редакцией В. И. Видяпина, М В. Степанова [2]. Также в них
изложены вопросы внешнеэкономической деятельности регионов, проведен
анализ структуры хозяйственного комплекса и охарактеризованы межотраслевые комплексы и отрасли экономики.
Изучив статью Баженова Ю. Н., Подшувейт О. В. [3] и статью из отчета Федерального Собрания [4], стали понятны текущие показатели региона и его позиции в российской ввнешней торговле, а также проблемы и возможности развития внешнеэкономической деятельности СанктПетербурга.
При выборе факторов, оказывающих влияние на внешнеторговый
оборот региона, были прочитаны методические пояснения ежегодного сборника Федеральной службы государственной статистики [5]. В статье Талаева М. С., Котилко В. В. [6] изложены условия, влияющие на объемы
товарооборота между российскими регионами и странами СНГ.
Информационно-эмпирическую основу работы составляют данные,
взятые с сайта Федеральной службы государственной статистики [7].
Теоретической базой работы является несколько книг и учебных изданий по эконометрике и математической статистике [8], [9], [10], [11], [12]
в которых в полной мере охвачены основные разделы эконометрики: линейный регрессионный анализ(метод наименьших квадратов, проверка гипотез, гетероскедастичность, автокорреляция ошибок, спецификация модели), анализ временных рядов. Также эти книги содержат множество практических работ.
В процессе построения моделей использовались программно-инструментальные средства R и MS Excel. В книге Р. И. Кабакова [13] описаны
наиболее полезные и часто используемые функции и пакеты для статистической обработки данных и их визуализации в R. В книге Буре В. М., Парилиной Е. М., Седакова А. А., Шевкопляс Е. В. [14] рассмотрена практическая реализация эконометрических исследований в R и Excel. Обе книги
ориентированы изобилуют наглядными примерами и практическими советами, что облегчает работу с данными.
7
Глава 1. Основные понятия и положения
Эконометрика как наука является следствием междисциплинарного
подхода к изучению экономики и представляет на современном этапе своего
развития сочетание экономической теории, математики, математической и
экономической статистики.
Эконометрика с помощью статистических и математических методов анализирует экономические закономерности, доказанные экономической теорией.
В этой работе был рассмотрен следующий класс эконометрических
моделей — регрессионные модели с одним уравнением.
По количеству факторных переменных такие модели делятся на модели парной (с одной переменной) и множественной (с несколькими переменными) регрессии.
В зависимости от вида функции — на линейные и нелинейные.
Основной целью эконометрического моделирования является необходимость охарактеризовать значения одной или нескольких текущих эндогенных переменных в зависимости от значений объясняющих переменных.
Основные этапы эконометрического моделирования:
1 этап — теоретический. Определение конечных целей модели, набора участвующих в ней факторов и показателей, их роли. Основные цели исследований: анализ состояния и поведения экономического объекта, прогноз его
экономических показателей, имитация развития объекта, выработка управленческих решений.
2 этап — априорный. Анализ сущности изучаемого объекта, формирование
и формализация известной до начала моделирования информации.
3 этап — параметризация. Выбор общего вида модели, состава и формы
входящих в нее связей. Основная задача этого этапа - выбор функции f(Х).
4 этап — информационный. Сбор необходимой статистической информации.
5 этап — идентификация модели. Статистический анализ модели и оценка
ее параметров. Основная часть эконометрических исследований.
6 этап — верификация модели. Проверка адекватности модели, оценка точности модельных данных. Выясняется, насколько удачно решены проблемы спецификации и идентификации, какова точность расчетов по данной
модели. Проверяется, насколько соответствует построенная модель моделируемому реальному экономическому объекту или процессу [8].
Важными этапами являются идентификация и верификация, стоит
обратить особое внимание на них. Если модель не проходит этап верификации, то необходимо вернуться к 3 этапу и продолжить моделирование.
МНК-регрессия - это самый распространенный вид регрессионного
анализа в настоящее время. Эта регрессия позволяет подгонять модели
8
вида
Ŷi = β̂0 + β̂1 X1i + . . . + β̂k Xki , i = 1 . . . n,
где n — это число наблюдений, а k — это число независимых переменных [13]. Цель — выбрать такие параметры модели (свободный член и коэффициенты), которые позволят минимизировать различия между реальными и предсказанными значениями зависимой переменной. Таким образом, выбираем такие параметры модели, чтобы сумма квадратов остатков
была минимальной
n
X
i= 1
2
(Yi − Ŷi ) =
n
X
2
(Yi − β̂0 − β̂1 X1i − . . . − β̂k Xki ) =
i= 1
n
X
ε2i .
i= 1
Для правильной интерпретации коэффициентов МНК-модели нужно, чтобы данные удовлетворяли следующим требованиям:
•нормальность - значения зависимой переменной нормально распределены при фиксированных значениях независимых переменных;
•независимость - значения Yi независимы друг от друга (отсутствует
автокорреляция)
•линейность - зависимая переменная линейно связаны с нелинейными;
•гомоскедастичность - дисперсия зависимой переменной постоянна
при разных значениях независимых переменных [13].
Нарушение этих требований могут привести к неточным вычислениям тестов значимости и доверительных интервалов. Также подразумевается точность и безошибочность исходных данных, но обычно на практике
это требование игнорируется.
При нарушении требований есть несколько способов корректировки:
удаление наблюдений, преобразование переменных, добавление или удаление переменных, использование другого регрессионного метода.
9
Глава 2. Практическая реализация
В данной главе подробно рассмотривается построение различных моделей экспорта и импорта Санкт-Петербурга со странами дальнего зарубежья и со странами СНГ. Строятся линейные и нелинейные модели. Проводится диагностика и варианты улучшения моделей. В результате выбираются лучшие модели, удовлетворяющие всем требованиям и наилучшим
образом описывающие зависимую переменную.
2.1. Сбор данных и спецификация модели
В результате изучения научных материалов и методических пояснений из [5] в качестве независимых переменных (факторов) были выбраны
следующие факторы, которые, возможно, оказывают влияние на внешнеторговые показатели (Таблица 1).
xi
Факторы
Ед. измерения
x1
Валовой региональный продукт
млн. руб.
x2 Среднегодовая численность занятых в экономике
тыс. чел.
x3
Среднедушевые доходы населения
руб.
x4 Стоимость основных фондов отраслей экономики
млн. руб.
x5
Число предприятий и организаций
шт.
x6
Объем промышленной продукции
млн. руб.
x7
Оборот розничной торговли
млн. руб.
x8
Оборот оптовой торговли
млн. руб.
x9
Объем платных услуг населению
млн. руб.
x10
Инвестиции в основной капитал
млн. руб.
x11
Иностранные инвестиции
тыс. $
Стоимость фиксированного набора
x12
руб.
потребительских товаров и услуг
x13
Среднегодовая цена на нефть марки Brent
$
Таблица 1: Факторы, влияющие на ВТО
В качестве исходных данных были взяты показатели из ежегодных
сборников "Регионы России" Федеральной Службы Государственной статистики за период с 2000 по 2014 год. Стоит отметить, что данные по валовому региональному продукту взяты со сдвигом на один год, так как этот
показатель оказывает влияние с запаздыванием. Данные представлены в
приложении в Таблицах 31, 32, 33.
10
2.2. Построение модели экспорта с зарубежными
странами
В данном параграфе рассмотрены модели зависимости y1 от различных факторов x1 , .., x13 .
Сначала построим парные линейные регрессии. Рассмотрим модель
y1 x1 . Построим поле корреляции и построим парную линейную регрессию
методом МНК (См. рис. 3)
Рис. 3: Парная линейная регрессия y1 x1
Уравнение регрессии имеет вид:
y1 = 2290 + 0.008009x1
Проверим значимость полученных коэффициентов. Рассчитаем
t-статистики коэффициентов: ta = 1.25, tb = 5.756 и сравним с табличным
значением ttabl (0, 05; 13) = 2.16. Так как |ta | < ttabl и |tb |> ttabl , значим
только коэффициент b.
Далее проверим значимость линейной регрессии в целом по критерию Фишера. Рассчитаем F-статистику: F = 33.13 и сравним с табличным
значением Ftabl (1; 13) = 3.13621. Так как F ≥ Ftabl , построенное уравнение
линейной регрессии признаем статистически значимым.
Оценим тесноту связи между фактором и результирующей переменной. Коэффициент детерминации равен R2 = 0.7182, что говорит о высокой
степени зависимости между y1 и x1 .
11
Далее оценим точность прогноза с помощью остаточной суммы квадратов Sost = 4150.2, средней ошибки аппроксимации A = 52.3%, а также
среднего абсолютного отклонения M AD = 3192.674. Видно, что средняя
ошибка аппроксимации сильно превышает допустимое значение, что говорит о низкой точности построенной модели.
Проверим модель на наличие гетероскедастичности остатков. Статистика равна F = 20.11143, в то время как табличное значение Ftabl (0.05; 3; 3)
= 9.27662. Так как F ≥ Ftabl , гипотеза о наличии гомоскедастичности отклоняется.
Для определения наличия автокорреляции остатков найдем статистику Дарбина-Уотсона: d = 1.154657. Сравнивая ее с критическими значениями dL = 1.08 и dU = 1.36, получаем что dL ≥ d ≥ dU , а значит, нет
достаточных оснований для принятия решения.
В результате исследования можно сделать вывод о том, что данная
модель не удовлетворяет всем требованиям и ее нельзя использовать.
Рассмотрим остальные линейные модели y1 x2 . . . y1 x13 . Проводя аналогичное исследование, получаем следующие результаты, представленные
в Таблице 2 :
y1 x2
y1 x3
y1 x4
y1 x5
y1 x6
y1 x7
y1 x8
y1 x9
y1 x10
y1 x11
y1 x12
y1 x13
p-value
для a
2.37E-05
0.883225
0.426718
0.092332
0.091609
0.753256
0.474698
0.936043
0.944477
0.089614
0.222095
0.023711
p-value
для b
1.48E-05
2.77E-05
9.25E-05
0.008
0.000205
7.74E-06
7.65E-06
6.62E-06
3.88E-06
2.67E-05
1.88E-05
2.60E-08
R2
Sost
A
MAD
GQ
DW
0.78
0.75
0.70
0.43
0.67
0.80
0.80
0.80
0.82
0.75
0.77
0.91
3706
3886
4254
5905
4515
3529
3526
3488
3350
3875
3774
2288
42.24%
39.68%
55.37%
79.61%
61.49%
36.86%
41.09%
36.52%
34.28%
45.40%
43.51%
17.92%
2813
2925
3255
4783
3254
2690
2671
2588
2683
2555
2927
1676
5.63
36.12
19.85
35.13
9.10
25.00
18.66
20.70
42.58
3.54
21.04
25.61
1.04
1.53
1.00
0.68
0.95
1.36
1.02
1.37
1.82
1.38
1.29
1.28
Таблица 2: Линейные модели y1 x2 -y1 x13
В данной таблице (и аналогичных таблицах с результатами исследований в следующих параграфах) для удобства в столбцах указаны pзначения статистик. Таким образом, при p-значении p − value ≤ 0.05
(α = 0.05 - уровень значимости), соответственные коэффициенты признаются статистически значимыми.
Стоит заметить, что все линейные модели в данной работе признаны
статистически значимыми (p-value для модели в целом ≤ 0.05). Поэтому
эти значения не указаны в таблицах с результатами построения моделей.
12
Рассмотрим поля корреляции с построенными линейными регрессиями на Рис. 4 - 7
Рис. 4: Линейные модели y1x2 − y1x4
Рис. 5: Линейные модели y1x5 − y1x7
Рис. 6: Линейные модели y1x8 − y1x10
На графиках полей корреляции стоит обратить внимание на выбросы
13
Рис. 7: Линейные модели y1x11 − y1x12
данных.
Сделаны следующие выводы о построенных линейных регрессиях
(Таблица 2):
1. Коэффициент а статистически значим только в моделях y1 x2 , y1 x13
2. Коэффициент b признается статистически значимым во всех моделях.
3. Все модели признаны значимыми в целом.
4. Коэффициент детерминации достаточно высок у всех моделей (за
исключением y2 x5 ).
5. Остатки гомоскедастичны в моделях y1 x2 , y1 x6 , y1 x11 . Остальные
модели необходимо преобразовывать и строить нелинейные модели.
6. В результате ни одну из моделей нельзя использовать, так как
средняя ошибка аппроксимации у них слишком высока.
Рассмотрим возможность построения двухфакторных моделей. Построим коррелограмму и изучим взаимозависимость выборок.
y1
x1
x2
x3
x4
x5
x6
x7
x8
x9
x10
x11
x12
x13
y1
1.00
0.85
0.88
0.87
0.84
0.66
0.82
0.89
0.89
0.89
0.90
0.87
0.88
0.96
x1
x2
x3
x4
x65
x6
x7
x8
x9
1.00
0.96
0.98
0.99
0.47
0.98
0.99
0.98
0.99
0.94
0.94
0.99
0.90
1.00
0.96
0.98
0.52
0.93
0.96
0.96
0.96
0.94
0.95
0.97
0.90
1.00
0.97
0.59
0.96
0.99
0.98
0.99
0.97
0.92
0.99
0.91
1.00
0.43
0.98
0.98
0.98
0.98
0.93
0.95
0.99
0.88
1.00
0.38
0.56
0.50
0.57
0.66
0.44
0.55
0.58
1.00
0.97
0.97
0.97
0.89
0.91
0.97
0.90
1.00
0.99
1.00
0.97
0.94
1.00
0.93
1.00
0.99
0.96
0.92
0.99
0.93
1.00
0.97
0.93
1.00
0.94
x10
x12
x13
1.00
0.90 1.00
0.97 0.92 1.00
0.90 0.88 0.91 1.00
Таблица 3: Корреляционная матрица y1 xn , n = 1, 13
14
x11
Из таблицы видно, что y1 сильно коррелирует со всеми переменными, за исключением фактора x5 . В то же время наблюдается мультиколлениарность всех независимых переменных между собой, за исключением
переменной x5 . Таким образом, целесообразно строить лишь двухфакторные модели вида y1 x5 xn , иначе модели будут неточными в виду наличия
мультиколлениарности.
В то же время известно, что модель y1 x5 имеет гетероскедастичные
остатки. Известно, что множественные регрессии имеют гетероскедастичные остатки, если хотя бы из одних факторов имеет гетероскедастичные
остатки в линейной модели с yi . Поэтому и модели вида y1 x5 xn будут иметь
гетероскедастичные остатки, что является недопустимым.
В результате получается, что двухфакторные линейные модели y1 xi xj
строить нецелесообразно.
Нелинейные модели. Для построения нелинейных моделей необходимо провести линеаризацию данных. В результате были построены следующие нелинейные модели: квадратичная, гиперболическая, степенная,
экспоненциальная и логарифмическая. Результаты построения указаны на
следующих Таблицах 4 - 8.
y1 x 1
y1 x 2
y1 x 3
y1 x 4
y1 x 5
y1 x 6
y1 x 7
y1 x 8
y1 x 9
y1 x10
y1 x11
y1 x12
y1 x13
p-value
для a
0.441935
0.028082
0.387503
0.141442
0.287402
0.756763
0.234715
0.255917
0.299079
0.307677
0.407683
0.05757
0.045452
p-value
для b
0.003041
0.033588
0.016101
0.001501
0.316824
0.010541
0.003681
0.002439
0.009933
0.009735
1.73E-05
0.012586
0.00609
p-value
для с
4.60E-02
4.10E-02
2.21E-01
2.29E-02
4.86E-01
7.53E-02
8.62E-02
5.40E-02
1.78E-01
2.08E-01
1.03E-03
1.20E-01
2.66E-01
R2
Sost
A
MAD
GQ
DW
0.80
0.84
0.78
0.81
0.45
0.75
0.84
0.85
0.83
0.84
0.90
0.81
0.92
3492
3092
3641
3399
5782
3936
3106
3001
3223
3127
2432
3399
2168
36.56%
45.93%
40.68%
39.84%
87.03%
41.78%
32.48%
34.24%
38.10%
36.00%
23.59%
43.55%
22.40%
2575
2295
2679
2519
4814
2816
2295
2255
2432
2405
1660
2618
1537
28.93
5.68
54.60
26.84
39.71
14.89
34.57
26.99
31.86
52.50
3.64
25.55
18.33
1.52
1.40
1.69
1.49
0.67
1.39
1.70
1.39
1.60
1.85
1.51
1.56
1.51
Таблица 4: Квадратичные модели y1 xn , n = 1, 13
Сделаны следующие выводы о построенных квадратичных регрессиях (Таблица 4):
1. Коэффициент а статистически значим только в моделях y1 x2 , y1 x13 .
Коэффициент b признается статистически значимым во всех моделях, за
исключением y1 x5 . Коэффициент с в большинстве моделей признается статистически незначимым.
2. Все модели признаны значимыми в целом.
15
3. Коэффициент детерминации достаточно высок у всех моделей (за
исключением y1 x5 ).
4. Остатки гомоскедастичны в моделях y1 x2 и y1 x11 . Автокорреляция
остатков присутствует лишь в модели y1 x5 .
5. В результате ни одну из моделей нельзя использовать.
y1 x1
y1 x2
y1 x3
y1 x4
y1 x5
y1 x6
y1 x7
y1 x8
y1 x9
y1 x10
y1 x11
y1 x12
y1 x13
p-value
для a
4.05E-07
6.50E-06
1.31E-06
1.91E-07
0.000501
3.53E-07
1.84E-07
2.21E-07
8.31E-07
1.03E-06
9.17E-09
1.55E-07
9.04E-09
p-value
для b
0.000478
1.02E-05
0.001579
0.000145
0.00729
0.00042
0.000186
0.000237
0.000947
0.001319
1.16E-05
4.51E-05
3.93E-06
R2
Sost
A
0.62
0.79
0.55
0.68
0.44
0.63
0.67
0.66
0.58
0.56
0.78
0.73
0.82
4809
3604
5251
4400
5866
4763
4482
4565
5057
5182
3640
4031
3352
85.21%
40.79%
88.44%
79.42%
90.85%
81.05%
75.19%
81.87%
88.14%
89.62%
55.22%
68.58%
47.34%
MAD GQ DW
4035
2730
4372
3662
4914
3910
3747
3837
4221
4318
2934
3297
2528
0.09
0.18
0.06
0.09
0.04
0.26
0.07
0.10
0.10
0.04
0.29
0.07
0.03
0.98
1.09
0.88
1.07
0.68
1.03
1.07
0.97
0.90
0.90
1.65
1.26
1.25
Таблица 5: Гиперболические модели y1 xn , n = 1, 13
Сделаны следующие выводы о построенных гиперболических регрессиях (Таблица 5):
1. Все модели признаны значимыми в целом, а их коэффициенты
статистически значимы.
2. Коэффициент детерминации высок только в нескольких моделях.
3. Все модели имеют гомоскедастичные остатки, однако только одна
модель y1 x11 не имеет автокорреляции остатков
4. В результате ни одну из моделей нельзя использовать.
Сделаны следующие выводы о построенных степенных регрессиях
(Таблица 6):
1. Все модели признаны значимыми в целом, а их коэффициенты b
статистически значимы. Коэффициент a признается незначимым в модели
y1 x3 .
2. Коэффициент детерминации высок во всех моделях (за исключением y1 x2 ).
3. Все модели имеют гомоскедастичные остатки. Автокорреляция остатков отсутствует в моделях y1 x3 , y1 x10 , y1 x11 .
4. Среди трех моделей, удовлетворяющих основным требованиям, выбрана модель y1 x11 , так как у нее самая низкая средняя ошибка аппроксимации среди других моделей.
16
y1 x1
y1 x2
y1 x3
y1 x4
y1 x5
y1 x6
y1 x7
y1 x8
y1 x9
y1 x10
y1 x11
y1 x12
y1 x13
p-value
для a
0.018673
3.62E-05
0.30806
0.002907
0.002945
0.089826
0.002476
0.002943
0.012213
0.011444
0.004453
0.005741
0.000174
p-value
для b
1.62E-06
2.49E-05
1.24E-06
2.67E-06
0.000613
6.58E-06
1.90E-07
4.37E-07
5.28E-07
3.40E-07
9.06E-08
1.65E-06
1.05E-09
R2
Sost
A
0.90
0.68
0.92
0.88
0.77
0.88
0.93
0.93
0.93
0.94
0.92
0.89
0.96
4363
7943
3995
4951
6675
4780
3739
3732
3607
3439
3949
4584
2853
31.77%
41.92%
31.74%
31.89%
54.28%
32.74%
27.21%
27.60%
28.97%
29.63%
26.22%
31.51%
17.85%
MAD GQ DW
3075
4868
2831
3228
4635
3098
2635
2511
2500
2614
2484
3087
2058
0.37
0.10
0.61
0.37
0.75
0.14
0.46
0.33
0.34
0.89
0.07
0.45
0.21
1.07
0.49
1.47
0.78
0.69
0.87
1.22
0.90
1.28
1.74
1.42
0.95
0.98
Таблица 6: Степенные модели y1 xn , n = 1, 13
Выбранная модель имеет следующую формулу:
0.88075
y1 = e−4.2918 x11
.
В результате получилось, что экспорт со странами дальнего зарубежья связан степенной функцией с фактором x11 - иностранные инвестиции (млн.
руб.).
Интерпретацией данной модели является: при изменении иностранного капитала на 1%, экспорт со странами дальнего зарубежья изменится
на 0,88% .
y1 x1
y1 x2
y1 x3
y1 x4
y1 x5
y1 x6
y1 x7
y1 x8
y1 x9
y1 x10
y1 x11
y1 x12
y1 x13
p-value
для a
1.22E-13
0.00073
9.92E-14
4.67E-13
0.000161
1.42E-13
5.70E-14
6.40E-14
5.28E-14
1.79E-14
3.02E-14
5.67E-12
4.53E-14
p-value
для b
0.000136
3.23E-05
1.14E-05
0.000227
0.000739
0.000494
1.21E-05
3.03E-05
7.12E-06
1.87E-06
8.97E-05
2.50E-05
2.92E-07
R2
Sost
A
0.78
0.67
0.81
0.72
0.73
0.81
0.81
0.83
0.84
0.84
0.68
0.78
0.88
6590
8095
6194
7381
7250
6044
6134
5854
5613
5644
7935
6515
4936
41.12%
43.02%
33.51%
45.16%
53.65%
45.40%
33.96%
36.70%
32.06%
33.17%
48.28%
35.90%
27.28%
MAD GQ DW
4248
4969
3891
4600
4842
4069
3866
3756
3640
3921
5133
3961
3178
0.50
0.10
0.85
0.51
0.83
0.21
0.59
0.46
0.48
1.10
0.07
0.53
0.16
0.63
0.49
0.82
0.53
0.78
0.59
0.63
0.53
0.62
1.19
0.90
0.67
0.84
Таблица 7: Экспоненциальные модели y1 xn , n = 1, 13
Сделаны следующие выводы о построенных экспоненциальных ре17
грессиях (Таблица 7):
1. Все модели признаны значимыми в целом, а их коэффициенты a и
b статистически значимы.
2. Коэффициент детерминации высок во всех моделях (за исключением y1 x2 ).
3. Все модели имеют гомоскедастичные остатки. Автокорреляция остатков присутствует во всех моделях, поэтому они не проходят проверку и их
нельзя далее использовать.
y1 x1
y1 x2
y1 x3
y1 x4
y1 x5
y1 x6
y1 x7
y1 x8
y1 x9
y1 x10
y1 x11
y1 x12
y1 x13
p-value
для a
3.15E-05
1.30E-05
0.000187
2.23E-05
0.008562
7.14E-05
1.13E-05
6.95E-06
3.72E-05
4.34E-05
1.10E-06
2.17E-05
1.25E-06
p-value
для b
9.50E-06
1.22E-05
4.06E-05
8.76E-06
0.006921
1.98E-05
3.54E-06
2.27E-06
1.09E-05
1.25E-05
2.95E-07
7.49E-06
6.87E-08
R2
Sost
A
MAD
GQ
DW
0.93
0.93
0.92
0.94
0.83
0.93
0.94
0.95
0.93
0.93
0.96
0.94
0.97
3584
3654
3999
3562
5844
3789
3326
3216
3622
3659
2753
3520
2464
50.28%
41.50%
57.98%
49.74%
84.11%
47.51%
44.82%
48.10%
55.67%
54.09%
31.47%
48.78%
32.75%
2814
2771
3105
2818
4813
2784
2567
2587
2865
2893
2007
2797
1715
14.41
5.58
24.34
14.49
31.41
5.70
18.39
13.20
13.86
34.12
3.46
17.56
34.75
1.48
1.06
1.41
1.40
0.68
1.38
1.59
1.35
1.39
1.46
1.75
1.49
1.45
Таблица 8: Логарифмические модели y1 xn , n = 1, 13
Сделаны следующие выводы о построенных логарифмических регрессиях (Таблица 8):
1. Все модели признаны значимыми в целом, а их коэффициенты a и
b статистически значимы.
2. Коэффициент детерминации очень высок во всех моделях.
3. Гомоскедастичные остатки имеют следующие модели y1 x2 , y1 x6 ,
y1 x11 .
4. Из них две модели не имеют автокорреляции остатков: y1 x6 и y1 x11 .
6. Среди двух моделей, удовлетворяющих основным требованиям, выбрана модель y1 x11 , так как у нее самая низкая средняя ошибка аппроксимации среди других моделей. Однако ранее выбранная степенная модель с
этим фактором имеет более низкую среднюю ошибку аппроксимации. Поэтому логистическая модель не принимается к рассмотрению.
В результате получаем, что переходя к нелинейным моделям, мы избавляемся от гетероскедастичности и автокорреляции, имевшихся в линейных моделях. Лучшей моделью среди построенных является степенная
18
функция y1 x11 :
0.88075
y1 = e−4.2918 x11
.
Рассмотрим множественные нелинейные модели. Как уже было рассмотрено ранее, целесообразно строить лишь двухфакторные модели вида
y1 x5 xn , n = 1, 13, иначе модели будут неточными в виду наличия мультиколлениарности. Качественными двухфакторными нелинейными моделями y1 x5 являются степенная и экспоненциальная. Построив различные
двухфакторные степенные модели, выделены лучшие модели:
y1 = e−19.52811 x1.40024
x0.70695
.
5
11
y1 x5 x11
p-value p-value p-value
2
Radj
Sost
A
MAD DW
для a
для с
для b
0.00135 0.00630 1.68e-06 0.9367 2870.069 18.55% 1787.419 1.66
Таблица 9: Двухфакторная степенная модель y1 x5 x11
Интерпретация: при увеличении фактора x5 на 1 %, y1 увеличится на
1,4% при неизменности другого фактора; при увеличении фактора x11 на
1 %, y1 увеличится на 0.7% при неизменности другого фактора.
y1 = e5.717 e0.0000051x5 e0.21x13 .
y1 x5 x13
p-value p-value p-value
2
Radj
Sost
A
MAD DW
для a
для с
для b
1.04e-09 0.000726 5.27e-07 0.9462 2210 15.17% 1423.528 1.48
Таблица 10: Двухфакторная экспоненциальная модель y1 x5 x13
Трехфакторные модели строить нецелесообразно, так как в них появится мультиколлинеарность.
19
2.3. Построение модели импорта со странами
дальнего зарубежья
В данном параграфе рассмотрены модели зависимости y2 от различных факторов x1 , .., x13 .
Сначала рассмотрим парные линейные регрессии y2 x1 . . . y2 x13 . Проводя исследование, аналогичное предыдущему параграфу, получаем следующие результаты, представленные в Таблице 11 :
y2 x1
y2 x2
y2 x3
y2 x4
y2 x5
y2 x6
y2 x7
y2 x8
y2 x9
y2 x10
y2 x11
y2 x12
y2 x13
p-value
для a
0.168086
1.80E-06
0.865046
0.457005
0.247225
0.033558
0.881118
0.418498
0.700725
0.936647
0.048712
0.02932
0.000423
p-value
для b
2.77E-07
1.08E-06
1.65E-07
8.34E-07
0.029714
2.51E-07
1.99E-08
6.51E-09
2.58E-09
3.55E-07
3.22E-06
7.70E-08
1.30E-11
R2
Sost
A
0.88 4311 28.14%
0.85 4781 22.59%
0.89 4143 16.79%
0.85 4688 31.47%
0.31 10183 66.00%
0.88 4278 33.16%
0.92 3525 15.31%
0.93 3236 18.46%
0.94 3015 12.04%
0.87 4392 14.30%
0.82 5194 38.08%
0.90 3909 16.80%
0.97 2009 17.91%
MAD
GQ
DW
3232
3329
2964
3516
8165
2975
2429
2297
2106
2738
3844
2808
1614
174.03
71.87
102.36
71.56
703.95
122.14
219.77
192.35
138.62
49.65
14.12
717.07
2.28
1.27
0.80
1.65
0.98
0.36
0.99
1.40
1.07
1.52
1.23
1.05
1.38
1.49
Таблица 11: Линейные модели y2 xn , n = 1, 13
Поля корреляции с построенными линейными регрессиями размещены в приложении на Рис. 8 - 11.
Сделаны следующие выводы о построенных линейных регрессиях
(Таблица 11):
1. Все модели признаются значимыми в целом, однако практически
все коэффициенты a признаются незначимыми
2. Лишь одна модель имеет гомоскедастичные остатки - y2 x13 . Она
также не имеет автокорреляции остатков.
3. Модель y2 x13 имеет очень высокий коэффициент детерминации,
что говорит о сильной связи показателей. Величина средне ошибки аппроксимации и среднеквадратические отклонения являются допустимыми.
Модель удовлетворила требуемым условиям.
y2 = −5559.06 + 342.35x13 .
Интерпретация: при изменении x13 -среднегодовой цены на нефть марки
Brent ($) на 1%, экспорт со странами дальнего зарубежья изменится на
0,17
20
Корреляционная матрица y2 xn , n = 1, 13 размещена в приложении,
однако построение линейных множественных моделей нецелесообразно в
виду гетероскедастичности остатков во всех линейных моделях.
Рассмотрим нелинейные модели.
y 2 x1
y 2 x2
y 2 x3
y 2 x4
y 2 x5
y 2 x6
y 2 x7
y 2 x8
y 2 x9
y2 x10
y2 x11
y2 x12
y2 x13
p-value
p-value
p-value
R2
Sost
A
MAD
для a
для b
для с
0.327631 0.000124 1.49E-02 0.93 3333 15.81% 2360
0.021014 0.026544 3.44E-02 0.90 3938 37.42% 3439
0.4226 0.006247 3.68E-01 0.89 3999 24.41% 3162
0.015047 1.01E-05 1.08E-03 0.94 2952 21.71% 2315
0.102611 0.100415
0.156
0.42 9331 75.11% 7497
0.723299 0.00032 2.00E-02 0.92 3383 15.78% 2461
0.224477 0.000536 1.04E-01 0.93 3143 14.93% 2271
0.195558 8.70E-05 2.90E-02 0.95 2632 13.36% 1892
0.387949 0.002024 4.22E-01 0.94 2931 16.79% 2240
0.502531 0.012713 4.20E-01 0.88 4270 21.97% 3050
0.819956 0.000379 3.31E-02 0.88 4265 30.99% 3327
0.014015 0.001639 8.17E-02 0.92 3428 23.90% 2721
0.135559 0.006344 5.80E-01 0.97 1983 17.30% 1638
GQ
DW
87.47
72.13
49.32
59.23
447.46
42.99
70.80
93.40
51.23
34.41
15.36
345.91
2.56
1.77
0.88
1.65
1.78
0.31
1.63
1.55
1.31
1.59
1.12
1.48
1.48
1.67
Таблица 12: Квадратичные модели y2 xn , n = 1, 13
Сделаны следующие выводы о построенных квадратичных регрессиях (Таблица 12):
1. Все модели признаны значимыми в целом.
2. Только три модели имеют статистически значимые коэффициенты:
y2 x2 , y2 x4 , y2 x12 .
3. Только одна модель y2 x13 имеет гомоскедастичные остатки.
4. Коэффициент детерминации достаточно высок у всех моделей (за
исключением y2 x5 )
5. В результате ни одну из моделей нельзя использовать, так как
данные модели не соответствуют требованиям.
Сделаны следующие выводы о построенных гиперболических регрессиях (Таблица 13):
1. Все модели признаны значимыми в целом.
2. Все коэффициенты моделей признаны статистически значимыми.
3. Все модели имеют гомоскедастичные остатки.
4. У всех без исключения моделей имеется автокорреляция остатков,
что говорит о невозможности использования данных моделей.
Сделаны следующие выводы о построенных степенных регрессиях
(Таблица 14):
1. Все модели признаны значимыми в целом.
2. Все коэффициенты моделей признаны статистически значимыми
(за исключением коэффициента a модели y2 x3 ).
3. Все модели имеют гомоскедастичные остатки (за исключением модели y2 x5 ).
21
y2 x1
y2 x2
y2 x3
y2 x4
y2 x5
y2 x6
y2 x7
y2 x8
y2 x9
y2 x10
y2 x11
y2 x12
y2 x13
p-value
для a
1.14E-07
4.15E-07
5.22E-07
3.51E-08
0.001146
6.36E-08
6.43E-08
6.62E-08
3.04E-07
5.18E-07
4.14E-08
1.53E-08
1.12E-08
p-value
для b
0.000178
6.72E-07
0.000828
3.51E-05
0.01642
0.000101
8.45E-05
9.33E-05
0.000457
0.000865
6.55E-05
5.81E-06
5.93E-06
R2
Sost
A
MAD
GQ
DW
0.67
0.86
0.59
0.74
0.37
0.70
0.71
0.70
0.62
0.59
0.72
0.80
0.80
7026
4611
7877
6222
9772
6737
6647
6696
7538
7902
6521
5432
5440
71.00%
21.23%
72.85%
65.39%
66.34%
68.72%
62.79%
68.07%
73.18%
72.28%
59.99%
55.89%
43.17%
5742
3219
6447
5145
7851
5502
5401
5452
6173
6341
5107
4404
4311
0.01
0.01
0.01
0.01
0.003
0.02
0.004
0.01
0.01
0.01
0.08
0.005
0.57
0.56
0.83
0.48
0.64
0.35
0.61
0.55
0.50
0.48
0.48
0.87
0.74
0.53
Таблица 13: Гиперболические модели y2 xn , n = 1, 13
4. Большинство моделей имеет автокорреляцию остатков.
5. Модели y2 x9 и y2 x13 удовлетворяют основным предположениям.
Обе имеют примерно равный коэффициент детерминации, однако средняя
ошибка аппроксимации меньше у модели y2 x9 .
y2 = e−3.2898 x1.0701
.
9
Таким образом, имеется степенная зависимость импорта со странами дальнего зарубежья от фактора x11 -объем платных услуг населению (млн. руб.).
Интерпретация зависимости: при изменении объема платных услуг населению на 1%, импорт со странами дальнего зарубежья изменится на 1,07%.
Сделаны следующие выводы о построенных экспоненциальных регрессиях (Таблица 15):
1. Все модели признаны значимыми в целом.
2. Все коэффициенты моделей признаны статистически значимыми.
3. Все модели имеют гомоскедастичные остатки.
4. Все модели имеют автокорреляцию остатков (за исключением y2 x13 ).
5. Модель y2 x13 подходит по многим параметрам, однако имеет среднюю ошибку аппроксимации 21,85%, что немного больше, чем у линейной
модели y2 x13 , которую мы приняли ранее. Поэтому экспоненциальная модель не принимается.
Сделаны следующие выводы о построенных логарифмических регрессиях (Таблица 16):
1. Все модели признаны значимыми в целом.
2. Все коэффициенты моделей признаны статистически значимыми.
3. Только модель y2 x13 имеет гомоскедастичные остатки.
4. Потенциальная модель y2 x13 имеет автокорреляцию остатков, по22
y2 x1
y2 x2
y2 x3
y2 x4
y2 x5
y2 x6
y2 x7
y2 x8
y2 x9
y2 x10
y2 x11
y2 x12
y2 x13
p-value
для a
0.000891
6.85E-06
0.474467
7.98E-05
0.002703
0.019884
1.12E-05
8.10E-06
5.20E-05
0.00113
0.14555
9.44E-05
1.92E-06
p-value
для b
5.78E-10
4.38E-06
4.86E-10
4.67E-09
0.000421
5.30E-09
1.03E-11
1.90E-11
6.60E-12
2.04E-10
1.72E-06
6.52E-10
1.91E-09
R2
Sost
A
0.96 4539 15.23%
0.75 11353 34.02%
0.97 4195 16.04%
0.93 5792 18.29%
0.73 11711 45.16%
0.96 4629 16.78%
0.97 3714 11.35%
0.98 3487 11.76%
0.98 3067 11.44%
0.96 4426 13.58%
0.95 4868 30.58%
0.95 5290 15.26%
0.99 2173 15.90%
MAD
GQ
DW
2896
6559
2941
3469
8459
2980
2311
2202
2101
2653
3704
3104
1743
2.67
1.14
1.80
1.09
11.89
1.71
3.07
2.59
2.18
1.44
0.36
4.98
0.03
1.20
0.53
1.62
0.75
0.48
0.88
1.30
0.96
1.46
1.20
1.24
0.98
1.97
Таблица 14: Степенные модели y2 xn , n = 1, 13
этому ее нельзя принять.
В результате получаем, что переходя к нелинейным моделям, мы избавляемся от гетероскедастичности и автокорреляции, имевшихся в линейных моделях. Лучшими моделями среди построенных являются:
y2 = −5559.06 + 342.35x13 .
y2 = e−3.2898 x1.0701
.
9
Рассмотрим множественные нелинейные модели. Как уже было рассмотрено ранее, целесообразно строить лишь двухфакторные модели вида
y1 x5 xn , n = 1, 13 Другие модели будут неточными в виду наличия мультиколлинеарности. Качественной двухфакторной нелинейной моделью являются экспоненциальная, так как экспоненциальная однофакторная модель
y1 x5 показала хороший результат:
y2 = e6.53 e0.000006x5 e0.0000007x11 .
Трехфакторные модели строить нецелесообразно, так как появится
мультиколлинеарность.
23
y2 x1
y2 x2
y2 x3
y2 x4
y2 x5
y2 x6
y2 x7
y2 x8
y2 x9
y2 x10
y2 x11
y2 x12
y2 x13
p-value
для a
1.79E-15
0.00029
4.33E-16
8.97E-15
1.49E-05
2.05E-15
4.27E-16
5.58E-16
1.43E-16
1.70E-16
3.07E-15
2.87E-14
1.20E-15
p-value
для b
1.46E-05
6.22E-06
3.90E-07
3.21E-05
0.000954
4.85E-05
7.18E-07
2.02E-06
1.51E-07
1.51E-07
7.59E-05
1.01E-06
7.77E-08
R2
Sost
A
0.85
0.74
0.87
0.79
0.69
0.90
0.88
0.89
0.91
0.89
0.80
0.84
0.95
8783
11606
8072
10473
12543
7320
7979
7441
6633
7613
10042
8992
5213
35.10%
35.18%
24.15%
39.96%
48.43%
37.60%
27.17%
29.90%
22.27%
24.05%
41.30%
27.31%
21.85%
MAD GQ DW
5491
6723
4561
6481
9019
5116
4556
4602
3766
4611
6399
4789
3273
1.17
1.14
0.80
0.82
7.13
0.58
1.09
1.19
0.79
0.72
0.39
2.53
0.04
0.59
0.53
0.83
0.53
0.56
0.52
0.62
0.55
0.49
1.08
0.79
0.72
1.44
Таблица 15: Экспоненциальные модели y2 xn , n = 1, 13
2.4. Построение модели экспорта со странами СНГ
В данном параграфе рассмотрены модели зависимости y3 от различных факторов x1 , .., x13 .
Сначала рассмотрим парные линейные регрессии y3 x1 . . . y3 x13 . Проводя исследование, аналогичное предыдущему параграфу, получаем следующие результаты, представленные в Таблице 18 :
Поля корреляции с построенными линейными регрессиями размещены в приложении на Рис. 12 - 15.
Сделаны следующие выводы о построенных линейных регрессиях
(Таблица 18):
1. Только у двух моделей значим коэффициент а: y3 x2 y3 x13 . Коэффициент b значим у всех моделей.
2. Все модели значимы в целом.
3. Гетероскедастичность присутствует во всех моделях, поэтому невозможно построить линейные модели (как парные, так и множественные)
4. Во всех моделях невысокий коэффициент детерминации, что говорит о несильной связи переменных.
5. Значения средней ошибки аппроксимации высоки.
В результате можно сделать вывод о том, что y3 нельзя линейно описать факторами x1 − x13 . Необходимо линеаризовать выборки и строить
нелинейные модели.
Таким образом, построение линейных множественных моделей невозможно. Корреляционная матрица размещена в приложении в Таблице 35.
Рассмотрим нелинейные модели.
Сделаны следующие выводы о построенных квадратичных регресси24
y2 x1
y2 x2
y2 x3
y2 x4
y2 x5
y2 x6
y2 x7
y2 x8
y2 x9
y2 x10
y2 x11
y2 x12
y2 x13
p-value
для a
3.60E-07
9.03E-07
2.03E-05
1.34E-07
0.025275
8.23E-08
4.43E-07
7.92E-08
1.87E-06
1.71E-05
3.10E-06
2.18E-07
3.97E-07
p-value
для b
9.58E-08
8.48E-07
3.82E-06
4.74E-08
0.020684
1.91E-08
1.27E-07
2.35E-08
4.92E-07
4.59E-06
8.11E-07
6.77E-08
1.88E-08
R2
Sost
A
MAD
GQ
DW
0.97
0.96
0.95
0.97
0.81
0.98
0.97
0.98
0.96
0.94
0.96
0.97
0.98
3975
4694
5262
3767
9931
3515
4061
3570
4503
5336
4678
3871
3510
35.97%
21.90%
48.47%
33.84%
60.07%
31.07%
33.74%
33.73%
44.03%
46.69%
38.51%
33.64%
29.73%
3255
3273
4329
3094
7828
2907
3215
2834
3662
4235
3670
3197
2811
192.38
71.61
292.70
79.92
660.77
298.29
4590.38
246.70
475.52
75.53
13.11
502.88
2.01
1.31
0.82
0.93
1.35
0.35
1.50
1.04
0.91
0.86
0.74
1.26
1.27
0.55
Таблица 16: Логарифмические модели y2 xn , n = 1, 13
y2 x 5 x 1
p-value p-value p-value
2
A
MAD DW
для a
для с Radj Sost
для b
6.74e-10 0.00019 4.15e-06 0.92 2210 17.61% 3626 1.70
Таблица 17: Двухфакторная экспоненциальная модель y2 x5 x1
ях (Таблица 19):
1. Все модели признаны значимыми в целом.
2. Только две модели имеют статистически значимые коэффициенты:
y3 x2 , y3 x13 .
3. Все модели имеют гетероскедастичность остатков.
4. У всех моделей высокое значение средней ошибки аппроксимации.
5. В результате ни одну из моделей нельзя использовать, так как
данные модели не соответствуют требованиям.
Сделаны следующие выводы о построенных гиперболических регрессиях (Таблица 20):
1. Все модели признаны значимыми в целом.
2. Все модели имеют статистически значимые коэффициенты.
3. Все модели имеют гомоскедастичные остатки.
4. У всех моделей запредельно высокое значение средней ошибки аппроксимации.
5. Все модели имеют низкий коэффициент детерминации.
6. В результате ни одну из моделей нельзя использовать, так как
данные модели не соответствуют требованиям.
Сделаны следующие выводы о построенных степенных регрессиях
(Таблица 21):
1. Все модели признаны значимыми в целом.
2. Все модели имеют статистически значимые коэффициенты.
25
y3 x1
y3 x2
y3 x3
y3 x4
y3 x5
y3 x6
y3 x7
y3 x8
y3 x9
y3 x10
y3 x11
y3 x12
y3 x13
p-value
для a
0.941984
2.59E-05
0.467178
0.711115
0.209516
0.581193
0.442289
0.716528
0.359124
0.427846
0.963075
0.086842
0.03007
p-value
для b
3.70E-05
1.79E-05
0.0001
6.80E-05
0.043035
0.000145
2.46E-05
4.56E-05
2.62E-05
6.86E-05
3.26E-07
7.36E-05
4.87E-06
R2
Sost
A
MAD
GQ
DW
554
541
591
583
881
634
509
549
520
502
351
572
440
845.15
618.76
4518.27
789.00
235.72
981.78
2004.67
1345.08
1770.89
657.96
47.44
1084.42
471.22
1.39
1.53
1.53
1.41
0.59
1.25
1.53
1.54
1.49
1.58
1.53
1.52
1.64
0.74 743 51.96%
0.77 704 58.08%
0.70 801 51.17%
0.72 778 60.44%
0.28 1242 113.17%
0.68 823 77.42%
0.76 721 37.04%
0.73 755 45.63%
0.76 724 46.78%
0.72 779 46.40%
0.87 519 41.30%
0.71 783 51.22%
0.81 638 42.97%
Таблица 18: Линейные модели y3 xn , n = 1, 13
y 3 x1
y 3 x2
y 3 x3
y 3 x4
y 3 x5
y 3 x6
y 3 x7
y 3 x8
y 3 x9
y3 x10
y3 x11
y3 x12
y3 x13
p-value
для a
0.586626
0.323813
0.531292
0.240848
0.33312
0.913179
0.45673
0.467891
0.60545
0.516182
0.633663
0.196653
0.609753
p-value
для b
0.063366
0.363617
0.158587
0.024934
0.356151
0.140119
0.102144
0.080164
0.21371
0.170697
0.00533
0.122093
0.50348
p-value
для с
5.17E-01
4.11E-01
0.814461
2.40E-01
0.481218
0.582528
7.14E-01
5.18E-01
9.76E-01
0.835943
4.56E-01
0.529073
5.31E-01
R2
Sost
A
0.75 730 44.23%
0.78 683 82.73%
0.70 799 57.18%
0.75 733 56.61%
0.31 1216 138.75%
0.69 813 58.88%
0.76 717 41.84%
0.74 741 46.50%
0.76 724 46.21%
0.72 777 52.98%
0.88 507 37.70%
0.72 769 64.39%
0.82 627 32.79%
MAD
GQ
DW
538
565
600
544
895
593
511
517
519
511
358
579
405
2394.11
624.53
155198.88
1243.91
343.11
4713.94
5998.22
3605.07
15228.73
803.98
51.53
1848.48
500.89
1.43
1.55
1.51
1.48
0.65
1.32
1.52
1.52
1.49
1.54
1.74
1.48
1.67
Таблица 19: Квадратичные модели y3 xn , n = 1, 13
3. Большинство моделей имеет гомоскедастичные остатки и подлежат
дальнейшему рассмотрению: y3 x1 , y3 x2 , y3 x4 , y3 x5 , y3 x6 , y3 x9 , y3 x11 , y3 x13 .
4. Среди выбранных моделей следующие не имеют автокорреляции
остатков: y3 x9 , y3 x11 , y3 x13 .
5. Среди трех оставшихся моделей наименьшее среднее отклонение и
среднюю ошибку аппроксимации имеет модель y3 x13 .
Значит, между экспортом со странами СНГ и среднегодовой ценой
на нефть марки Brent ($) имеется степенная зависимость.
y3 = e−1.4115 x2.0247
.
13
Интерпретация: при увеличении среднегодовой цены на нефть марки Brent
на 1% экспорт со странами СНГ увеличится на 2.02%.
Сделаны следующие выводы о построенных степенных регрессиях
26
y3 x1
y3 x2
y3 x3
y3 x4
y3 x5
y3 x6
y3 x7
y3 x8
y3 x9
y3 x10
y3 x11
y3 x12
y3 x13
p-value
для a
1.16E-05
1.10E-05
3.01E-05
6.63E-06
0.005215
1.02E-05
8.25E-06
9.31E-06
2.14E-05
2.72E-05
1.93E-06
6.33E-06
2.97E-06
p-value
для b
0.002613
1.56E-05
0.006834
0.00108
0.035299
0.002319
0.001644
0.001944
0.004678
0.006432
0.000452
0.000495
0.000306
R2
Sost
A
MAD
GQ
DW
0.51
0.77
0.44
0.57
0.30
0.52
0.55
0.53
0.47
0.45
0.62
0.62
0.65
1019
696
1093
956
1226
1011
986
998
1063
1088
896
902
871
153.26%
62.43%
152.26%
146.05%
136.72%
147.16%
135.28%
148.00%
154.78%
151.19%
110.43%
127.43%
86.90%
813
544
854
765
899
803
768
789
836
831
672
711
626
0.005
0.002
0.002
0.003
0.01
0.004
0.003
0.002
0.004
0.003
0.02
0.002
0.003
0.90
1.54
0.82
1.00
0.62
0.94
0.94
0.92
0.84
0.83
1.22
1.11
1.09
Таблица 20: Гиперболические модели y3 xn , n = 1, 13
(Таблица 22):
1. Все модели признаны значимыми в целом.
2. Все модели имеют статистически значимые коэффициенты.
3. Некоторые модели имеют гомоскедастичные остатки и подлежат
дальнейшему рассмотрению: y3 x2 , y3 x5 , y3 x11 , y3 x13 .
4. Среди выбранных моделей все модели имеют автокорреляцию остатков, а значит, не удовлетворяют требованиям.
5. У всех моделей высокая средняя ошибка аппроксимации.
Сделаны следующие выводы о построенных логарифмических регрессиях (Таблица 23):
1. Все модели признаны значимыми в целом.
2. Несмотря на значимость коэффициентов, все модели имеют гетероскедастичные остатки и огромную среднюю ошибку аппроксимации, и
как следствие, не подлежат выбору.
В результате получаем, что переходя к нелинейным моделям, мы избавляемся от гетероскедастичности и автокорреляции, имевшихся в линейных моделях. Лучшими моделями среди построенных являются следующая
модель:
y3 = e−1.4115 x2.0247
.
13
Рассмотрим множественные нелинейные модели. Как уже было рассмотрено ранее, целесообразно строить лишь двухфакторные модели вида
y3 x5 xn , n = 1, 13 Другие модели будут неточными в виду наличия мультиколлинеарности. Качественной двухфакторной нелинейной моделью является степенная, так как степенная однофакторная модель y1 x5 показала
27
y3 x1
y3 x2
y3 x3
y3 x4
y3 x5
y3 x6
y3 x7
y3 x8
y3 x9
y3 x10
y3 x11
y3 x12
y3 x13
p-value
для a
3.64E-05
7.16E-06
0.000325
2.53E-05
0.000894
0.000493
3.61E-06
1.45E-05
1.55E-05
1.90E-05
3.89E-05
3.03E-05
0.049353
p-value
для b
1.40E-07
5.66E-06
1.54E-07
3.98E-07
0.000337
1.47E-06
1.65E-08
9.48E-08
4.57E-08
4.97E-08
1.15E-07
2.51E-07
9.74E-09
R2
Sost
A
0.88 788 32.28%
0.46 1657 44.79%
0.86 831 34.92%
0.83 920 35.37%
0.61 1417 58.34%
0.85 877 37.35%
0.89 754 28.39%
0.88 796 33.81%
0.89 744 32.80%
0.87 807 31.16%
0.94 537 35.05%
0.83 923 35.19%
0.92 646 24.72%
MAD
GQ
DW
523
808
557
582
852
583
505
559
519
495
353
609
376
5.01
7.64
23.91
7.10
4.56
4.10
10.66
9.76
7.77
9.59
0.28
9.88
2.13
1.25
0.75
1.46
1.12
0.56
1.12
1.44
1.48
1.42
1.53
1.37
1.34
1.63
Таблица 21: Степенные модели y3 xn , n = 1, 13
хороший результат:
y3 = e−31.28619 x1.98436
x0.85424
.
5
11
Интерпретация: при увеличении фактора x5 на 1 %, y1 увеличится на
1,98436% при неизменном другом факторе, или же при увеличении фактора
x11 на 1 %, y1 увеличится на 0,85% при неизменном другом факторе.
28
y3 x1
y3 x2
y3 x3
y3 x4
y3 x5
y3 x6
y3 x7
y3 x8
y3 x9
y3 x10
y3 x11
y3 x12
y3 x13
p-value
для a
7.74E-11
5.26E-05
1.06E-10
4.01E-10
0.16255
1.18E-10
5.25E-11
9.16E-11
5.18E-11
2.97E-11
9.51E-12
1.09E-08
3.10E-10
p-value
для b
4.27E-05
7.72E-06
4.14E-06
9.23E-05
0.000505
0.000263
4.13E-06
2.03E-05
2.37E-06
1.02E-06
1.45E-05
1.01E-05
4.16E-07
R2
Sost
A
MAD
GQ
DW
0.72
0.43
0.72
0.59
0.55
0.80
0.73
0.76
0.80
0.75
0.63
0.66
0.85
1196
1699
1201
1451
1514
1020
1169
1113
1002
1123
1366
1326
881
50.28%
46.26%
40.75%
56.70%
56.62%
58.54%
43.26%
51.39%
40.89%
40.52%
53.63%
47.55%
32.99%
681
826
688
811
901
674
660
742
635
654
786
758
526
16.56
7.71
512.46
13.77
7.26
17.69
30.04
29.50
48.44
14.62
0.31
17.91
2.23
0.77
0.75
1.11
0.81
0.61
0.83
0.95
1.08
0.89
1.44
0.66
1.09
1.24
Таблица 22: Экспоненциальные модели y3 xn , n = 1, 13
2.5. Построение модели импорта со странами СНГ
В данном параграфе рассмотрены модели зависимости y4 от различных факторов x1 , .., x13 .
Сначала рассмотрим парные линейные регрессии y4 x1 . . . y4 x13 . Проводя исследование, аналогичное предыдущему параграфу, получаем следующие результаты, представленные в Таблице 25 :
Поля корреляции с построенными линейными регрессиями размещены в приложении на Рис. 16 - 19
Сделаны следующие выводы о построенных линейных регрессиях
(Таблица 25):
1. Только у одной моделей значим коэффициент а: y4 x2 . Коэффициент b значим у всех моделей.
2. Все модели значимы в целом.
3. Остатки гомоскедастичны только у модели y4 x5 , однако коэффициент детерминации этой модели говорит об отсутствии связей.
4. Во всех моделях высокая средняя ошибка аппроксимации.
5. Нет линейных моделей, удовлетворяющих всем условиям.
В результате можно сделать вывод о том, что y4 нельзя линейно описать факторами x1 − x13 . Необходимо линеаризовать выборки и строить
нелинейные модели.
Более того, построение линейных множественных моделей невозможно, так как линейные модели обладают плохими свойствами и при множественной регрессии ошибки будут только расти.
Корреляционная матрица размещена в приложении в Таблице 36.
Рассмотрим нелинейные модели.
29
y3 x1
y3 x2
y3 x3
y3 x4
y3 x5
y3 x6
y3 x7
y3 x8
y3 x9
y3 x10
y3 x11
y3 x12
y3 x13
p-value
для a
0.000169
1.74E-05
0.00124
0.000115
0.042764
0.000289
0.000184
0.000177
0.000408
0.000746
1.65E-05
0.000201
0.000236
p-value
для b
6.87E-05
1.66E-05
0.000406
5.67E-05
0.037037
0.00011
7.83E-05
7.80E-05
0.000166
0.000305
6.13E-06
9.11E-05
3.07E-05
R2
Sost
A
0.88 779 92.67%
0.90 700 60.00%
0.85 889 107.59%
0.88 767 90.46%
0.70 1230 123.55%
0.87 807 82.74%
0.88 786 83.93%
0.88 786 89.43%
0.86 832 105.35%
0.85 870 105.32%
0.92 649 62.62%
0.88 795 87.75%
0.89 733 73.55%
MAD
GQ
DW
629
542
699
619
886
624
606
605
655
639
490
627
540
390.37
613.05
1158.96
503.23
171.06
399.93
769.26
668.81
562.38
475.93
44.47
698.10
428.42
1.32
1.54
1.19
1.42
0.61
1.34
1.31
1.34
1.21
1.18
1.60
1.39
1.34
Таблица 23: Логарифмические модели y3 xn , n = 1, 13
y3 x5 x11
p-value p-value p-value
2
Radj
Sost
A
MAD DW
для a
для с
для b
7.48e-05 0.00137 8.29e-07 0.9484 585 21.45% 359 1,54
Таблица 24: Степенная двухфакторная модель y3 x5 x11
Сделаны следующие выводы о построенных квадратичных регрессиях (Таблица 26):
1. Все модели значимы в целом, однако ни одна из них не удовлетворяет требованиям: практически во всех имеется гетероскедастичность
остатков, а также автокорреляция.
2. Нет моделей, полностью удовлетворяющих требованиям.
Сделаны следующие выводы о построенных гиперболических регрессиях (Таблица 27):
1. Все модели имеют низкий коэффициент детерминации, то есть
между переменными очень слабая связь.
2. Нет подходящих моделей.
Сделаны следующие выводы о построенных степенных регрессиях
(Таблица 28):
1. Большинство коэффициентов статистически не значимо.
2. Во всех моделях присутствует автокорреляция остатков.
3. Нет подходящих однофакторных моделей.
Сделаны следующие выводы о построенных экспоненциальных регрессиях (Таблица 29):
1. Все модели имеют автокорреляцию остатков и высокую среднюю
ошибку аппроксимации, кроме модели y4 x4 , для которой нет достаточно
оснований утверждать о наличии автокорреляции. Для уточнения этого
вопроса был вычислен коэффициент автокорреляции первого рода r =
30
y4 x1
y4 x2
y4 x3
y4 x4
y4 x5
y4 x6
y4 x7
y4 x8
y4 x9
y4 x10
y4 x11
y4 x12
y4 x13
p-value
для a
0.948132
5.48E-06
0.627563
0.424223
0.819918
0.59637
0.671055
0.876606
0.640736
0.872657
0.719502
0.108339
0.525897
p-value
для b
1.35E-05
3.71E-06
0.000206
2.03E-06
0.585784
2.47E-05
8.98E-05
8.05E-05
0.000161
0.001024
1.98E-06
8.39E-05
0.002163
R2
Sost
A
0.78
0.82
0.67
0.83
0.02
0.76
0.71
0.71
0.68
0.58
0.83
0.71
0.53
225.9
204.8
277.1
195.6
474.1
236.4
260.5
258.3
272.1
312.1
195.3
259.2
329.7
39.41%
44.34%
51.30%
36.65%
71.28%
32.17%
47.29%
42.62%
48.31%
52.01%
42.97%
45.90%
47.94%
MAD
GQ
166.4 16.32
170.9 33.51
219.6 89.02
150.0 35.20
340.7
5.81
156.2 139.43
204.1 33.33
195.6 94.05
211.7 29.14
242.9 86.58
160.2 13.03
200.0 69.04
235.3 1210.71
DW
0.49
0.45
0.44
0.58
0.20
0.59
0.40
0.53
0.39
0.36
0.49
0.46
0.49
Таблица 25: Линейные модели y4 xn , n = 1, 13
0.40753, и это знакчение оказалось больше критическго (rkr = 0.328), поэтому автокорреляция остатков присутствует и в этой модели.
2. Таким образом, нет подходящих моделей нет.
Сделаны следующие выводы о построенных логарифмических регрессиях (Таблица 29):
1. Большинство моделей имеет автокорреляцию остатков и очень высокую среднюю ошибку аппроксимации.
2. Таким образом, нет подходящих однофакторных моделей.
Все построенные двухфакторные нелинейные модели не удовлетворяют требованиям: в большинстве из них присутствует автокорреляция
остатков.
31
y4 x 1
y4 x 2
y4 x 3
y4 x 4
y4 x 5
y4 x 6
y4 x 7
y4 x 8
y4 x 9
y4 x10
y4 x11
y4 x12
y4 x13
p-value
для a
0.000377
4.57E-05
0.009017
0.00377
0.142082
0.009621
0.00135
0.004528
0.002579
0.031918
0.000218
0.013973
0.460737
p-value
для b
0.009555
3.35E-05
0.023639
0.080006
0.10934
0.142346
0.005737
0.026207
0.007261
0.069642
0.121135
0.016585
0.641613
p-value
для с
3.07E-05
2.40E-05
5.12E-04
1.62E-04
1.20E-01
6.05E-03
6.87E-05
6.38E-04
1.53E-04
5.73E-03
1.82E-05
7.43E-04
2.52E-01
R2
Sost
A
MAD
GQ
DW
0.95
0.96
0.88
0.95
0.21
0.87
0.93
0.89
0.91
0.78
0.97
0.89
0.58
107
95
164
106
427
171
131
156
146
224
88
158
311
22.45%
11.04%
30.76%
16.87%
71.70%
25.63%
25.53%
26.42%
29.77%
35.90%
13.18%
25.65%
28.27%
87
64
129
82
315
125
105
113
116
157
62
119
184
24.15
34.67
149.66
54.93
6.45
165.45
55.26
119.02
33.84
101.13
15.36
95.06
1153.85
1.35
1.87
1.16
1.73
0.33
1.08
1.16
1.58
0.77
1.14
1.95
1.37
0.77
Таблица 26: Квадратичные модели y4 xn , n = 1, 13
y4 x1
y4 x2
y4 x3
y4 x4
y4 x5
y4 x6
y4 x7
y4 x8
y4 x9
y4 x10
y4 x11
y4 x12
y4 x13
p-value
для a
0.000188
5.12E-06
0.00031
0.000133
0.09974
0.000151
0.000205
0.000192
0.000282
0.000332
0.000133
0.000183
0.000267
p-value
для b
0.041796
7.38E-06
0.06935
0.020288
0.405606
0.034363
0.038344
0.038303
0.059524
0.077016
0.030117
0.012364
0.022045
R2
Sost
A
MAD
GQ
DW
0.28
0.80
0.23
0.35
0.05
0.30
0.29
0.29
0.25
0.22
0.31
0.39
0.34
407
216
421
387
467
401
404
404
416
423
398
374
389
68.86%
46.18%
69.34%
67.47%
67.68%
67.59%
66.02%
67.89%
69.39%
67.95%
60.60%
63.30%
60.46%
317
180
323
306
333
312
311
315
322
322
296
292
294
0.05
0.03
0.03
0.03
0.21
0.01
0.07
0.01
0.04
0.02
0.06
0.03
0.001
0.28
0.43
0.26
0.29
0.21
0.29
0.27
0.28
0.27
0.26
0.34
0.31
0.29
Таблица 27: Гиперболические модели y4 xn , n = 1, 13
32
y4 x1
y4 x2
y4 x3
y4 x4
y4 x5
y4 x6
y4 x7
y4 x8
y4 x9
y4 x10
y4 x11
y4 x12
y4 x13
p-value
для a
0.145608
3.09E-08
0.955689
0.010747
0.463553
0.182509
0.159584
0.100663
0.311667
0.514278
0.236783
0.052636
0.013297
p-value
для b
9.20E-05
2.07E-08
0.000631
1.88E-05
0.215534
4.49E-05
0.000213
0.000137
0.000376
0.001178
0.000163
6.09E-05
0.000337
R2
Sost
A
MAD
GQ
DW
0.83
0.97
0.78
0.87
0.58
0.84
0.81
0.81
0.79
0.76
0.83
0.84
0.77
309
139
354
270
489
302
331
325
344
372
311
299
357
29.27%
15.71%
34.40%
26.45%
45.14%
26.92%
31.86%
30.38%
33.08%
35.47%
31.15%
28.94%
32.15%
186
87
216
166
289
177
203
199
210
228
191
184
212
0.59
3.81
5.71
2.06
2.43
5.46
1.94
6.14
1.37
7.68
1.37
4.72
77.32
0.33
0.91
0.29
0.38
0.19
0.39
0.30
0.33
0.29
0.25
0.28
0.36
0.33
Таблица 28: Степенные модели y4 xn , n = 1, 13
y4 x1
y4 x2
y4 x3
y4 x4
y4 x5
y4 x6
y4 x7
y4 x8
y4 x9
y4 x10
y4 x11
y4 x12
y4 x13
p-value
для a
2.77E-16
4.41E-07
6.33E-14
4.93E-17
0.000194
1.77E-16
9.33E-15
3.49E-15
2.22E-14
5.18E-13
3.46E-17
5.52E-13
7.47E-12
p-value
для b
1.54E-07
1.33E-08
5.10E-06
1.00E-08
0.28187
2.84E-07
1.28E-06
9.95E-07
2.06E-06
5.22E-05
5.36E-08
1.35E-06
5.59E-05
R2
Sost
A
MAD
GQ
DW
0.95
0.97
0.90
0.97
0.57
0.93
0.92
0.92
0.91
0.85
0.97
0.92
0.81
168
135
238
133
493
203
214
218
232
290
128
215
329
18.50%
14.98%
24.07%
15.05%
45.99%
18.52%
22.03%
22.46%
22.87%
28.10%
16.76%
21.47%
26.06%
106
82
148
83
292
116
134
141
144
181
82
132
180
1.09
3.98
9.33
3.25
2.65
5.91
3.33
7.69
1.79
9.00
1.50
6.40
75.12
0.66
1.01
0.52
1.17
0.19
0.70
0.50
0.64
0.43
0.38
0.81
0.66
0.50
Таблица 29: Экспоненциальные модели y4 xn , n = 1, 13
33
y4 x1
y4 x2
y4 x3
y4 x4
y4 x5
y4 x6
y4 x7
y4 x8
y4 x9
y4 x10
y4 x11
y4 x12
y4 x13
p-value
для a
0.004396
5.51E-06
0.019808
0.00128
0.525033
0.00329
0.00791
0.006087
0.012426
0.02559
0.004648
0.003058
0.033726
p-value
для b
0.001962
5.25E-06
0.007589
0.000656
0.483461
0.001346
0.003793
0.002969
0.005754
0.012272
0.002015
0.00148
0.006996
R2
Sost
A
MAD
GQ
DW
0.81
0.92
0.77
0.84
0.61
0.82
0.79
0.80
0.78
0.75
0.81
0.82
0.77
327
210
361
302
470
318
343
337
354
374
328
321
359
54.80%
45.28%
62.71%
54.09%
69.39%
51.34%
57.91%
54.90%
59.79%
61.75%
55.10%
54.67%
56.55%
249
175
285
237
337
237
267
258
276
291
251
248
271
15.59
32.44
49.89
29.50
5.27
119.12
20.58
78.78
26.62
74.19
14.12
50.35
1230.64
0.34
0.44
0.31
0.37
0.20
0.39
0.31
0.34
0.31
0.28
0.37
0.35
0.35
Таблица 30: Логарифмические модели y4 xn , n = 1, 13
34
Выводы
В результате проведенного исследования были построены модели экспорта и импорта Санкт-Петербурга со странами дальнего зарубежья и со
странами СНГ. Большинство моделей оказались низкого качества и непригодны для дальнейшего применения. Однако среди всех моделей были выбраны такие, которые отвечают требованиям, предъявляемым к качественным эконометрическим моделям.
y1 — экспорт со странами дальнего зарубежья — имеет степенную
зависимость от иностранных инвестиций, а также имеет одновременную
нелинейную зависимость от числа предприятий и иностранных инвестиций,
а также от числа предприятий и среднегодовой цены на нефть марки Brent.
0.88075
y1 = e−4.2918 x11
.
y1 = e−19.52811 x1.40024
x0.70695
.
5
11
y1 = e5.717 e0.0000051x5 e0.21x13 .
y2 — импорт со странами дальнего зарубежья — находится под влиянием среднегодовой цены на нефть марки Brent, объема платных услуг
населению, а также имеет нелинейную двухфакторную зависимость от числа предприятий и иностранных инвестиций.
y2 = −5559.06 + 342.35x13 .
y2 = e−3.2898 x1.0701
.
9
y2 = e6.53 e0.000006x5 e0.0000007x11 .
y3 — экспорт со странами СНГ — зависит от среднегодовой цены на
нефть марки Brent, а также имеет нелинейную двухфакторную зависимость от числа предприятий и иностранных инвестиций.
y3 = e−1.4115 x2.0247
.
13
y3 = e−31.28619 x1.98436
x0.85424
.
5
11
Для y4 — импорт со странами СНГ — не удалось построить качественные модели, хорошо описывающие данную переменную. Необходимо
проводить более глубокий анализ и выявление дополнительных факторов
влияния на данную переменную.
35
Заключение
В результате работы были выявлены факторы, оказывающие влияние на ВТО Санкт-Петербурга. Следует обратить особое внимание на эти
факторы при прогнозировании и анализе развития региона.
Стоит отметить, что большинство моделей не прошли этап верификации, так как они оказывались неадекватными, неточными или имели
другие отклонения от основных предположений МНК: наблюдалась гетероскедастичность или автокорреляция остатков.
Есть вероятность, что данные могут быть некорректными. Проводя проверку моделей на выбросы, было обнаружено немало выбросов в
линейных моделях. Преимущественно данные за 2007-2008 годы являлись
выбросами в данных моделях. Становится очевидно, что на зависимые переменные влияют также скрытые факторы, которые очень трудно обнаружить. Вероятно, это объясняется тем, что в 2007-2008 годах был мировой
кризис, а значит, экономика находилась также под влиянием внешних и
неконтролируемых факторов.
В результате необходимо дальше исследовать и изучать факторы,
влияющие на объем экспорта и импорта.
36
Список литературы
[1] Региональная экономика : учебник для академического бакалавриата / Под ред. Е. Л. Плисецкого, В. Г. Глушковой. М.: Издательство
Юрайт, 2014. 583 с.
[2] Региональная экономика: Учебник / Под ред. В. И. Видяпина, М В. Степанова. М.: ИНФРА-М, 2007. 666 с.
[3] Баженов Ю. Н., Подшувейт О. В. Проблемы и возможности развития
внешнеэкономической деятельности Санкт-Петербурга, Ленинградской
области и Республики Карелия // Балтийский регион, 2012. № 1. С. 70 –
80.
[4] Внешнеэкономические
связи
субъектов
Российской
Федерации
(Санкт-Петербург
и
Ленинградская
область).
http://federalbook.ru/files/FS/Soderjanie/FS-7/V/5.pdf
[5] Регионы России. Основные характеристики субъектов Российской Федерации. 2015: Стат. Сб. / Росстат. М., 2015. 672 с.
[6] Талаев М. С., Котилко В. В. Оценка факторов роста внешнеторгового
оборота субъектов РФ // Российское предпринимательство, 2005. № 9
(69). C. 11 – 15.
[7] Федеральная служба государственной статистики. Каталог публикаций.
Регионы России. Основные характеристики субъектов Российской Федерации. http://www.gks.ru/
[8] Эконометрика: учеб. / Под ред. И. И. Елисеевой. М.: Проспект, 2010.
288 с.
[9] Магнус Я. Р., Катышев П. К., Пересецкий А. А. Эконометрика. Начальный курс: Учебник. – 8-е изд. М.: Дело, 2007. 504 с.
[10] Буре В. М., Евсеев Е. А. Основы эконометрики: Учеб. пособие. СПб., 2004. 72 с.
[11] Айвазян С. А. Методы эконометрики: учебник / С. А. Айвазян
М.:Магистр: ИНФРА-М, 2015. 512 с.
[12] Парный регрессионный анализ : учебное пособие / Е. С. Комарова. М. Берлин: Директ-Медиа, 2015. 59 c.
[13] Роберт И. Кабаков R в действии. Анализ и визуализация данных в
программе R / пер. с англ. Полины А. Волковой. М.: ДМК Пресс, 2014.
588 с.: ил.
37
[14] Буре В. М., Парилина Е. М., Седаков А. А., Шевкопляс Е. В. Прикладная статистика в R, STATISTICA и Excel. Описательная статистика. Оценивание параметров. Статистические критерии. Издательство
Санкт-Петербургского государственного университета, 2011. 104 с.
38
Приложение
В данном разделе представлены исходные данные, диаграммы рассеивания, результаты построения нелинейных моделей, а также программная
реализация построения моделей на языке R.
Исходые данные
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
2013
2014
y1
2404
1789.1
1541.7
2573.3
3736.3
4325.4
11505.9
15561.3
20716.7
11483.6
10709.8
19450.5
19330
17929
19591.7
y2
2366.4
3802.9
4731.7
5565.1
6951.9
9822.9
13882.6
19591.6
25315.8
17521.9
24108
32216.3
35249
34246.5
29309
y3
y4
140.4 232.2
157.7 233.4
181.7 203.2
258.9 260.6
381.5 294.8
589.1 292.7
1160.8 287.9
2238.1 387.6
2936.1 422.7
1955.6 319.7
1115.8 416.1
1854 557.4
4053
1105
4280.2 1521.7
2735
1561
Таблица 31: Данные зависимых переменных y1 - y4
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
2013
2014
x1
150727.3
205091.7
275442.6
367198.4
435674.9
518885.3
666392.8
811704
1119660
1420830
1473348
1699486
2091914
2291993
2491423
x2
2367.7
2372.2
2382
2410.2
2414.5
2427
2445.2
2473.4
2472.1
2453.1
2466.3
2500.9
2530.4
2565.3
2593.1
x3
2583
3468
4572
6851
9176
12266
14148
16876
17712
22607
24824
26069
27834
31407
34724
x4
447808
532277
685753
947245
1026687
1111989
1420407
1740175
2005536
2314055
2635927
3243788
3727291
4349428
4870300
x5
218681
247372
275381
305145
333501
368991
393399
414080
429540
450901
374459
367457
348481
354354
357124
x6
x7
126234
86493
175365 112330
222952 139303
293506 161878
370736 215893
433301 292504
500158 357373
646298 447928
805374 585715
1099842 614760
1448429 685051
1891115 742104
2222088 844759
2160129 920721
2283141 1017623
Таблица 32: Данные независимых переменных x1 - x7
39
Рис. 8: Поля корреляции и линии регрессии y2 x1 , .., y2 x3
Рис. 9: Поля корреляции и линии регрессии y2 x4 , .., y2 x6
Рис. 10: Поля корреляции и линии регрессии y2 x7 , .., y2 x9
40
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
2013
2014
x8
254783.4
334197
436572
569874.2
678967.8
806592
1019093
1275054
2071881
1737293
2280958
2758717
2713185
3204272
3368041
x9
30903
42331
57255
76470
101219
126367
151461
190066
228811
241367
281338
316308
343769
372674
386444
x10
x11
x12
x13
35891 1159891 2460.6 28.3
53169 1171379 2915.2 24.4
63501
881033
3462.4
25
111678 695761
3851.8 28.9
117762 985084
4399.2 38.3
156854 1417164 4984.1 54.4
193684 5254804 5502.6 65.4
303448 6283942 6506.7 72.7
372637 5927567 7583.3 97.7
324711 5525071 8139.9 61.9
401537 5231439 9133.4 79.6
360368 6120717 9786.4 111
352116 10767496 10458.4 121.4
475149 13431283 11302.7 108.8
502617 12090283 12819.7 98.9
Таблица 33: Данные независимых переменных x8 - x13
Рис. 11: Поля корреляции и линии регрессии y2 x10 , .., y2 x13
Модели y2x1 − y2x13
Модели y3x1 − y3x13
Модели y4x1 − y4x13
Программная реализация на R
\ small
#Data
new <− read . table ( " Datay1 . t x t " , header = TRUE, dec=" . " )
n <− nrow(new ) ; dL <− 1 . 0 8 ; dU <− 1 . 3 6 ; GQ <− 9 . 2 8 ;
y1x1 <− read . table ( " y1x1 . t x t " , header = TRUE, row . names = 1 , d
#L i b r a r y
41
y2
x1
x2
x3
x4
x5
x6
x7
x8
x9
x10
x11
x12
x13
y2
1.00
0.94
0.92
0.94
0.92
0.56
0.94
0.96
0.96
0.97
0.93
0.91
0.95
0.99
x1
x2
x3
x4
x65
x6
x7
x8
x9
1.00
0.96
0.98
0.99
0.47
0.98
0.99
0.98
0.99
0.94
0.94
0.99
0.90
1.00
0.96
0.98
0.52
0.93
0.96
0.96
0.96
0.94
0.95
0.97
0.90
1.00
0.97
0.59
0.96
0.99
0.98
0.99
0.97
0.92
0.99
0.91
1.00
0.43
0.98
0.98
0.98
0.98
0.93
0.95
0.99
0.88
1.00
0.38
0.56
0.50
0.57
0.66
0.44
0.55
0.58
1.00
0.97
0.97
0.97
0.89
0.91
0.97
0.90
1.00
0.99
1.00
0.97
0.94
1.00
0.93
1.00
0.99
0.96
0.92
0.99
0.93
1.00
0.97
0.93
1.00
0.94
x10
x12
x13
1.00
0.90 1.00
0.97 0.92 1.00
0.90 0.88 0.91 1.00
Таблица 34: Корреляционная матрица y2 xn , n = 1, 13
Рис. 12: Поля корреляции и линии регрессии y3 x1 , .., y3 x3
Рис. 13: Поля корреляции и линии регрессии y3 x4 , .., y3 x6
42
x11
Рис. 14: Поля корреляции и линии регрессии y3 x7 , .., y3 x9
Рис. 15: Поля корреляции и линии регрессии y3 x10 , .., y3 x13
y3
x1
x2
x3
x4
x5
x6
x7
x8
x9
x10
x11
x12
x13
y3
1.00
0.85
0.88
0.87
0.84
0.66
0.82
0.89
0.89
0.89
0.90
0.87
0.88
0.96
x1
x2
x3
x4
x65
x6
x7
x8
x9
1.00
0.96
0.98
0.99
0.47
0.98
0.99
0.98
0.99
0.94
0.94
0.99
0.90
1.00
0.96
0.98
0.52
0.93
0.96
0.96
0.96
0.94
0.95
0.97
0.90
1.00
0.97
0.59
0.96
0.99
0.98
0.99
0.97
0.92
0.99
0.91
1.00
0.43
0.98
0.98
0.98
0.98
0.93
0.95
0.99
0.88
1.00
0.38
0.56
0.50
0.57
0.66
0.44
0.55
0.58
1.00
0.97
0.97
0.97
0.89
0.91
0.97
0.90
1.00
0.99
1.00
0.97
0.94
1.00
0.93
1.00
0.99
0.96
0.92
0.99
0.93
1.00
0.97
0.93
1.00
0.94
x10
x12
x13
1.00
0.90 1.00
0.97 0.92 1.00
0.90 0.88 0.91 1.00
Таблица 35: Корреляционная матрица y3 xn , n = 1, 13
43
x11
Рис. 16: Поля корреляции и линии регрессии y4 x1 , .., y4 x3
Рис. 17: Поля корреляции и линии регрессии y4 x4 , .., y4 x6
Рис. 18: Поля корреляции и линии регрессии y4 x7 , .., y4 x9
44
Рис. 19: Поля корреляции и линии регрессии y4 x10 , .., y4 x13
y4
x1
x2
x3
x4
x5
x6
x7
x8
x9
x10
x11
x12
x13
y4
1.00
0.85
0.88
0.87
0.84
0.66
0.82
0.89
0.89
0.89
0.90
0.87
0.88
0.96
x1
x2
x3
x4
x5
x6
x7
x8
x9
1.00
0.96
0.98
0.99
0.47
0.98
0.99
0.98
0.99
0.94
0.94
0.99
0.90
1.00
0.96
0.98
0.52
0.93
0.96
0.96
0.96
0.94
0.95
0.97
0.90
1.00
0.97
0.59
0.96
0.99
0.98
0.99
0.97
0.92
0.99
0.91
1.00
0.43
0.98
0.98
0.98
0.98
0.93
0.95
0.99
0.88
1.00
0.38
0.56
0.50
0.57
0.66
0.44
0.55
0.58
1.00
0.97
0.97
0.97
0.89
0.91
0.97
0.90
1.00
0.99
1.00
0.97
0.94
1.00
0.93
1.00
0.99
0.96
0.92
0.99
0.93
1.00
0.97
0.93
1.00
0.94
x10
x12
x13
1.00
0.90 1.00
0.97 0.92 1.00
0.90 0.88 0.91 1.00
Таблица 36: Корреляционная матрица y4 xn , n = 1, 13
45
x11
library ( l m t e s t )
library ( c a r )
library ( corrgram )
#l i b r a r y ( glm )
#Linear model
f i t 1 <−lm( y1~x1 , data=new)
plot ( y1~x1 , new ) ; abline ( f i t 1 )
r e s 1<−f i t 1 $ residuals
S1 <− sqrt (sum( r e s 1 ^2)/ ( n−2))
A1<−sum( abs ( r e s 1 ) /abs (new$y1 ) ) /n
MAD1<−sum( abs ( r e s 1 ) ) /n
R1 <− 1−(sum( r e s 1 ^2)) / (sum( (new$y1−mean(new$y1 ) ) ^ 2 ) )
summary( f i t 1 )
l 1 <− new [ order (new$x1 ) , ] #G o l f e l d Quandt Test m1 <−
lm( y1~x1 , data=l 1 ) GQ1<−g q t e s t (m1, f r a c t i o n=n/ 3) $ s t a t i s t i c
i f (GQ1<GQ) {"Нет␣ гетероскедастичности ␣ остатков "}
e l s e {" Гетероскедастичностьостатков ␣ присутствует "}
dwtest ( f i t 1 ) #DurbinWatsonTest
DW1<−dwtest ( f i t 1 ) $ s t a t i s t i c
i f (DW1>2) {DW1<− 4−DW1} ;
i f (DW1<dL ) {"Автокорреляция␣ есть " } ;
i f (DW1>dU) {"Автокорреляция␣ отсутствует "} ;
i f (DW1>dL && DW1<dU) {"Нет␣ оснований ␣для␣решения"}
y1x1$Sост [ 1 ]<−S1 ; y1x1$A [ 1 ]<−A1 ;
y1x1$MAD[ 1 ]<−MAD1; y1x1$R. 2 [ 1 ]<−R1 ;
y1x1$GQ. Test [ 1 ]<−GQ1;
y1x1$DW. Test [ 1 ]<−DW1;
y1x1$p . v a l u e . model . [ 1 ]<−anova ( f i t 1 ) $Pr [ 1 ] ;
y1x1$p . v a l u e . a . [ 1 ]<−summary( f i t 1 ) $ c o e f f i c i e n t s [ [ 1 , 4 ] ] ;
y1x1$p . v a l u e . b . [ 1 ]<−summary( f i t 1 ) $ c o e f f i c i e n t s [ [ 2 , 4 ] ] ;
#Quadratic model
new$x1k<−(new$x1 )^2
f i t 2<−lm( y1~x1+x1k , data=new)
r e s 2<−f i t 2 $ residuals
S2 <− sqrt (sum( r e s 2 ^2)/ ( n−2))
A2<−sum( abs ( r e s 2 ) /abs (new$y1 ) ) /n
46
MAD2<−sum( abs ( r e s 2 ) ) /n
R2 <− 1−(sum( r e s 2 ^2)) / (sum( (new$y1−mean(new$y1 ) ) ^ 2 ) )
summary( f i t 2 )
k2 <− new [ order (new$x1k ) , ] #GQTest
m2 <− lm( y1~x1k , data=k2 )
GQ2 <− g q t e s t (m2, f r a c t i o n=n/ 3) $ s t a t i s t i c
i f (GQ2<GQ) {"Нет␣ гетероскедастичности ␣ остатков "}
e l s e {" Гетероскедастичность ␣ остатков ␣ присутствует "}
dwtest ( f i t 2 ) #DurbinWatsonTest
DW2 <− dwtest ( f i t 2 ) $ s t a t i s t i c
i f (DW2>2) {DW2<− 4−DW2} ;
i f (DW2<dL ) {"Автокорреляция␣ есть " } ;
i f (DW2>dU) {"Автокорреляция␣ отсутствует "} ;
i f (DW2>dL && DW2<dU) {"Нет␣ оснований ␣для␣решения"}
y1x1$Sост [ 2 ]<−S2 ;
y1x1$A [ 2 ]<−A2 ;
y1x1$MAD[ 2 ]<−MAD2;
y1x1$R. 2 [ 2 ]<−R2 ;
y1x1$GQ. Test [ 2 ]<−GQ2; y1x1$DW. Test [ 2 ]<−DW2;
y1x1$p . v a l u e . model . [ 2 ]<−anova ( f i t 2 ) $Pr [ 1 ] ;
y1x1$p . v a l u e . a . [ 2 ]<−summary( f i t 2 ) $ c o e f f i c i e n t s [ [ 1 , 4 ] ] ;
y1x1$p . v a l u e . b . [ 2 ]<−summary( f i t 2 ) $ c o e f f i c i e n t s [ [ 2 , 4 ] ] ;
#H y p e r b o l i c model
new$x1h <− (1 /new$x1 )
f i t 3 <− lm( y1~x1h , data=new)
r e s 3 <− f i t 3 $ residuals
S3 <− sqrt (sum( r e s 3 ^2)/ ( n−2))
A3 <− sum( abs ( r e s 3 ) /abs (new$y1 ) ) /n
MAD3 <− sum( abs ( r e s 3 ) ) /n
R3 <− 1−(sum( r e s 3 ^2)) / (sum( (new$y1−mean(new$y1 ) ) ^ 2 ) )
summary( f i t 3 )
h3 <− new [ order (new$x1h ) , ] # GQ Test
m3 <− lm( y1~x1h , data=h3 )
GQ3 <− g q t e s t (m3, f r a c t i o n=n/ 3) $ s t a t i s t i c
i f (GQ3<GQ) {"Нет␣ гетероскедастичности ␣ остатков "}
e l s e {" Гетероскедастичность ␣ остатков ␣ присутствует "}
47
dwtest ( f i t 3 ) #DurbinWatsonTest
DW3 <− dwtest ( f i t 3 ) $ s t a t i s t i c
i f (DW3>2) {DW3<− 4−DW3} ;
i f (DW3<dL ) {"Автокорреляция␣ есть " } ;
i f (DW3>dU) {"Автокорреляция␣ отсутствует "} ;
i f (DW3>dL && DW3<dU) {"Нет␣ оснований ␣для␣решения"}
y1x1$Sост [ 3 ]<−S3 ; y1x1$A [ 3 ]<−A3 ;
y1x1$MAD[ 3 ]<−MAD3;
y1x1$R. 2 [ 3 ]<−R3 ;
y1x1$GQ. Test [ 3 ]<−GQ3;
y1x1$DW. Test [ 3 ]<−DW3;
y1x1$p . v a l u e . model . [ 3 ]<−anova ( f i t 3 ) $Pr [ 1 ] ;
y1x1$p . v a l u e . a . [ 3 ]<−summary( f i t 3 ) $ c o e f f i c i e n t s [ [ 1 , 4 ] ] ;
y1x1$p . v a l u e . b . [ 3 ]<−summary( f i t 3 ) $ c o e f f i c i e n t s [ [ 2 , 4 ] ] ;
#Power−low model
new$y1c <− log (new$y1 )
new$x1c <− log (new$x1 )
f i t 4 <− lm( y1c ~ x1c , data=new)
a4 <− dummy. coef ( f i t 4 ) $ ‘ ( I n t e r c e p t ) ‘
b4 <− dummy. coef ( f i t 4 ) $x1c
new$ y1cc <− ( (new$x1 )^ b4 )∗exp ( a4 )
r e s 4 <− (new$y1−new$ y1cc )
S4 <− sqrt (sum( r e s 4 ^2)/ ( n−2))
A4 <− sum( abs ( r e s 4 ) /abs (new$y1 ) ) /n
MAD4 <− sum( abs ( r e s 4 ) ) /n
R4 <− 1−(sum( r e s 4 ^2)) / (sum(new$y1 ^2))
summary( f i t 4 )
#p l o t ( new$ y1cc ~new$x1 )
p4 <− new [ order (new$x1c ) , ] # GQ Test
m4 <− lm( y1c~x1c , data=p4 )
GQ4 <− g q t e s t (m4, f r a c t i o n=n/ 3) $ s t a t i s t i c
i f (GQ4<GQ) {"Нет␣ гетероскедастичности ␣ остатков "}
e l s e {" Гетероскедастичность ␣ остатков ␣ присутствует "}
dd<−0 ; #DurbinWatson Test
for ( i i n 1 : ( n−1)) {dd <−dd+( r e s 4 [ i +1]− r e s 4 [ i ] ) ^ 2 }
ww <− sum ( r e s 4 ^2) DW4 <− dd/ww i f (DW4>2)
{DW4<− 4−DW4} ;
i f (DW4<dL ) {"Автокорреляция␣ есть " } ;
48
i f (DW4>dU)
{"Автокорреляция␣ отсутствует "} ;
i f (DW4>dL && DW4<dU) {"Нет␣ оснований ␣для␣решения"}
y1x1$Sост [ 4 ]<−S4 ; y1x1$A [ 4 ]<−A4 ;
y1x1$MAD[ 4 ]<−MAD4; y1x1$R. 2 [ 4 ]<−R4 ;
y1x1$GQ. Test [ 4 ]<−GQ4;
y1x1$DW. Test [ 4 ]<−DW4;
y1x1$p . v a l u e . model . [ 4 ]<−anova ( f i t 4 ) $Pr [ 1 ] ;
y1x1$p . v a l u e . a . [ 4 ]<−summary( f i t 4 ) $ c o e f f i c i e n t s [ [ 1 , 4 ] ] ;
y1x1$p . v a l u e . b . [ 4 ]<−summary( f i t 4 ) $ c o e f f i c i e n t s [ [ 2 , 4 ] ] ;
#E x p o n e n t i a l model
new$y1d <− ( log (new$y1 ) )
f i t 5 <− lm( y1d ~ x1 , data=new)
r e s 5 <− f i t 5 $ residuals
a5 <− dummy. coef ( f i t 5 ) $ ‘ ( I n t e r c e p t ) ‘
b5 <− dummy. coef ( f i t 5 ) $x1
new$y1dd <− exp ( b5∗new$x1 )∗exp ( a5 )
plot (new$y1dd ~ new$x1 )
r e s 5 <− (new$y1−new$y1dd )
S5 <− sqrt (sum( r e s 5 ^2)/ ( n−2))
A5 <− sum( abs ( r e s 5 ) /abs (new$y1 ) ) /n
MAD5 <− sum( abs ( r e s 5 ) ) /n
R5 <− 1−(sum( r e s 5 ^2)) / (sum(new$y1 ^2))
summary( f i t 5 )
e5 <− new [ order (new$x1 ) , ] # GQ Test
m5 <− lm( y1d~x1 , data=e5 )
GQ5 <− g q t e s t (m5, f r a c t i o n=n/ 3) $ s t a t i s t i c
i f (GQ5<GQ) {"Нет␣ гетероскедастичности ␣ остатков "}
e l s e {" Гетероскедастичность ␣ остатков ␣ присутствует "}
dd<−0 ; #DurbinWatson Test
for ( i i n 1 : ( n−1)) {dd<− dd+( r e s 5 [ i +1]− r e s 5 [ i ] ) ^ 2 }
ww<− sum ( r e s 5 ^2)
DW5<− dd/ww
i f (DW5>2) {DW5<− 4−DW5} ;
i f (DW5<dL ) {"Автокорреляция␣ есть " } ;
i f (DW5>dU) {"Автокорреляция␣ отсутствует "} ;
i f (DW5>dL && DW5<dU) {"Нет␣ оснований ␣для␣решения"}
49
y1x1$Sост [ 5 ]<−S5 ;
y1x1$A [ 5 ]<−A5 ;
y1x1$MAD[ 5 ]<−MAD5;
y1x1$R. 2 [ 5 ]<−R5 ;
y1x1$GQ. Test [ 5 ]<−GQ5; y1x1$DW. Test [ 5 ]<−DW5;
y1x1$p . v a l u e . model . [ 5 ]<−anova ( f i t 5 ) $Pr [ 1 ] ;
y1x1$p . v a l u e . a . [ 5 ]<−summary( f i t 5 ) $ c o e f f i c i e n t s [ [ 1 , 4 ] ] ;
y1x1$p . v a l u e . b . [ 5 ]<−summary( f i t 5 ) $ c o e f f i c i e n t s [ [ 2 , 4 ] ] ;
#L o g a r i t h m i c model
new$x1e <− ( log (new$x1 ) )
f i t 6 <− lm( y1~x1e , data=new)
r e s 6 <− f i t 6 $ residuals
S6 <− sqrt (sum( r e s 6 ^2)/ ( n−2))
A6 <− sum( abs ( r e s 6 ) /abs (new$y1 ) ) /n
MAD6 <− sum( abs ( r e s 6 ) ) /n
R6 <− 1−(sum( r e s 6 ^2)) / (sum(new$y1 ^2))
summary( f i t 6 )
l 6 <− new [ order (new$x1e ) , ] #GQ Test
m6 <− lm( y1~x1e , data=l 6 )
GQ6 <− g q t e s t (m6, f r a c t i o n=n/ 3) $ s t a t i s t i c
i f (GQ6<GQ) {"Нет␣ гетероскедастичности ␣ остатков "}
e l s e {" Гетероскедастичность ␣ остатков ␣ присутствует "}
dwtest ( f i t 6 ) #DurbinWatsonTest
DW6<−dwtest ( f i t 6 ) $ s t a t i s t i c
i f (DW6>2) {DW6<− 4−DW6} ;
i f (DW6<dL ) {"Автокорреляция␣ есть " } ;
i f (DW6>dU) {"Автокорреляция␣ отсутствует "} ;
i f (DW6>dL && DW6<dU) {"Нет␣ оснований ␣для␣решения"}
y1x1$Sост [ 6 ]<−S6 ; y1x1$A [ 6 ]<−A6 ;
y1x1$MAD[ 6 ]<−MAD6;
y1x1$R. 2 [ 6 ]<−R6 ;
y1x1$GQ. Test [ 6 ]<−GQ6;
y1x1$DW. Test [ 6 ]<−DW6;
y1x1$p . v a l u e . model . [ 6 ]<−anova ( f i t 6 ) $Pr [ 1 ] ;
y1x1$p . v a l u e . a . [ 6 ]<−summary( f i t 6 ) $ c o e f f i c i e n t s [ [ 1 , 4 ] ] ;
y1x1$p . v a l u e . b . [ 6 ]<−summary( f i t 6 ) $ c o e f f i c i e n t s [ [ 2 , 4 ] ] ;
#Конец
50
y1x1
write . table ( y1x1 , " c : /y1x1 . t x t " , sep="\ t " )
pairs (~y1+x1+x2+x6+x11+x13 , data=new)
corrgram (new, order=TRUE, lower . panel=panel . shade ,
upper . panel=panel . pie ,
text . panel=panel . txt , main="Коррелограмма␣для
набора ␣данных␣new" )
library (MASS)
f i t g h<−lm( y1~x1+x5+x6+x13 , data=new)
stepAIC ( f i t g h , d i r e c t i o n=" backward " )
51
Отзывы:
Авторизуйтесь, чтобы оставить отзыв