САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
Кафедра Высшей Математики
Цветков Андрей Леонидович
Выпускная квалификационная работа бакалавра
Моделирование демографических процессов
в Санкт-Петербурге
Направление 010400
Прикладная математика, фундаментальная информатика
и основы программирования
Научный руководитель:
к.ф.-м.н.,
доцент
Евстафьева В.В.
Санкт-Петербург
2016
Содержание
Введение.........................................................................................................................................3
Постановка задачи......................................................................................................................... 5
Основные показатели численности..............................................................................................5
Глава 1. Анализ основных показателей численности населения в Санкт-Петербурге...........6
1.1 Общая численность............................................................................................................. 6
1.2 Миграция.............................................................................................................................. 7
1.3 ЕДН....................................................................................................................................... 8
Глава 2 Выбор модели прогнозирования................................................................................... 11
2.1 Выбор линии тренда по коэффициенту детерминации..................................................13
2.2 Дисперсия остатков........................................................................................................... 17
2.3 Критерий Акаике и критерий Шварца.............................................................................18
2.4 Проверка точности оценкой MAPE..................................................................................20
Глава 3 Выбор модели для прогнозирования............................................................................21
3.1 Проверка модели на реальных данных............................................................................21
3.1 Прогноз на 2017 год...........................................................................................................22
Заключение...................................................................................................................................23
Список литературы......................................................................................................................24
2
Введение
Данная работа посвящена исследованию демографических процессов в
Санкт-Петербурге. Эта задача представляет огромный интерес. Ведь именно
решение этой проблемы позволит составлять верные стратегии, для
получения наиболее полезного и точного итогового значения желаемого и
создания последующих действий. Актуальность решения этой задачи
достаточно высока, она выявляется во многих поднятых темах документа «О
Стратегии экономического и социального развития Санкт-Петербурга на
период до 2030 года» [10]. Повышение точности прогнозирования
демографической ситуации в городе крайне важно и позволит облегчить
устранение таких проблем как: установление соответствия планировки
количества мест в образовательных учреждениях, в первую очередь
дошкольных, повышение жилищных условий, трудоустройство населения и
планирование объема расходов городского бюджета.
Демография, как наука, образовалась уже более 300 лет назад, первая
перепись населения на территории России была проведена в 1897 году, но до
сих пор наука остается еще малоизученной. Главной проблемой
прогнозирования является человече ский фактор. Создать даже
краткосрочный достаточно точный прогноз очень сложно. Основой анализа
демографии является выявление демографических тенденций в целом.
В первой главе рассмотрены и проанализированы основные показатели
демографических процессов в Санкт-Петербурге.
В последние 10 лет в демографии России наблюдается положительные
изменения. На задний план отошли такие проблемы, как высокий уровень
смертности и повысился уровень рождаемости. В начале 1990 годов эти
явления носили за собой катастрофический характер, так как из-за этого
общий уровень численности населения значительно снижался, ожидаемая
продолжительность жизни падала, что говорило о существовании в стране на
то время серьезного демографического кризиса [4]. Спустя 10 лет ситуация в
Санкт-Петербурге изменилась, начала стабилизироваться, и в итоге
3
естественный прирост снова стал положительным. Однако, несмотря на это, в
государстве все равно численность населения продолжает сокращаться, что
ставит эту проблему с высоким приоритетом.
За последние 10 лет в Санкт-Петербурге демографические показатели
стали явно улучшаться [10]. Количество численности постоянного населения
в 2004 году составило 4 686 500 человек, а уже в 2012 составило 5 028 000
человек. К наиболее проблематичным аспектам демографического развития
города отно сится стабильная тенденция старения населения и
разбалансированность его половозрастной структуры. Например, число
людей старше трудоспособного возраста повысилось с 1 106 300 человек в
2005 году и до 1 294 900 человек в 2012. Происходит рост численности людей
пенсионного возраста. Если в 2000 году в Санкт-Петербурге насчитывалось
1 253 700 пенсионеров, то в 2011 году уже 135 900, а в 2012 году — 137 500
человек. Наиболее многочисленной возрастной группой населения СанктПетербурга являются люди, чей возраст выше 70 лет. В начале 2013 года их
доля составляла 11%. Так же проблема демографии города является
немаловажное усиление негативного влияния миграционных процессов.
Основное количество международных мигрантов прибывает в город из стран
СНГ. В 2012 году их доля составляла 84,6%. Из прибывающих из СНГ
огромное представительство имеют граждане Узбекистана (34,6%),
Белоруссии (14,7%), Таджикистана (12,1%), Украины (11,1%) и Казахстана
(8%).
Во второй главе проведен анализ методов исследования и трендовых
моделей. При составлении модели для прогнозирования демографических
показателей очень важно учесть ряд дополнительных факторов, отличных от
абсолютных характеристик1. В дальнейшем будут проанализированы
статистические таблицы и зависимость показателей в них, на основе которых
будет строиться конкретная модель. Так же рассмотрены модели,
1 Абсолютная характеристика – численность населения и отдельных его групп по стране в целом и
отдельным регионам, числа демографических событий во всем населении и отдельных его группах, также в
разрезе регионов [9].
4
используемые на практике в Санкт-Петербурге отделами занимающиеся
статистикой и численностью населения для прогнозирования общей
численности.
В третьей главе построена модель прогнозирования численности
населения в Санкт-Петербурге, а также протестирована на данных
показателей предыдущих лет.
Постановка задачи
Рассматриваются временные ряды, состоящие из 70 значений
показателя численности населения города Санкт-Петербурга за период с
января 1970 г. по январь 2015 г. С шагом 1 год. (значения добавляются
каждый год на 1 января, за отчетный год)
Цель работы:
провести анализ временного ряда, составленного из
значений показателя численности;
построить несколько моделей, описывающих динамику
показателя численности, и провести их исследование на адекватность;
рассчитать точность аппроксимации и точность прогноза;
выбрать наилучшую модель для построения краткосрочного
прогноза;
построить прогноз на 2017 г..
В данной работе построение графиков и основные расчеты были
выполнены в MS Excel (Приложение).
Основные показатели численности
1. общая численность;
2. миграция;
3. естественное движение населения (далее ЕДН).
5
Глава 1. Анализ основных показателей численности
населения в Санкт-Петербурге
Проведем анализ основных показателей численности СанктПетербурга. Данные были предоставлены из базы данных территориального
органа Федеральной службы государственной статистики по городу СанктПетербург и Ленинградской области за последние 47 лет с ежегодным
интервалом. Численность рассчитывается каждый год и приходится на
отчетный месяц, точнее на январь следующего каждого года.
1.1 Общая численность
Рассмотрим графически динамику изменения численности города.
Общая численность
6000000
5000000
Численность
4000000
3000000
2000000
1000000
0
1964 1968 1972 1976 1980 1984 1988 1992 1996 2000 2004 2008 2012 2016 2020
Годы
Рис. 1. График динамики численности населения
Анализируя график легко заметить, что в 1990 году численность
прекратила расти, а после 1992 года и вовсе начала уменьшаться. Подобные
спады могут быть обусловлены множеством внешних факторов. Как было
описано во введении общая численность населения складывается из двух
6
основных параметров, это ЕДН и миграция, в свою очередь эти параметры,
при разложении на первостепенные показатели, зачастую бывают
нестабильны и могут изменяться в связи с абсолютно разными причинами
или процессами, происходящих на той или иной территории. Подробный
анализ показал, что в это время оба показателя (ЕДН и миграция) значимо
ухудшились. Впервые за долгое время рождаемость начала падать, а
показатель смертности расти, в итоге к 1990 году показатель естественного
прироста стал отрицательным. Так же в динамике миграционного прироста
начался спад, и к 1991 году он тоже стал отрицательным, вследствие чего
начала значительно падать численность населения.
1.2 Миграция
Спад в миграции можно увидеть на графике динамики миграционного
прироста.
Миграционный прирост (убыль)
12
10
Численность
8
6
4
2
0
1964
1968
1972
1976
1980
1984
1988
1992
1996
2000
2004
2008
2012
2016
2020
Годы
Рис. 2. Динамика миграционного прироста (убыли)
Одним из основных факторов падения динамики миграционного
прироста стал ряд нововведений в миграционный процесс:
7
«О праве граждан Российской Федерации на свободу
передвижения, выбор места пребывания и жительства в пределах Российской
Федерации» (от 25 июня 1993 г. № 5242-1);
«О беженцах» (от 19 февраля 1993 г. № 4529-1);
«О вынужденных переселенцах» (от 19 февраля 1993 г. № 4531-
Постановление Верховного Совета Российской Федерации (от 22
1);
декабря 1992 г. № 4183-1) объявило вступившим в силу на территории
Российской Федерации Закон СССР «О порядке выезда из Союза Советских
Социалистических Республик и въезда в Союз Советских Социалистических
Республик граждан СССР» (от 20 мая 1991 г. № 2177-1).
В это же время Указом Президента Российской Федерации (от 14 июня
1992 г. № 626) была создана Федеральная миграционная служба (ФМС)
России. Такое ведомство впервые образовано в системе федеральных органов
исполнительной власти. На ФМС России возлагалось обеспечение
формирования и реализации политики Российской Федерации в области
миграции населения и координация этой работы в стране[9]. Подобные
изменения в тенденции миграции из-за нововведений регистрации граждан
можно встретить во многих других городах и странах. Так, например, в США
упал миграционный прирост мигрантов из Мексики, при нововведениях в
визовый режим страны, что вызвало падение показателя тенденции числа
мигрантов [11].
1.3 ЕДН
Можно сделать вывод, что количество миграций резко начало
снижаться по причинам, напрямую связанных с нововведениями. Но и не
только миграция могла повлиять на подобный спад, ведь общая численность
населения складывается не только из миграционного прироста (убыли), но и
ЕДН. Для более детального анализа явления спада динамики численности
населения, нужно обратить внимание на основные показатели ЕДН, а точнее
8
на рождаемость и смертность. Стоит отметить, что рождение делится на два
пункта: живорождение и мертворождение. В базу рождаемости записываются
исключительно живорожденные плоды. "Живорождением является полное
изгнание или извлечение продукта зачатия из организма матери вне
зависимости от продолжительности беременности, причем плод после такого
отделения дышит или проявляет другие признаки жизни, такие, как
сердцебиение, пульсация пуповины или произвольные движения
мускулатуры, независимо от того, перерезана пуповина и отделилась ли
плацента. Каждый продукт такого рождения рассматривается как
живорожденный" [9].
Проведем графический анализ таблицу динамики рождений и смертей.
Рождаемость
12
10
Численность
8
6
4
2
0
1964
1968
1972
1976
1980
1984
1988
1992
1996
2000
2004
2008
2012
2016
2020
Годы
Рис. 3. Динамика рождаемости
В динамике рождаемости так же наблюдается резкий спад с 1987 года,
что является не маловажным критерием, для падения общей численности
населения. Одновременно с этим спадом наблюдается возрастание уровня
смертности (Рис. 4.), что только усиливает спад общей численности
9
населения. Это связано с изменениями во внутренней политике государства.
Самым основным критерием подобного спада многие относят пенсионные
изменения [1].
ЕДН
100,000
80,000
60,000
Численность
40,000
20,000
0
-20,000
-40,000
-60,000
-80,000
1960
1970
1980
1990
2000
2010
2020
Годы
Рождаемость
Смертность
Естественный прирост (убыль)
Рис. 4. Динамика ЕДН
На Рис. 4. Можно увидеть динамику ЕДН, которая рассчитывается
напрямую разницей между количеством рождений и смертей. Но через
некоторый промежуток времени заметно «торможение» демографической
ямы, а после и вновь рост численности, рождаемости и спад смертности. Это
объясняется снова же политикой государства. Масштабы подобного спада
принуждают к кардинальному корректированию сложившейся ситуации [1].
Правительство начинает разрабатывать и реализовывать меры по устранению
спада численности. В подобные меры вошли такие как: увеличение пособий
на детей, выплаты за рождение второго ребенка, улучшение системы
здравоохранения, образования и урегулирование миграционных потоков из
стран ближнего зарубежья.
Здравоохранение стало одной из многих наиболее успешных отраслей
экономики Петербурга [2]. Эта отрасль обеспечивает Петербургу лидерство в
10
России. В городе усиливается развитие медицинского туризма и
государственно-частного партнерства. Еще в 2012 году петербургские врачи
освоили выхаживание младенцев, начиная с 22 недель беременности. С того
момента в Санкт-Петербурге вдвое увеличилось количество мест для
ма л ыш ей с экст рема л ьно низкой массой тела. По сле открытия
дополнительного отделения по реанимации новорожденных в 2015 году, 1-я
городская детская больница стала самым крупным центром по выхаживанию
в Европе.
В последние пять лет, как видно по графику, Санкт-Петербург выходит
из затяжного кризиса демографии, численность населения растет [2].
Показатель смертности за последние годы снизился на 8,5%. В прошлом
родилось рекордное число малышей – 70 725. Ожидаемая продолжительность
жизни составила 78 лет у женщин и 69 лет у мужчин. Исходя их этих данных,
Петербург входит в четверку лучших в России. «Поколение петербуржцев,
появившееся на свет в 2011-2015 годах, будет более многочисленным, чем
предыдущие и это самая объективная оценка нашей работы, без
статистических загадок и политических ярлыков» отметил Полтавченко.
Учитывая подобные проце ссы в динамиках, будет сделан
краткосрочный прогноз на год, чтобы ориентировочно предположить, как
дальше будет вести себя показатель численности населения и тенденция.
Глава 2 Выбор модели прогнозирования
Построение функций для анализируемого временного ряда,
характеризирующий зависимость значений - это одна из разновидностей
моделей для прогнозирования.
Рассмотрим простую модель численности населения на определенной
территории [9]. Это модель представлена в практическом пособии,
используемом руководством отдела статистики населения Росстата. Так как
перепись населения требует больших финансовых затрат, особенно на
обширных территориях с огромным количеством населения, а данных
11
получаемых из источников, таких как, например, ЗАГС или миграционная
служба, не хватает для точного составления информации, то сведения о
населении в период между переписями получают расчетным путем,
основываясь на данных переписи и текущего учета движения населения.
S (t+1) = S (t) + B (t) - M (t) + U (t) – V (t),
Где S (t) - численность на начало года t,
B (t) - число родившихся в году t,
M (t) - число умерших,
U (t) - число прибывших,
V (t) - выбывших из нее в году t.
Подобная модель далека от истины. В ней не учитывается множество
факторов. Главной ее проблемой является то, что данные приходят из разных
источников, следовательно, могут быть не совсем сопоставимы. Для
целостного прогнозирования будут использованы основные общие
параметры динамики населения, такие как численность, ЕДН и миграция
населения2.
Для проверки метода прогнозирования временных рядов проведен
пример модели с показателями предыдущих лет. На значениях с 1970 г. по
2013 г. строится модель, проверяется ее точность и пригодность для прогноза.
2 Миграция населения – перемещение людей из одного региона (страны) в другой, в ряде случаев большими
группами и на большие расстояния [7].
12
Численность
6000000
5000000
Численность
4000000
3000000
2000000
1000000
0
1960
1970
1980
1990
2000
2010
2020
Годы
Рис. 5. Численность населения (1970 - 2013 гг.)
2.1 Выбор линии тренда по коэффициенту детерминации
Первым шагом находится наиболее подходящая линия тренда. Линия
тренда используется в техническом анализе, для выявления тенденции
временного ряда, и представляет собой среднее значение заданных
показателей.
Рассмотрим линейную и полиномиальную линию тренда (Рис. 6, Рис.
7.).
Линейный тренд
6000000
Численность
5000000
4000000
3000000
2000000
1000000
0
1960
1970
1980
1990
Годы
13
2000
2010
2020
Рис. 6. Линейный тренд для общей численности населения
Полиномиальный тренд
6000000
Численность
5000000
4000000
3000000
2000000
1000000
0
1960
1970
1980
1990
2000
2010
2020
Годы
Рис. 7. Полиномиальный тренд для общей численности населения
Для более точного описания тенденции подходит полиномиальная
линия тренда. Для оценки качества модели используют коэффициент
детерминации R 2 . Коэффициент детерминации определяет долю дисперсии
зависимой переменной, объясненную уравнением регрессии [6].
Сначала находится ее коэффициент детерминации [5].
R
=
QR
Q R +Q ε
(1)
n
∑ (Ý −Y^ t )2
где Q R =
– сумма квадратов, которой обусловлена регрессия,
t=1
n
Qε
2
= ∑ ε2t
t=1
n
= ∑ (Y t −Y^ t )2
t=1
– остаточная сумма квадратов, которая
характеризует отклонение от регрессии.
Коэффициент детерминации лежит в значениях от -1 до +1. Чем ближе
значение коэффициента по модулю к 1, тем теснее связь результативного
значения с анализируемыми факторами. Если коэффициент детерминации
R
2
= 0.9, следовательно, уравнением регрессии объясняется 90%
дисперсии результативного значения. Значение коэффициента детерминации
является основным критерием оценки качества модели. Чем больше доля
объясненной вариации, тем слабее роль остальных факторов, значит модель
регрессии хорошо аппроксимирует исходный временной ряд, следовательно,
14
данной регрессионной моделью можно воспользоваться для построения
дальнейших значений результативного показателя.
При подборе разных степеней полинома коэффициент детерминации
выше 0.9 становился после 2-й степени полинома. Подставляя в формулу (1)
значения, вычисляем. Коэффициент детерминации у линейной трендовой
модели равен 0,43.
Степень полинома
R
2
2
0,73
3
0,92
4
0,98
5
0,99
Следовательно, полиномы 3-й, 4-й и 5-й степени лучше
аппроксимируют исходные данные.
А н а л и з и руе м ы й в р е м е н н о й р я д л у ч ш е в с е го о п и с ы ва е т
полиномиальная трендовая модель.
Полиномиальные линии тренда имеют вид:
Полином 3-ей степени
Полином 4-ей степени
Полином 5-ей степени
y = 69,82x3 - 5 725,17x2 + 143 975,61x
+ 3 736 754,88
y = 3,61x4 - 254,65x3 + 3 733,53x2 +
46 864,95x + 3 977 274,12
y = -0,08x5 + 12,22x4 - 601,21x3 +
9 684,98x2 + 6 826,31x + 4 046 792,12
Приведены графики реальных значений и модельных на примере 4-ой и
5-ой степени.
15
Полином 4-й степени
6000000
5000000
Численность
4000000
3000000
2000000
1000000
0
1960
1970
1980
1990
2000
2010
2020
Годы
Рис. 8. Полиномиальная линия тренда 4-й степени
Полином 5-й степени
6000000
5000000
Численность
4000000
3000000
2000000
1000000
0
1960
1970
1980
1990
2000
2010
Годы
Рис. 9. Полиномиальная линия тренда 5-й степени
16
2020
2.2 Дисперсия остатков
Остатки
Численность
1000000
0
-1000000
1960
1970
1980
1990
2000
2010
2020
Годы
Рис. 10. Остатки
По графику остатков (Рис. 10.), видно, что значения колеблются вокруг
нуля.
Еще критерием на адекватность модели, является среднее остатков и
дисперсия остатков.
Принято считать, что чем меньше показатель среднего и дисперсии
остатков, тем выше качество модели.
Дисперсия остатков [3]
n
S
2
2
εi
∑
= t =1 (2)
n
где ε 2i – квадрат остатков,
n
– число наблюдений.
Среднее остатков[3]
n
M
= ∑ ε (3)
t =1
n
где εi – остатки,
n
– число наблюдений.
17
i
При подстановке данных в формулу (3) получаем значения:
Среднее остатков
Полином степени
Значение
3
0,05937860
4
0,02700597864
5
0,1122873959
При подстановке данных в формулу (2) получаем значения:
Дисперсия остатков
Степень
полинома
Значение
0,005144185248243
3
51
0,001106904136503
4
22
0,033073693993618
5
00
Вывод: Графический анализ остатков, на котором видно, что значения
колеблются вокруг нуля, и значения среднего и дисперсии остатков, близкие к
0, говорят о том, что модели хорошо описывают реальные данные.
2.3 Критерий Акаике и критерий Шварца
Для выбора наиболее простой модели, но с высокой точностью
аппроксимации, используем критерии Акаике (AIC) и Шварца (SC) [3].
Информационный критерий является мерой качества моделей,
учитывающей степень приближения модели и ее простоту. Принято считать
лучшей по качеству модель, значение критерия для которой меньше [3].
18
Рассмотрим два информационных критерия. Они широко используются
для анализа временных рядов.
1. Критерий Акаике (AIC)
( )
n
AIC =
ln
∑ ε2i
t=1
+
n
2⋅k
n
(4)
где n - число наблюдений,
εi
– квадрат остатков,
k
- число степеней свободы.
2
Особенности критерия:
«Штрафование» числа параметров ограничивает рост сложности
модели;
Может сравнивать модели только одинаковыми выборками.
2. Критерий Шварца (SC)
( )
n
SC =
ln
∑ ε2i
t=1
n
+
k ⋅ ln n
n
(5)
где n - число наблюдений,
2
εi
– квадрат остатков,
k
- число степеней свободы.
Байесовский информационный критерий (S c h w a r z C r i t e r i o n - SC)
используется для выбора модели из класса параметризованных моделей,
которые зависят от разного числа параметров. Основное отличие от критерия
Акаике заключается в том, что данный критерий налагает штраф на
увеличение количества параметров, так как ln n больше двух уже при
восьми наблюдениях.
Особенности критерия:
Критерий Шварца является возрастающей функцией от числа
значений в модели и от остаточной суммы квадратов ошибок
модели;
Используется при длинных выборках данных.
19
Вычисления по формулам (4) и (5) дали следующий результат:
Критерий Акаике
AIC
Полином 3-й степени
2,30
Полином 4-й степени
2,23
Полином 5-й степени
2,26
Критерий Шварца
SC
Полином 3-й степени
4,0493
Полином 4-й степени
3,930567
Полином 5-й степени
3,921467
Вывод: по критерию Шварца полином 5-й степени выше, а по
критерию Акаике 4-й. Для анализа лучше использовать более простую
модель, поэтому выберем полином 4-ой степени, следовательно, на
основании его будет производится построение дальнейших значений.
2.4 Проверка точности оценкой MAPE
Для определения точности аппроксимации временных рядов выбрана
наиболее популярная оценка MAPE [8].
Показатель MAPE выявляет на сколько велики ошибки по сравнению
со значениями ряда.
Принято считать, что при показаниях меньше 10%, точность является
высокой, если показатель выше 10% и ниже 20%, то точность хорошая, до
50% - удовлетворительная.
MAPE =
N
|Z ( t )− Z^ (t )|
1
∑
N t =1
Z (t)
⋅ 100% (6)
где Z (t ) – фактическое значение временного ряда,
^ (t ) – прогнозное значение временного ряда,
Z
N
– количество наблюдений.
20
Вычисления выбранной модели показали следующие результаты
оценки на точность аппроксимации общей численности населения в городе.
Подставляя значения в формулу (6) получаем:
MAPE = 0,005611237 или MAPE = 0,5611237 %
Вывод: точность построенной модели дала очень высокий результат.
Глава 3 Выбор модели для прогнозирования
3.1 Проверка модели на реальных данных
Основываясь на выбранном полиноме и зная его коэффициенты, можно
выполнить построение дальнейших значений. Вычисления выполняется
подстановкой нужных значений, в данном случае используется дата, на
которую надо сделать расчет, в переменные с заранее вычисленными
коэффициентами выбранного полинома.
Учитывая то, что временной ряд составлен из данных, слабо зависящих
друг от друга долгосрочный точный прогноз выполнить достаточно сложно,
для того, чтобы минимизировать погрешность отклонения полученных
значений от реальных данных, выполним краткосрочный прогноз на год.
На выходе получены значения с 2014 г. по 2016 г.. Сравним их с
фактическими.
Год
Численность
Полученные
Фактические
значения
значения
2014
5 244 870
5 131 900
2015
5 410 215
5 191 700
2016
5 604 416
5 225 700
Теперь определим точность полученных значений так же по формуле
(6)
21
MAPE = 0,045525 или MAPE = 4,5525 %
Вывод: вычисленные значения точности полученных данных меньше
10%, а значит точность является достаточно высокой, следовательно,
основываясь на этой модели, можно выполнить прогноз.
3.1 Прогноз на 2017 год
Теперь, узнав достаточно точную модель прогнозирования, построим
прогноз на 2017 год, используя модель y = 69,82x3 - 5 725,17x2 + 143 975,61x +
3 736 754,88.
Согласно выбранной и построенной модели прогноза, значение
численности населения города Санкт-Петербурга на январь 2017 года будет
равно 5 829 974 человек.
22
Заключение
Цели и задачи, поставленные в данной работе, были выполнены.
Проведен анализ временного ряда, составленного из значений показателя
численности населения города Санкт-Петербурга за период 1970 г. по 2016 г.
Построены пять полиномиальных моделей, описывающих динамику
показателя численности за период с 1970 г. по 2013 г.. Произведен анализ
коэффициентов детерминации. Чем выше степень полинома, тем лучше
показатель коэффициента детерминации. Более высокий коэффициент
детерминации говорит о хорошем качестве аппроксимации модели. По
коэффициенту детерминации определены три модели, наилучшим образом
аппроксимирующие данные - полиномиальные модели 3-й, 4-й и 5-й степени.
Для этих моделей проведен анализ остатков по графикам, значениям среднего
и дисперсии. Графический анализ остатков, на котором видно, что значения
колеблются вокруг нуля, и значения среднего и дисперсии остатков, близкие к
0, говорят о том, что модели хорошо описывают реальные данные. Выбор
лучшей модели для прогнозирования осуществлен по критериям Акайке и
Шварца. Чем меньше значения критерия, тем лучше модель. Из вычислений
следует, что лучше для прогноза подходит полином 4-й степени,
следовательно, на основании его будут производиться вычисления
Рассчитана точность аппроксимации модели за период с 1970 г. по 2013 г. и
точность модели на проверочной выборке за период с 2014 г. по 2016 г.
Оценка точности аппроксимации временного ряда составила менее 1%, что
говорит о хорошем выборе модели. Оценка точности модельных значений
составила меньше 5 %, следовательно, прогнозные данные будут иметь
хорошую точность.
На основе этого метода был выполнен прогноз на 2017 год. В итоге,
согласно прогнозу, численность населения в Санкт-Петербурге на январь
2017 года составит 5 829 974 человек, а тенденция останется положительной
и возрастающей.
23
Список литературы
1. Бессчетнова О. В. Социология // Вестник ЧелГУ, 2011, Вып. 44, С 126132.
2. Губернатор Петербурга: В городе всем хватает льготных лекарств и
врачей. http://doctorpiter.ru/articles/14117/
3. И. И. Елисеева, С. В. Курышева, Т. В. Костеева и др. Эконометрика.
Под ред. И. И. Елисеевой. – 2-е изд., перераб. и доп. – М.; Финансы и
статистика, 2005. – 576с.: ил
4. Короленко А. В. Основные черты современного демографического
кризиса в Росии и пути его преодоления // Проблемы развития теории,
2014., Вып. 2 (70). С. 79-83.
5. Коэффициент детерминации http://univer-nn.ru/ekonometrika/koefficientdeterminacii/
6. Мельников Р. М. Эконометрика. Учебное пособие. 2014. 288с.
7. Миграция, диаспоры и проблемы этнических меньшинств.
http://nicbar.ru/etnopolitologia_10.htm
8. Основные оценки точности прогнозирования временных рядов
http://www.mbureau.ru/blog/osnovnye-ocenki-tochnosti-prognozirovaniyavremennyh-ryadov
9. П р а к т и ч е с ко е и н с т р у к т и в н о - м е т од о л о г и ч е с ко е п о с о б и е
по демографической статистике утвержденное заместителем
руководителя Росстата, А.Е. Суринов, от 7 января 2007
10. Стратегия экономического и социального развития Санкт-Петербурга
на период до 2030 года. http://spbstrategy2030.ru/?page_id=102
11. Harriett D. Romo, Olivia Mogollon-Lopez. Mexican Migration to the
United States: Perspectives from Both Sides of the Border. University of
Texas Press. First edition. 2016.
Приложение
Таблица 1. Численность населения с 1970 г. по 2016 г..
24
Годы
Численнос
ть
1970
1971
4025000
4083400
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
2013
2014
4149900
4219800
4287000
4356200
4417900
4471300
4527200
4585800
4638300
4676000
4721900
4779200
4827400
4867200
4903800
4947800
4995600
5022000
5002400
5007500
4986400
4942900
4881600
4845400
4820200
4806600
4784000
4770900
4741900
4714800
4688400
4656500
4662000
4686500
4712900
4747500
4764900
4798700
4832800
4899300
4953200
5028000
5131900
25
2015
2016
5191700
5225700
Таблица 2. Значения тренда
значения тренда (степень
полинома)
Годы
3
4
1970
3858087,49
3998882,89
1971
3991229,97
4070810,03
1972
4112934,01
4112934,01
1973
4223664,97
4223664,97
1974
4323888,21
4323888,21
1975
4414069,09
4414069,09
1976
4494672,97
4494672,97
1977
4566165,21
4566165,21
1978
4629011,17
4629011,17
1979
4683676,21
4683676,21
1980
4730625,69
4730625,69
1981
4770324,97
4770324,97
1982
4803239,41
4803239,41
1983
4829834,37
4829834,37
1984
4850575,21
4850575,21
1985
4865927,29
4865927,29
1986
4876355,97
4876355,97
1987
4882326,61
4882326,61
1988
4884304,57
4884304,57
1989
4882755,21
4882755,21
1990
4878143,89
4878143,89
1991
1992
4870935,97
4861596,81
4870935,97
4861596,81
26
5
407415
7
409699
2
414354
2
421624
6
428814
9
435854
0
442676
7
449223
9
455442
6
461285
7
466712
2
471687
4
476182
3
480174
1
483646
1
486587
5
488993
6
490865
9
492211
8
493044
7
493384
2
493255
8
492691
1993
4850591,77
4850591,77
1994
4838386,21
4838386,21
1995
4825445,49
4825445,49
1996
4812234,97
4812234,97
1997
4799220,01
4799220,01
1998
4786865,97
4786865,97
1999
4775638,21
4775638,21
2000
4766002,09
4766002,09
2001
4758422,97
4758422,97
2002
4753366,21
4753366,21
2003
4751297,17
4751297,17
2004
4752681,21
4752681,21
2005
4757983,69
4757983,69
2006
4767669,97
4767669,97
2007
4782205,41
4782205,41
2008
4802055,37
4802055,37
2009
4827685,21
4827685,21
2010
4859560,29
4859560,29
2011
4898145,97
4898145,97
2012
4943907,61
4943907,61
2013
4997310,57
4997310,57
2014
5058820,21
5058820,21
2015
5128901,89
5128901,89
2016
5208020,97
5208020,97
Таблица 3. Степени своды и число наблюдений
27
2
491728
1
490410
0
488786
9
486914
6
484854
8
482675
4
480450
6
478260
2
476190
3
474333
0
472786
4
471654
8
471048
4
471083
5
471882
4
473573
5
476291
2
480176
1
485374
7
492039
5
500329
2
510408
4
522447
9
536624
4
Степени свободы
3
4
5
41
40
39
Число наблюдений
44
Таблица 4. Остатки
Годы
остатки
1970
3
166912,51
4
26117,11
5
-49156,83
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
92170,03
36965,99
-3864,97
-36888,21
-57869,09
-76772,97
-94865,21
-101811,17
-97876,21
-92325,69
-94324,97
-81339,41
-50634,37
-23175,21
1272,71
27444,03
65473,39
111295,43
139244,79
124256,11
136564,03
124803,19
92308,23
43213,79
19954,51
7965,03
7379,99
-2865,97
-4738,21
-24102,09
-43622,97
-64966,21
-94797,17
-90681,21
-71483,69
-54769,97
12589,97
6357,99
3554,09
-1149,29
-2340,19
-8867,13
-20939,11
-27225,61
-27056,59
-28822,49
-40874,23
-39923,21
-22541,31
-9060,89
1325,21
13863,67
39140,69
73481,99
91552,81
68557,91
74941,57
59487,59
25619,29
-22500,49
-42469,39
-48945,53
-41947,51
-42754,41
-33605,79
-40701,69
-47102,63
-54929,61
-71364,11
-54548,09
-23983,99
2065,27
-13591,96
13996,41
32520,46
39143,17
41492,72
32676,89
14197,46
-1135,39
-11388,68
-23892,23
-46124,26
-54096,99
-43842,24
-35297,03
-27389,18
-14722,91
13335,56
53072,41
79040,62
66274,37
85003,44
83767,61
65731,06
34796,77
33120,92
45827,29
72721,66
92406,21
122593,92
137122,97
153071,14
168570,21
176820,36
220204,57
279903,02
338507,49
28
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
-34705,41
-37155,37
-28985,21
-26760,29
1154,03
9292,39
30689,43
73079,79
62798,11
17679,03
28676,29
29165,19
35787,61
31038,71
45553,17
32805,19
24708,49
27816,31
-32778,59
-140543,93
402135,76
445346,01
501851,22
555833,57
639858,84
709590,81
799405,66
918606,37
995337,12
1049497,69
Таблица 5. Квадрат остатков
квадрат
остатков
Годы
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
3
27859785994,5
0
8495314430,20
1366484416,68
14937993,10
1360740037,00
3348831577,43
5894088922,62
8999408068,34
10365514336,7
7
9579752483,96
8524033033,98
8897199965,50
6616099619,15
2563839425,30
537090358,54
1619790,74
753174782,64
4286764798,09
12386672738,8
8
19389111542,1
4
15439580872,3
3
18649734289,8
4
15575836234,1
8
8520809325,73
1867431646,16
4
5
682103434,75
2416393935,65
158507344,60
1366484416,68
14937993,10
1360740037,00
3348831577,43
5894088922,62
8999408068,34
184741376,64
40424036,84
12631555,73
1320867,50
5476489,24
78625994,44
438446327,59
10365514336,77
9579752483,96
8524033033,98
8897199965,50
6616099619,15
2563839425,30
537090358,54
1619790,74
753174782,64
4286764798,09
741233839,87
732059062,43
830735929,80
1670702678,09
1593862696,70
508110656,52
82099727,59
1756181,54
192201345,87
1531993613,68
12386672738,88
5399602854,36
19389111542,14
8381917018,90
15439580872,33
4700187023,57
18649734289,84
5616238914,06
15575836234,18
8520809325,73
1867431646,16
3538773364,01
656348020,10
506272050,24
29
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
2013
2014
2015
398182469,34
63441702,90
54464252,40
8213784,04
22450634,00
580910742,37
1902963511,62
4220608441,76
8986503440,01
8223081847,06
5109917936,02
2999749613,80
1204465483,27
1380521519,84
840142398,74
716113120,88
1331785,24
86348511,91
941841113,72
5340655706,44
3943602619,57
398182469,34
63441702,90
54464252,40
8213784,04
22450634,00
580910742,37
1902963511,62
4220608441,76
8986503440,01
8223081847,06
5109917936,02
2999749613,80
1204465483,27
1380521519,84
840142398,74
716113120,88
1331785,24
86348511,91
941841113,72
5340655706,44
3943602619,57
2016
312548101,74
312548101,74
1803649086,97
2395664906,98
1759593595,20
1827939574,45
1129349121,52
1656627568,86
2218657752,92
3017262054,75
5092836196,09
2975494122,65
575231776,32
4265340,17
822329608,16
850608307,74
1280753029,51
963401518,46
2075091297,05
1076180490,94
610509478,08
773747102,02
1074435962,39
19752596259,8
4
Таблица 6. Промежуточные вычисления для MAPE в период с 1970 г. по 2013 г..
|Z ( t )− Z^ (t)|
SUM
|Z ( t )− Z^ (t )|
Z (t)
2621,56
0,000651
558,7
0,000137
5012,4
10703,04
11637,88
0,001208
0,002536
0,002715
13654,94
0,003135
8305,6
0,00188
4245,4
12319,96
14926,62
20160,56
36103,6
39224,2
25877,46
16205,12
9235,56
416,2
0,000949
0,002721
0,003255
0,004347
0,007721
0,008307
0,005415
0,003357
0,001898
8,49E-05
0,246894
30
23448,5
56273,04
73614,88
50712,44
58017,5
44295,2
12924,04
32004,12
48184,06
50397,2
38811,6
34881,96
21049,62
23742,56
26275,4
31049,4
45552,46
28259,12
969,44
23485,4
43954,3
35255,04
29179,88
7734,44
1037,7
37978
77966,96
0,004739
0,011265
0,014658
0,010138
0,011586
0,008883
0,002615
0,006556
0,009944
0,010455
0,008075
0,007291
0,004412
0,005007
0,005573
0,006623
0,009783
0,006062
0,000207
0,004983
0,009258
0,007399
0,006081
0,0016
0,000212
0,007667
0,015507
Таблица 7. Промежуточные вычисления для MAPE в период с 2014 г. по 2016 г..
|Z ( t )− Z^ (t )|
SUM
|Z ( t )− Z^ (t )| Z (t)
112970,1
0,022013
218515,1
0,042089
378716
0,072472
0,136574443
31
Отзывы:
Авторизуйтесь, чтобы оставить отзыв