САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ФАКУЛЬТЕТ ПРИКЛАДНОЙ МАТЕМАТИКИ – ПРОЦЕССОВ УПРАВЛЕНИЯ
КАФЕДРА МАТЕМАТИЧЕСКОЙ ТЕОРИИ МИКРОПРОЦЕССОРНЫХ СИСТЕМ УПРАВЛЕНИЯ
Горбунова Мария Николаевна
Выпускная квалификационная работа бакалавра
Анализ и прогнозирование денежных доходов
населения
010400
Прикладная математика и информатика
Заведующий кафедрой,
доктор физ.-мат. наук,
профессор
Малафеев О. А.
Научный руководитель,
доктор физ.-мат. наук,
профессор
Потапов Д. К.
Рецензент,
кандидат физ.-мат. наук,
доцент
Колпак Е. П.
Санкт-Петербург
2016
Оглавление
Введение....................................................................................................... 3
Цель работы ................................................................................................. 3
Постановка задачи исследования .............................................................. 4
Глава 1. Денежные доходы населения ...................................................... 5
§1. Определение понятия денежных доходов населения ................... 5
Глава 2. Математический аппарат............................................................. 7
2
Введение
К числу наиболее значимых направлений исследования социальноэкономического
положения
государства
относится
анализ
доходов
населения. Грамотный анализ денежных доходов населения и их динамики
является одним из основных моментов исследования уровня жизни
населения страны.
Изучение экономического поведения и динамики населения позволяет
получить объективную информацию об условиях жизни населения,
покупательной способности доходов населения, степени дифференциации
доходов и уровне бедности. Таким образом, статистические данные о
доходах и их анализ необходимы государственным органам, принимающим
решения, для определения мер адекватной экономической, налоговой и
социальной политики.
В современном мире для принятия такого рода решений необходимо
также
направлять
анализ
в
будущее
и
использовать
средства
прогнозирования. Это помогает выявить наиболее эффективные варианты
долгосрочных, среднесрочных и текущих путей развития, объясняет
причины основных направлений экономической политики, предсказывает
результаты принимаемых решений. Поэтому прогнозирование уровня
денежных доходов позволяет точнее делать выводы и является важным
фактором, влияющим на достижения поставленных целей. Этим и
определяется актуальность выбранной темы исследования.
Цель работы
Целью работы является построение и анализ эконометрической
модели прогнозирования денежных доходов населения на примере г. СанктПетербурга.
3
Постановка задачи исследования
Для работы взята тема «Анализ и прогнозирование денежных доходов
населения».
Имеются данные о среднедушевых доходах населения (в месяц; в
рублях) за 1998-2014 годы. Были собраны статистические данные по пяти
факторам за этот же период, которые, теоретически, влияют на выбранную
выше величину.
В ходе исследования необходимо изучить теоретические основы
статистического анализа денежных доходов населения;
Проанализировать структуру доходов населения, факторы, влияющие
на доходы населения;
Подтвердить
правильность
предположения
о
влиянии
данных
факторов с использованием математической модели и статистических
данных. В итоге чего выявляется статистическая значимость выбранных
факторов.
Составить и проанализировать модель,
проверить ее адекватность
модели реальной ситуации на данных в среде Statistica.
Осуществить краткосрочный прогноз.
Методы
исследования:
динамические
ряды,
дисперсионный анализ, корреляционно-регрессионный анализ.
4
группировка,
Глава 1. Денежные доходы населения
В данной главе будет изучена предметная область, исследована
структура доходов населения и выбраны факторы, теоретически
влияющие на доходы населения.
§1. Определение понятия денежных доходов населения
Под доходами населения понимается сумма денежных средств и
материальных
благ,
полученных
или
произведенных
домашними
хозяйствами за определенный промежуток времени.
Различают денежные и натуральные доходы. Денежные доходы населения складываются из поступлений денег в форме оплаты труда, социальных трансфертов, доходов от собственности, предпринимательской
деятельности, продажи продукции личного подсобного хозяйства и др. —
алиментов, гонораров, благотворительной помощи и т.д. Денежные доходы
населения подразделяются на первичные и располагаемые. Первичные
доходы населения включают все полученные поступления, а располагаемые
доходы населения — результат перераспределительных процессов. Они
рассчитываются
с
помощью
добавленных
к
первичным
доходам
социальных трансфертов и вычитания обязательных платежей и сборов.
К доходам населения относятся также средства, взятые в долг. В связи
с этим выделяют конечные и общие доходы населения. Конечные доходы
населения — это располагаемые доходы плюс чистые долги населения.
Номинальные доходы включают всю сумму конечных доходов.
Для оценки уровня и динамики доходов населения следует различать
номинальные, располагаемые и реальные доходы. Номинальные доходы
характеризуют уровень денежных доходов независимо от налогообложения
и изменения цен. Располагаемые доходы – это номинальные доходы за
вычетом
налогов
и
других
обязательных
платежей,
т.е.
средства
используемые населением на потребление и сбережение. Реальные доходы
5
характеризуют номинальные доходы с учетом изменения розничных цен и
тарифов.
В
данной
использоваться
модели
показатели
для
анализа
и
среднедушевого
прогнозирования
дохода.
будут
Среднедушевой
денежный доход определяется путем деления суммы конечных доходов (т.е.
номинальных доходов) на численность населения субъекта.
В качестве факторов, оказывающих непосредственное влияние на
величину доходов населения, можно рассматривать сами источники
формирования доходов, среди которых особо выделяют уровень заработной
платы и социальные трансферты, а также такие социально-экономические
показатели, как индекс потребительских цен, валовой региональный
продукт, численность занятых в экономике и др.
6
Глава 2. Математический аппарат
В качестве математического аппарата будет использоваться
регрессионный
анализ
-
статистический
метод
исследования
зависимости случайной величины 𝑦 от независимых факторов
𝑥𝑖 (𝑖 = 1, … , 𝑝).
Отбор факторов, влияющих на зависимую переменную, является
одним из важных моментов разработки модели.
Прежде всего, факторы проверяются на наличие линейной корреляции
между ними, признаком наличия которой является условие:
|𝑟𝑥𝑖𝑥𝑗 | ≥ 𝑟кр ,
где 𝑟кр выявленно эмпирическим путем и равняется ~0,8 − 0,9.
Существование тесной взаимосвязи между факторами приводит к
получению некачественных параметров модели. От таких факторов
избавляются методом исключения.
Не желательно вводить в модель большое количество независимых
переменных, так как это может отрицательно повлиять на выявление
закономерностей.
Различают следующие виды уравнений множественной регрессии:
линейные, нелинейные, сводящиеся к линейным, и нелинейные, не
сводящиеся к линейным (внутренне нелинейные).
Наиболее простая из моделей множественной регрессии - линейная
модель:
𝑝
𝑦 = 𝑎0 + ∑ 𝑎𝑖 𝑥𝑖 + 𝜀
𝑖=1
где 𝑎𝑖 - коэффициенты модели;
𝑦, 𝑥𝑖 - значения зависимой переменной и независимой;
7
ε - случайная ошибка регрессионной зависимости;
p - число факторных признаков.
Для оценки параметров уравнения множественной регрессии обычно
применяется метод наименьших квадратов (МНК), согласно которому
следует выбирать такие значения параметров 𝑎𝑖 , при которых сумма
квадратов отклонений фактических значений результативного признака от
теоретических значений минимальна, т. е.:
𝑆 = ∑(𝑦̂𝑖 − 𝑦𝑖 ) → 𝑚𝑖𝑛
И тогда:
𝑛
𝑆 = ∑(𝑦𝑖 − 𝑎0 − 𝑎1 𝑥1 − ⋯ − 𝑎𝑝 𝑥𝑝 ) = 𝑆(𝑎0 , 𝑎1 , … , 𝑎𝑝 )
𝑖=1
Для оценки качества полученного уравнения регрессии можно
использовать коэффициент детерминации 𝑅2 . Он показывает, какая доля
результативного признака изменяется под действием факторных признаков.
Если значение коэффициента близко к единице, то качество уравнения
регрессии высокое.
∑𝑛𝑖=1(𝑦̂𝑖 − 𝑦̅𝑖 )
𝑅 = 𝑛
∑𝑖=1(𝑦𝑖 − 𝑦̅𝑖 )
2
Оценка
статистической
значимости
уравнения
регрессии
осуществляется с помощью F-критерия Фишера:
Где n – число измерений, p – число независимых переменных.
Если оно превосходит табличное значение, то данную модель можно
использовать для анализа и прогнозирования.
8
Коэффициент множественной корреляции R – показывает, насколько
зависимая переменная тесно связана с независимыми факторами. Чем ближе
величина R к единице, тем теснее данная связь, тем лучше зависимость.
𝑅 = √𝑅 2
Также определить значимость отобранных независимых факторов
можно t-критерием Стьюдента. Для этого нужно найти значение 𝑡табл и
сравнить его со значениями t-статистики.
𝑎𝑖
𝑡𝑎𝑖 =
𝑠𝑎𝑖
Где
𝑠𝑎𝑖 − стандартная
ошибка
коэффициентов
регрессии,
определяемая как:
𝑠𝑎𝑖 = 𝑠ост |(𝑋 ′ 𝑋)−1 |𝑖𝑖 , а 𝑠ост =
∑𝑛
̂ 𝑖 −𝑦𝑖 )
𝑖=1(𝑦
(𝑛−𝑝−1)
Если 𝑡𝑎𝑖 < 𝑡табл , то фактор 𝑋𝑖 статистически не важен;
Если 𝑡𝑎𝑖 > 𝑡табл , то фактор 𝑋𝑖 значим и информативен;
Оценить степень влияние отдельных независимых факторов на
результативный признак можно при помощи коэффициентов эластичности,
β и Δ.
Частный коэффициент эластичности - показывает, на сколько %
изменится среднее значение результативного признака, если среднее
значение конкретного факторного признака изменится на 1%
𝑋̅𝑖
Э𝑖 = 𝑎𝑖 ∗
𝑌̅
β-коэффициент - показывает, на какую величину изменится среднее
квадратическое отклонение результативного признака, если среднее
квадратическое
отклонение
конкретного
изменится на 1 единицу.
𝛽𝑖 = 𝑎𝑖 ∗
𝜎𝑥𝑖
𝜎𝑦
9
факторного
признака
Δ-коэффициент - показывает удельный вес влияния конкретного
факторного признака в совместном влиянии всех факторных
признаков на результативный показатель.
𝑟𝑥𝑖𝑦
∆𝑖 = 𝛽𝑖 ∗ 2
𝑅
Проверка выполнения предпосылок МНК
Использование вычислительной процедуры по методу наименьших
квадратов с целью получения оценок коэффициентов модели предполагает
выполнение ряда условий:
независимые
переменные
представляют
собой
неслучайный набор чисел, их средние значения и дисперсии конечны;
случайные ошибки εj — имеют нулевую среднюю и
конечную дисперсию
между независимыми переменными отсутствует корреляция и
автокорреляция;
случайная
ошибка
не
коррелированна
с
независимыми
переменными;
случайная
ошибка
подчинена
распределения.
10
нормальному
закону
Глава 3. Результаты расчетов на примере статистических
данных по Санкт-Петербургу
По данным, представленным в таблице 1, изучается зависимость
средне душевого денежного дохода в мес, Y (руб.) от следующих
переменных: Х1 - среднемесячная номинальная начисленная заработная
плата (руб.), Х2 – среднемесячные назначенные пенсии (руб.), X3 –
экономически активное население (тыс. чел.), X4 – валовой региональный
продукт (млн. руб.)
Год
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
2013
2014
Y
1178,8
1838
2589,6
3468
4497
6851
8855,1
12266,1
14097,7
16876,4
17648,7
22132,6
24593,8
25994,7
27795
31407
34724
X1
1147,9
1687,3
2511,5
3695,3
5434,7
6467,5
7931,1
10133,9
13033,2
17552
22473,4
23884,4
27189,5
29522
32930
36848
40697
X2
429,4
546,9
879,8
1284
1663,5
1969
2265,4
2846,2
3302,4
4364,9
5354,6
7249,4
8824,5
9573,7
10060
10547
11470
X3
2316
2426
2417
2437
2518
2516
2553
2570
2645
2709
2704
2718
2660
2858
2896
2849
2593,1
X4
92029
150727,3
205399,1
275442,6
367198
435683
518885
666393
825102
1119660
1431840
1473348
1699486
2071757
2291993
2496549
2652050
X5
178
141,1
123,5
118,1
114,7
112,2
112,7
112
108,67
108,44
113,13
115,83
106,44
106,86
106,01
105,04
105,46
X6
10,1
10,2
6,3
3,9
3,4
4,1
2,7
2,2
2,4
2,1
2
4,1
2,7
2
1,1
1,5
1,4
Для использования методов регрессионного анализа необходимо
убедиться, что среди факторов нет линейно связанных. Иначе возникает
явление мультиколлинеарности и происходит искажение коэффициентов
регрессии. Чаще всего мультиколлинеарность является следствием того, что
независимые факторы характеризуют одно свойство изучаемого процесса
или являются частями одного признака. Для исследования выбранных
признаков
на
мультиколлинеарность
будет
использоваться
метод
корреляции. Для этого нужно построить и проанализировать матрицу
парных корреляций. Ее можно построить, используя инструмент Сервис ->
11
Анализ данных -> Корреляция в Excel. Считается, что показатели линейно
зависимы, если их парный коэффициент корреляции превосходит по
абсолютной величине 0,8
Рис. 1
Далее мультиколлинеарность устраняется путем удаления одного из
коррелирующих признаков, причем удаляется тот признак, у которого
коэффициент корреляции с результативным признаком меньше. Из данных
на рис. 1 видно, что коррелирующими факторами являются ВРП (X4), з/п
(X1) и пенсии (X2). Следовательно, оставляем фактор X3, X5, X6
Далее на закладке Данные выберем строку Анализ данных и в
качестве инструмента данных - Регрессия - ок. В открывшемся окне
Регрессии зададим Входной интервал Yи Х (рис.2,3).
Рис. 2. Окно Анализ данных
12
Рис. 3. Окно Регрессия.
Получим результаты регрессионного анализа на новом листе
Регрессия (Рис. 4)
Рис. 4. Лист Регрессия.
По данным регрессионной статистики мы получили следующие
данные:
Множественный R - это √R2, где R2 - коэффициент детерминации.
R-квадрат - это R2. В нашем примере значение R2=0,715756
свидетельствует о том, что изменения зависимой переменной Y на 71,5756%
13
можно объяснить изменениями включенных в модель объясняющих
переменных – X3,X5,X6 (экономически активное население, уровень
безработицы, ИПЦ). И на 28,4244% среднедушевые доходы зависят от
других
неучтённых
факторов.
Такое
значение
свидетельствует
об
адекватности модели.
Нормированный R-квадрат - поправленный (скорректированный по
числу степеней свободы) коэффициент детерминации.
Стандартная ошибка регрессии S=√S2, где S2=∑ (еi2/ (n-m)) необъясненная дисперсия (мера разброса зависимой переменной вокруг
линии регрессии); n - число наблюдений (в нашем случае 7), m - число
объясняющих переменных (в нашем примере равно 3).
F - расчетное значение F-критерия Фишера. Если нет табличного
значения, то для проверки значимости уравнения регрессии в целом можно
посмотреть Значимость F. На уровне значимости α=0,05 уравнение
регрессии признается значимым в целом, если Значимость F<0,05, и
незначимым, если Значимость F≥0,05. В нашем случае значимость 0,00074.
Для нашего примера имеем следующие значения:
Таблица 2
В нашем случае расчетное значение F-критерия Фишера составляет
10,912. Значимость F меньше 0,05. Таким образом, полученное уравнение в
целом значимо.
В
последней
таблице
приведены
значения
параметров
(коэффициентов) модели, их стандартные ошибки и расчетные значения tкритериев Стьюдента для оценки значимости отдельных параметров
модели.
14
Таблица 4
Анализ данной таблицы позволяет сделать вывод о том, что на уровне
значимости α=0,05 значимым оказывается лишь коэффициент при факторе
X3, так как лишь для него Р-значение меньше 0,05. Таким образом, фактор
Х5 b X6 не существенны и их включение в модель не целесообразно.
Поскольку коэффициент регрессии в экономических исследованиях имеют
четкую экономическую интерпретацию, то границы доверительного
интервала
для
коэффициента
регрессии
не
должны
содержать
противоречивых результатов, как например, - 345,8≤ b1≤ 557,96. Такого рода
запись указывает, что истинное значение коэффициента регрессии
одновременно содержит положительные и отрицательные величины и даже
ноль, чего не может быть. Это также подтверждает вывод о статистической
незначимости коэффициентов регрессии при факторах Х5 и X6. Таким
образом, целесообразно исключить несущественные факторы. Но мы
оставим эти факторы факторы, так как в случае его исключения, модель не
будет многофакторной. Поэтому мы будем иметь ввиду, что факторы Х6,Х5
малозначим
и
построим
уравнение
зависимости
Y
от
значимой
объясняющей переменной X2 и незначимых.
.
Оценим точность и адекватность полученной модели.
Согласно
проведенной
регрессионной
следующие результаты:
15
статистики
мы
видим
1. Коэффициент множественной корреляции (множественный R)
равен 0,846. Следовательно, связь между факторами весьма тесная (по
шкале Чудока)
2. Значение R2=0,7158 свидетельствует о том, что вариация зависимой
переменной Y в основном можно объяснить вариацией включенных в
модель объясняющих переменных X3, X5, X6. Это свидетельствует об
адекватности модели.
16
Отзывы:
Авторизуйтесь, чтобы оставить отзыв