О НОРМАЛЬНОСТИ ВРЕМЕННЫХ РАСПРЕДЕЛЕНИЙ КВАЗИСТАЦИОНАРНЫХ,
ЛИНЕЙНЫХ ИНДЕКСОВ В СОЦИОЛОГИИ
ON NORMALITY OF THE TIME DISTRIBUTIONS OF QUASI-STATIONARY, LINEAR
INDICES IN SOCIOLOGY
Аннотация
Заметную роль в социологии играют индексы, которые исчисляются по данным
опросов, образующих выборки с размерами порядка 1 000 - 10 000, и линейно выражаются
через доли положительных и отрицательных ответов. Примерами служат индексы
социальных настроений, потребительских настроений и ожиданий безработицы, которые
публикуются «Левада-центром», различные индексы социальных оценок от ВЦИОМ. А
также многие другие показатели в различных областях знания (экономика, медицина и т.д).
В статье выдвинута и теоретически обоснована гипотеза о том, что такие индексы
имеют нормальные законы распределения на тех промежутках времени, где индексы
являются квазистационарными. Это условие проявляет себя в том, что сезонная компонента
индекса отсутствует, а его тренд является (приблизительно) стационарным. Полученный
результат можно использовать для предварительных оценок размеров выборок при опросах,
что могло бы снизить расходы на социальный мониторинг.
Summary
In sociology a notable role is played by the indices, which are calculated according to the
surveys with samples of the sizes of the orders 1,000 - 10,000, and are linearly expressed through
the shares of positive and negative answers. Examples are the indices of social moods, consumer
moods and unemployment expectations, which are published by the “Levada Center”, social
estimates indices from the RPORC. As well as many other indicators in various areas of knowledge
(economics, medicine, etc.).
The article has put forward and theoretically substantiated the hypothesis that such indices
have normal distribution laws on those time intervals where the trends are quasi-stationary. This
condition manifests itself in the fact that the seasonal component of an index is absent, and the trend
is (approximately) stationary. The result might be used for preliminary estimates of the sample sizes
for surveys, which could reduce the cost of social monitoring.
1
Ключевые слова: Социологический индекс, индекс социальных настроений,
нормальное распределение, теорема Ляпунова, временной ряд.
Keywords: Sociological index, index of social moods, normal distribution, Gaussian
random variable, Lyapunov theorem, time series.
JEL: С12, C43, C65.
§ 1. Введение
Социологические показатели (индексы) исчисляются на основании опросов или иных
исследований членов социальных групп. Будем называть их респондентами независимо от
того, какой именно метод сбора индивидуальных данных применяется. В дальнейшем этот
метод называется опросом, хотя фактически он может быть другим.
Значения 𝑥(𝑡1 ), 𝑥(𝑡2 ), … , 𝑥(𝑡𝑚 ) некоторого социологического индекса 𝑋, исчисленные
в последовательные моменты времени 𝑡1 , 𝑡2 , … , 𝑡𝑚 , образуют т.н. временной ряд. В нем
выделяют тренд 𝑦(𝑡𝑖 ) (линию регрессии), сезонную и циклическую компоненты 𝑠(𝑡𝑖 ) и 𝑐(𝑡𝑖 ),
а также ошибку вычислений 𝑒(𝑡𝑖 ) [Крыштановский, 2000]. Пренебрегая этой ошибкой
предположим, что сезонная компонента 𝑠(𝑡𝑖 ) отсутствует или незначительна, а на
промежутке времени [𝑡1 ; 𝑡𝑚 ] тренд 𝑦(𝑡) меняется так медленно, что его можно считать
постоянным. Тогда вариация временного ряда обусловлена циклической компонентой 𝑐(𝑡𝑖 ).
Возникает естественная гипотеза о том, что индекс 𝑋 является приблизительно нормальной,
случайной величиной, хотя бы на протяжении времени от 𝑡1 до 𝑡𝑚 . В таком случае можно
было бы экстраполировать значения 𝑋 на ближайшее будущее, используя метод
доверительных интервалов, а также определить достаточные размеры предстоящих выборок.
Последнее имеет важное значение для экономии ресурсов на опросы. Одновременно
возникает возможность строго обосновать репрезентативность выборок.
.
Многие социологические индексы линейно выражаются через частоты ответов на
вопросы. Для таких индексов можно обосновать нормальный закон распределения на тех
промежутках времени, где они являются квазистационарными (§2). В сущности, это условие
сводится к тому, что за период времени [𝑡1 ; 𝑡𝑚 ] не было социальных изменений, способных
существенно повлиять на результаты опросов при исчислении индекса 𝑋. При этом опросы
должны происходить на случайных выборках, что означает равновероятность попадания в
опрос любого представителя изучаемой, социальной группы. Случайность выборок трудно
2
осуществима, поэтому в социологической практике активно применяются методы
неслучайных выборок
[Neyman, 1934:565]
В
этой
статье
теоретически
доказано,
что
квазистационарный,
линейный,
социологический индекс 𝑋 должен иметь приблизительно нормальный (т.е. гауссов) закон
распределения. Нормальные случайные величины занимают центральное место в теории
вероятностей и математической статистике [Гмурман, 2003]. Для них можно по
эмпирическим выборкам найти доверительные интервалы и получить оценки статистических
показателей, используя такие пакеты прикладных программ, как STATISTICA и SPSS.
Результат настоящей статьи в какой-то мере отвергает точку зрения о том, что
нормальные распределения не находят места в социологии. Согласно [Давыдов, 1995]:
«Опыт автора по анализу результатов опросов общественного мнения в Институте
социологии РАН за 1985—1989 гг. показывает, что нормальное распределение встречается
довольно редко». В [Ильясов, 2014] утверждается: «Не удалось найти аргументов,
обосновывающих
гипотезу
о
том,
почему
определенный
вид
социологического
распределения должен (может) подчиняться нормальному распределению». И далее.
«Понятно, что какие-то эмпирические распределения могут иметь вид, близкий к
нормальному, но это может происходить не в силу закономерности, а вследствие
вариативности распределений, т.е. по совпадению. Таким образом, можно предположить, что
идея нормального распределения в социологии не обоснована».
По-видимому, сказанное выше относится к распределениям значений показателей среди членов
социальных групп. Нормальные распределения, о которых идет речь в этой статье, возникают в связи
с временными рядами индексов социологии. В [Ильясов, 2014] сказано следующее. «Временные
ряды, как представляется, некорректно соотносить с законами Гаусса или Ципфа. ... Тем не
менее проблема соотношения нормального распределения с временными рядами
обсуждается». Результат настоящей статьи непосредственно касается этой проблемы.
Представленный результат получен из классической теоремы Ляпунова [Ляпунов, 1948:
245], согласно которой величину 𝑋 можно считать нормальной, если она складывается из
большого числа взаимно независимых, случайных величин, каждая из которых значительно
меньше 𝑋. Использованы методы теории вероятностей [Гмурман, 2003; Вентцель, 1962].
3
§ 2. Линейные социологические индексы
Пусть проводится опрос в социальной группе, при этом членам выборки размера 𝑛
задают по 𝑄 вопросов, на каждый из которых можно дать один из предлагаемых ответов.
Пронумеруем респондентов 𝑖 = 1, … , 𝑛, вопросы 𝑞 = 1, … , 𝑄, ответы 𝑟 = 1, … , 𝑅𝑞 (число
ответов на вопрос № 𝑞 в общем зависит от 𝑞). Обозначим 𝑆𝑞𝑟 долю ответов № 𝑟 на вопрос
№ 𝑞, выраженную в % от общего числа полученных ответов, где 𝑟 ∈ {1, … , 𝑅𝑞 }. Пусть
некоторый индекс 𝑋, связанный с этим опросом, выражается формулой:
𝑄
𝑅𝑞
𝑋 = 𝐴 + ∑ ∑ 𝐾𝑞𝑟 𝑆𝑞𝑟
(1)
𝑞=1 𝑟=1
Постоянные 𝐾𝑞𝑟 и 𝐴 определяются при разработке показателя. Такие индексы 𝑋 мы будем
называть линейными.
Примером служит индекс социальных настроений (ИСН1), который ежемесячно
публикуется «Левада-Центром». Респондентам из выборки размером 𝑛 = 1600 предлагается
по 𝑄 = 12 вопросов, на каждый из которых нужно дать один из нескольких, заданных
ответов. ИСН вычисляется, как разность между долями положительных и отрицательных
ответов, выраженными в % от общего числа ответов, к которой прибавляют 100 для
исключения отрицательных значений. Таким образом, если 𝑋 есть ИСН, то 𝐴 = 100, для
положительных ответов 𝐾𝑞𝑟 = 1, для отрицательных 𝐾𝑞𝑟 = −1, для нейтральных 𝐾𝑞𝑟 = 0.
Аналогично выражаются индекс потребительских настроений (ИПН), индекс ожидания
безработицы (ИБ) от «Левада-Центра», индексы социальных оценок от ВЦИОМ (где 𝐴 = 0).
Чтобы принять во внимание разницу между ответами по важности или степени
уверенности респондентов, можно присвоить ответам на вопрос № 𝑞 уровни значимости
𝑙𝑞1 , … , 𝑙𝑞𝑃𝑞 , где 𝑃𝑞 – число вариантов положительных ответов, которое равно числу вариантов
отрицательных ответов, 𝑞 = 1, … , 𝑄. Уровни значимости определяются интуитивно методом экспертного оценивания, обычно по шкале баллов от 1 до 5 или от 1 до 10, хотя
возможны и другие шкалы. Для такого дифференцированного, социального индекса формула
(1) приобретает следующий вид:
1
Официальный сайт
sotsialnykh-nastroenii-isn/
«Левада-Центра»
https://www.levada.ru/obnovlennaya-metodika-izmereniya-indeksa-
4
𝑄
𝑃𝑞
+
−
𝑋 = 𝐴 + ∑ ∑ 𝑤𝑞𝑠 ∙ (𝑆𝑞𝑠
− 𝑆𝑞𝑠
)
𝑤𝑞𝑠 =
𝑞=1 𝑠=1
𝑙𝑞𝑠 𝑃𝑞
𝑙𝑞1 + ⋯ + 𝑙𝑞𝑃𝑞
(2)
+
−
где 𝑆𝑞𝑠
и 𝑆𝑞𝑠
есть доли положительных и отрицательных ответов на вопрос № 𝑞, имеющих
номер 𝑠 и общий уровень значимости 𝑙𝑞𝑠 . Как положительные, так и отрицательные ответы
пронумерованы от 1 до 𝑃𝑞 , нейтральные ответы не принимаются в расчет (𝑅𝑞 = 2𝑃𝑞 + 1).
𝑃
𝑞
При каждом 𝑞 весовые коэффициенты 𝑤𝑞𝑠 пропорциональны 𝑙𝑞𝑠 , где ∑𝑠=1
𝑤𝑞𝑠 = 𝑃𝑞 .
Если 𝑙𝑞1 = ⋯ = 𝑙𝑞𝑃𝑞 для каждого 𝑞, т.е., все ответы на один вопрос равнозначны (кроме
нейтральных), то 𝑤𝑞𝑠 = 1 и формула (2) сводится к следующей:
𝑄
𝑄
𝑄
𝑋 = 𝐴 + ∑(𝑆𝑞+ − 𝑆𝑞− ) = 𝐴 + ∑ 𝑆𝑞+ − ∑ 𝑆𝑞−
𝑞=1
𝑞=1
(3)
𝑞=1
где 𝑆𝑞± - доли положительных и отрицательных ответов на вопрос № 𝑞, выраженные в % от
+
+
−
−
числа всех ответов: 𝑆𝑞+ = 𝑆𝑞1
+…+𝑆𝑞𝑃
и 𝑆𝑞− = 𝑆𝑞1
+…+𝑆𝑞𝑃
.
𝑞
𝑞
Формула (3) отвечает ИСН, ИПН и ИБ от «Левада-Центра», индексам социальных
оценок от ВЦИОМ и другим показателям.
Формула (1) может выражать не только социологические индексы. Например, в
[Дуганов, 2011] описан показатель уровня преждевременной смертности от болезней
(ПГПЖ). Здесь 𝑄 = 1 и параметр 𝑅1 на 1 больше т.н. базового возраста, все смерти раньше
достижения которого считаются преждевременными, 𝑆1𝑟 равно доле случаев смерти в
возрасте 𝑟 − 1 лет в % от числа 𝑁 умерших преждевременно, 𝐴 = 0 и 𝐾1𝑟 = 𝑁 ∙ (𝑅1 − 𝑟)⁄100.
Другой пример связан с композитным индексом 𝐼 материального благоcостояния,
описанным в [Балацкий, Саакянц, 2006]. Он вычисляется по формуле (1) при 𝑄 = 1 и 𝑅1 =
5, где 𝑆1𝑟 равно доле в % респондентов, относящих себя к 𝑟 – й группе благосостояния
(определенной в таблице 1 [Балацкий, Саакянц, 2006]), 𝐴 = 0, весовые коэффициенты 𝐾11 =
0 𝐾12 = 0,25 𝐾13 = 0,5 𝐾14 = 0,75 𝐾15 = 1.
Примером социологического показателя, не выражаемого формулой (1), является
индекс Джини [Балацкий, Саакянц; 2006], характеризующий материальное неравенство.
Рассмотрим произвольный индекс 𝑋, определяемый формулой (1). Пусть он
вычисляется в последовательные моменты времени 𝑡1 , 𝑡2 , … , 𝑡𝑚 . Для определенности будем
считать, что респонденты нумеруются в порядке занесения ответов в базу данных службы
5
𝑖
социального мониторинга. Введем случайную величину 𝑋𝑞𝑟
, которая зависит от ответа
респондента № 𝑖 на вопрос № 𝑞. Пусть она равна 1, если дан ответ № 𝑟, и равна нулю при
любом другом ответе. Тогда из (1) следует, что
𝑄
𝑅𝑞
𝑄
𝑖
∑𝑛𝑖=1 𝑋𝑞𝑟
∑𝑛𝑖=1 𝑋𝑖
𝑋 = 𝐴 + ∑ ∑ 𝐾𝑞𝑟 ∙
∙ 100 = 𝐴 + 100 ∙
𝑛𝑄
𝑛
𝑅𝑞
1
𝑖
𝑋𝑖 = ∑ ∑ 𝐾𝑞𝑟 𝑋𝑞𝑟
𝑄
𝑞=1 𝑟=1
(4)
𝑞=1 𝑟=1
где 𝑛𝑄 есть общее число полученных ответов.
Умозаключение о (приблизительной) нормальности индекса 𝑋 основано на том, что все
случайные величины 𝑋𝑖 ⁄𝑛 независимы между собой и |𝑋𝑖 ⁄𝑛| ≪ |𝑋|, т.к. 𝑛 ≫ 1. Поэтому
величина 𝑌 = ∑𝑛𝑖=1 𝑋𝑖 ⁄𝑛 имеет близкое к гауссову распределение [Гмурман, 2003: 135], а
линейная функция 𝑋 = 100 ∙ 𝑌 + 𝐴 от нормальной величины 𝑌 также является нормальной
[Гмурман, 2003: 141]. Мы должны еще показать, что при всех 𝑖 ≠ 𝑗 случайные величины
𝑋(𝑡𝑖 ) и 𝑋(𝑡𝑗 ) независимы между собой и имеют близкие законы распределения, которые
можно считать совпадающими.
Каждая величина 𝑋𝑖 представляет собой результат «измерения», т.е., определения в
результате опроса респондента № 𝑖 значения одной и той же, случайной величины
𝑄
𝑅𝑞
1
𝜒 = ∑ ∑ 𝐾𝑞𝑟 𝑥𝑞𝑟
𝑄
(5)
𝑞=1 𝑟=1
где 𝑥𝑞𝑟 = 1, если на вопрос № 𝑞 был дан ответ № 𝑟, а при других ответах 𝑥𝑞𝑟 = 0.
Линейный, социологический индекс 𝑋 называется квазистационарным на данном
промежутке времени, если закон распределения случайной величины 𝜒 является
неизменным или меняется за это время незначительно. В таком случае можно считать, что
случайные величины
𝜒(𝑡1 ), … , 𝜒(𝑡𝑚 ) имеют общий закон распределения или, другими
словами, случайная величина 𝜒 не зависит от времени (это справедливо лишь в некотором,
практически достаточном приближении на определенном промежутке времени).
Тогда, как видно из (4) и (5), индекс 𝑋 является случайной величиной, которая также не
зависит от времени. Предположим, что респонденты нумеруются индексом 𝑖, который
изменяется от 1 до бесконечности. Ни одна реальная, социальная группа не состоит из
бесконечного числа членов. Но если она достаточно велика, то такая идеализация не
приведет к существенной ошибке. Рассмотрим последовательность величин 𝑌𝑛 = ∑𝑛𝑖=1 𝑋𝑖 ⁄𝑛,
где 𝑛 = 1,2, … и 𝑋𝑖 есть результат измерения показателя 𝜒 для 𝑖 – го респондента. Каждая 𝑋𝑖
есть случайная величина, поскольку респонденты выбираются случайным образом. Согласно
следствию из теоремы [Ляпунов 1948: 245], при 𝑛 → ∞ закон распределения величины
𝑌𝑛 неограниченно приближается к нормальному.
6
Условия теоремы Ляпунова также требуют, чтобы для некоторого 𝛿 > 0 математическое
ожидание величины |𝜒 − 𝑀(𝜒)|2+𝛿 было конечным [Ляпунов 1948: 245]. В данном случае
это верно для всех 𝛿 > 0, т.к. из (5) следует, что полученное при любом измерении значение
𝑅
𝑞
𝑥 величины 𝜒 удовлетворяет неравенству |𝑥| < ∑𝑄𝑞=1 ∑𝑟=1
|𝐾𝑞𝑟 |⁄𝑄 . Следовательно, величина
|𝜒 − 𝑀(𝜒)|2+𝛿 является ограниченной при любом 𝛿 > 0. Поэтому ее математическое
ожидание конечно. Такие образом, условия теоремы Ляпунова выполняются.
Теоретически обоснована гипотеза о том, что любой социологический индекс 𝑋,
определяемый формулой (1), должен иметь приблизительно нормальные распределения на
тех промежутках времени, где его можно считать квазистационарным.
Для проверки последнего условия нужна статистическая выборка значений величины 𝜒 (5) в
различные моменты времени для достаточно большого числа респондентов. Размер этой
выборки может быть сопоставимым с опросом при исчислении индекса 𝑋 (учитывая, что
необходимо получить значения 𝜒 в различных регионах страны). Поэтому о выполнении
условия квазистационарности следует судить по косвенным признакам, описанным в § 1.
Зависимость индекса 𝑋 от времени определяет случайный процесс 𝑋(𝑡), который для
случайных выборок респондентов должен иметь нулевую автокорреляционную функцию.
Последнее означает, что при всех 𝑡𝑖 ≠ 𝑡𝑗 коэффициент корреляции случайных величин 𝑋(𝑡𝑖 )
и 𝑋(𝑡𝑗 ) равен нулю. Если же в каждый момент 𝑡𝑖 респонденты выбираются не случайно (а из
одной и той же, узкой группы), то автокорреляционная функция 𝑋(𝑡) будет существенно
отличной от нуля. Поэтому 𝑥(𝑡1 ), … , 𝑥(𝑡𝑚 ) нельзя рассматривать, как выборку значений
одной и той же, случайной величины 𝑋, полученных в результате 𝑚 независимых измерений.
Если при этом 𝑋 выражается формулой (1), то функция 𝑋(𝑡) − 𝐴 разлагается в сумму
𝑖
случайных процессов 100 ∙ 𝐾𝑞𝑟 𝑋𝑞𝑟
(𝑡)⁄(𝑛𝑄), каждый из которых связан с одним и тем же
респондентом № 𝑖 (4). Вывод об эргодичности случайного процесса делают только при
уверенности в том, что он не разлагается в сумму нескольких процессов [Вентцель, 1962:
451]. Поэтому процесс 𝑋(𝑡) нельзя считать эргодическим. Так мы снова приходим к
заключению о последовательности 𝑥(𝑡1 ), … , 𝑥(𝑡𝑚 ), которое было сформулировано выше.
Таким образом, если при исчислении социологического индекса периодически
опрашиваются одни и те же респонденты, то постановка вопроса о нормальности временного
распределения этого индекса не имеет смысла.
7
Динамика ИСН
120
100
80
60
40
20
янв.19
июл.19
янв.18
июл.18
янв.17
июл.17
янв.16
июл.16
янв.15
июл.15
янв.14
июл.14
янв.13
июл.13
янв.12
июл.12
янв.11
июл.11
янв.10
июл.10
янв.09
июл.09
янв.08
июл.08
янв.07
июл.07
янв.06
июл.06
янв.05
июл.05
янв.04
июл.04
янв.03
июл.03
янв.02
июл.02
янв.01
июл.01
янв.00
июл.00
янв.99
июл.99
янв.98
июл.98
янв.97
июл.97
янв.96
июл.96
янв.95
июл.95
0
Рис. 1. Значения ИСН в % от показателя марта 2008 с января 1995 по август 2019.
§ 𝟒. Индекс социальных настроений
Используя данные, опубликованные на сайте «Левада-Центра» 2, проверим гипотезу о
нормальности индекса социальных настроений (ИСН) на промежутке времени с марта 2009
по август 2019. Абсолютные значения на сайте не указаны, но даны индексы семьи, России,
ожиданий
и
власти
за
каждые
2
месяца.
Значения
ИСН
вычислены,
как
среднеарифметические этих 4-х индексов, округленные до целых. Получен ряд чисел от 101
до 128, за исключением 103, 121 и 123. Сезонная компонента на рис. 1 не усматривается
(локальные максимумы и минимумы приходятся как на летние, так и на зимние месяцы).
Гистограмма производит впечатление, что с марта 2009 по август 2019 ИСН был
квазистационарным (§ 1). Это соответствует официальной точке зрения о том, что за первое
десятилетие XXI века Россия достигла стабильного, социально-экономического состояния.
Однако, квадратичный тренд данного временного ряда, построенный в пакете STATISTICA,
снижается на 22 % (Рис. 2).
2
См. ссылку № 1.
8
Рис. 2. Квадратичный тренд временного ряда ИСН с марта 2009 по август 2019.
Между отметками 0 и 40 снижение тренда близко к 6 %, поэтому будем считать, что
ИСН - квазистационарный. Согласно представленному выше результату, индекс должен
иметь (приблизительно) нормальное распределение. Проверим это с помощью теста
Шапиро-Уилка (для применения теста Колмогорова-Смирнова число измерений должно
быть не меньше 60, а в данном случае их 40). Получим критическую вероятность 𝑝 = 0,268,
что дает основание не отвергать гипотезу нормальности (𝑝 > 0,05).
§ 5. Заключение.
В статье теоретически обоснована гипотеза о том, что социологические индексы,
исчисляемые по формулам вида (1), должны иметь (приблизительно) нормальные законы
распределения на тех промежутках времени, где эти индексы квазистационарны. Условие
квазистационарности означает следующее.
1) каждый опрос, по результатам которого вычисляются значения индекса, проводится
среди респондентов, выбираемых случайно в соответствующей, социальной группе;
2) случайная величина (5), определяемая ответами случайного респондента, является
приблизительно стационарной (т.е. не зависящей от времени).
Надежно проверить условие (2) непросто, поэтому о его справедливости можно судить
косвенно - по значениям временного ряда, отвечающего индексу. В квазистационарном
случае сезонная компонента ряда отсутствует или незначительна, а тренд меняется на данном
промежутке времени так, что его можно считать постоянным.
9
Одно из практических приложений факта нормальности распределения состоит в том,
что возникает возможность экстраполировать доступную статистику значений этого индекса
или детализировать ее для более частых отметок дат. Например, «Левада-центр» публикует
статистику индекса социальных настроений (ИСН) с частотой 2 месяца, начиная с 1995 года.
Если на каком-то промежутке времени ИСН был квазистационарным, то знание
(нормального) закона распределения соответствующей, случайной величины позволяет
моделировать значения ИСН на этом промежутке времени с частотой, скажем, 1 неделя. Или
экстраполировать ИСН на будущий период в предположении, что значительных социальных
изменений за это время не произойдет.
После надежной, эмпирической проверки результат настоящей статьи может оказаться
полезным для анализа методик исчисления социологических индексов, а также
использоваться для предварительных оценок размеров выборок при опросах, что могло бы
снизить расходы на социальный мониторинг.
В обзоре истории выборочных исследований в США Франкель и Франкель [Frankel and
Frankel, 1987, p. 129] писали: «После 1948 года споры сторонников квотной и случайной
выборки закончились, и случайная выборка стала для США предпочтительным методом».
. Тем не менее, как уже было отмечено рабочей группой Американской ассоциации
исследователей общественного мнения по вопросам онлайн-панелей (AAPOR Task Force on
Online Panels), такого рода опросы несомненно представляют ценность для некоторых видов
исследований, но исследователям «следует избегать опт-ин-панелей с неслучайным методом
отбора респондентов, когда основная задача заключается в точной оценке характеристик
всей генеральной совокупности <…> при использовании таких источников для выборки
следует избегать претензии на „репрезентативность“».
«Мы считаем, что методы сбора данных и расчёта показателей, не имеющие под собой
теоретической осно вы, не подходят для получения статистических выводов. Конформная
выборка является одним из таких методов. В докладе мы не будем говорить о конформной
выборке именно по этой причине – из-за отсутствия теории, но для полноты картины ниже
коротко её опишем.»
Список литературы
AAPOR (Американская ассоциация исследователей общественного мнения). Отчёт рабочей
группы AAPOR о неслучайных выборках: июнь 2013. Перевод с англ. Рогозина Д.М.,
10
Ипатовой. А. Москва: Общероссийский общественный фонд «Общественное мнение».
2016.
Балацкий Е.В., Саакянц К.М. Индексы социального неравенства // Мониторинг
общественного мнения. 2006. № 2. C. 122-128.
Вентцель Е.С. Теория вероятностей: учебное пособие для вузов. Москва: «ФизматГИЗ»,
1962.
Гмурман В.Е. Теория вероятностей и математическая статистика: учебное пособие для
вузов. Москва: Высшая школа, 2003.
Давыдов А.А. Анализ одномерных частотных распределений в социологии: эволюция
подходов // Социологические исследования. 1995. № 5. С. 113-116.
Дуганов М.Д., Калашников К.Н. Методологические подходы к оценке эффективности
регионального здравоохранения // Экономические и социальные перемены: факты,
тенденции, прогноз. 2011. № 6. C. 93-105.
Ильясов Ф.Н. Типы шкал и распределений в социологии. // Мониторинг общественного
мнения. 2014. № 4. С. 24-40.
Крыштановский А. О. Методы анализа временных рядов // Мониторинг общественного
мнения : экономические и социальные перемены. 2000. № 2. С. 44-51.
Ляпунов А.М. Избранные труды. Москва: Издательство АН СССР. 1948.
Neyman, J. On the Two Different Aspects of the Representative Method: The Method of Stratified
Sampling and the Method of Purposive Selection // Journal of the Royal Statistical Society. 1934.
№ 97. P. 558–625.
References
Baker R., Brick J.M., Bates N.A., Battaglia M., Couper M.P., Dever J.A., Gile K.J., Tourangeau R.
Summary Report of the AAPOR Task Force on Non-probability Sampling // Journal of Survey
Statistics and Methodology. 2013. V. 1, № 2. P. 90–143.
Balatskii E.V., Saakyants K.M. Indices of Social Inequality // Public opinion monitoring. 2006. №
2. C. 122- 128. (In Russian)
Gmurman V.E. Probability Theory and Mathematical Statistics: Textbook. manual for universities.
M.: Higher school. 2003. (In Russian)
11
Davidov A.A. Analysis of one-dimensional frequency distributions in sociology: the evolution of
approaches // Sociological Studies. 1995. № 5. P. 113-116. (In Russian)
Duganov M.D., Kalashnikov K.N. Methodological approaches to assessing the effectiveness of
regional health care // Economic and social changes: facts, trends, forecast. 2011. № 6, P. 93-105.
(In Russian)
Iliassov F.N. Types of scales and analysis of distributions in sociology // Public opinion monitoring.
2014. № 4. P. 24-40. (In Russian)
Kryshtanovskii A.O. Methods of analysis of time series // Public opinion monitoring. 2000. № 2.
P. 44-51. (In Russian)
Lyapunov A.M. Selected Works, M: Publishing House of the Academy of Sciences of the USSR,
1948. (In Russian)
Neyman, J. On the Two Different Aspects of the Representative Method: The Method of Stratified
Sampling and the Method of Purposive Selection // Journal of the Royal Statistical Society. 1934.
№ 97. P. 558–625.
Wentzel E.S., Probability Theory: textbook for universities. M .: "FizmatGIZ", 1962. (In Russian).
12
Отзывы:
Авторизуйтесь, чтобы оставить отзыв