Сохрани и опубликуйсвоё исследование
О проекте | Cоглашение | Партнёры
В работе рассматривается один из способов оптимизации объёма выборки в маркетинговом исследовании на основе критерия согласия Пирсона.
Источник: Санкт-Петербургский государственный университет
Комментировать 0
Рецензировать 0
Скачать - 885389 bytes
Enter the password to open this PDF file:
-
САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ Кафедра «Теории управления» Яковенко Максим Сергеевич Магистерская диссертация Оптимизация объема выборки в маркетинговых исследованиях Направление 01.04.02 Прикладная математика и информатика Методы прикладной математики и информатики в задачах управления Научный руководитель, доктор физ.-мат. наук, профессор Захаров Виктор Васильевич Рецензент, доктор экономических наук, профессор НИУ Высшая школа экономики СПб Лукинский Владислав Валерьевич Санкт-Петербург 2016
Содержание Введение ............................................................................................................... 3 Цели и задачи исследования ................................................................................ 5 Классы рассматриваемых задач .......................................................................... 5 Обзор литературы ................................................................................................ 6 Глава 1 . Определение объѐма выборки на основании гипотезы, что две выборки подчиняются одному закону распределения…….……9 1.1. Постановка задачи………………………………………………..…..9 1.2.Способы выбора элементов для удаления…………………….……11 1.3.Дополнительные ограничения………………………………………12 Глава 2: Определение минимального объѐма выборки……..……..14 2.1. Нахождение минимального количества элементов……..…………14 2.2.Алгоритм приближения по значениям в каждом из интервалов......16 2.3. Насыщенность выборки………………..……...……………………..18 2.4. Вычисления………………...…………………………………………19 2.5. Оценка алгоритма ………………………………………..………..…24 2.6. Применение алгоритма для других классов задач…………..……..26 Выводы ............................................................................................................... 27 Заключение ......................................................................................................... 28 Список литературы ........................................................................................... 29 Приложения ....................................................................................................... 32 2
Введение В качестве введения стоит дать несколько основных определений, которые будут использоваться в дальнейшем. Маркетинг – вид человеческой деятельности, направленной на удовлетворение нужд и потребностей посредством обмена [1] Маркетинговое исследование – это систематический поиск, сбор, анализ и представление данных и сведений, относящихся к конкретной рыночной ситуации, с которой пришлось столкнуться предприятию.[1] Любое маркетинговое исследование преследует одну или несколько целей. В связи с этим можно подразделить их на несколько групп: 1. Поисковые цели — поиск информации, предназначенный для получения представления о структуре проблемы; 2. Описательные цели — описание интересующих событий и факторов, оказывающих на них влияние; 3. Каузальные цели — поиск ответа на вопрос: «есть ли некая причинно-следственная связь между событиями?»; 4. Тестовые цели — определение предположительных вариантов развития и оценка принятых решений; 5. Прогнозные цели — построение прогноза события. По существу, цели исследования можно сформулировать с помощью пяти основных вопросов: «кто?»,«что?»,«когда?»,«где?» и «как?» вместе с сопутствующим им вопросом «почему?», который связывает исследование с социологией и психологией. Генеральная совокупность —вся изучаемая выборочным методом статистическая совокупность объектов и/или явлений обществ, жизни (единиц 3
отбора), имеющих общие качественные признаки или количественные переменные. [2] Выборка – это некоторое количество элементов, которое используется в наблюдении/эксперименте. В силу того, что маркетинговое исследование предоставляет ценную и важную информацию для принятия решений предприятия о выпуске новой продукции или изменении характеристик уже существующей, оно должно обладать несколькими обязательными свойствами: 1. Репрезентативность выборки–свойство выборки, заключающееся в ее способности адекватно представлять состояние дел в генеральной совокупности.[2]Пример: В качестве опроса были выбраны все жители Санкт-Петербурга. Так как в Санкт-Петербурге процент женщин приблизительно равен 55%, а мужчин 45% по последней переписи населения, то, соответственно, такая же пропорция должна сохраниться и в исследовании. 2. Определение погрешности полученной информации. В силу того, что опросить каждого объекта (человека/клиента/покупателя),как правило, не представляется возможным, то в исследовании участвует лишь их часть. В некоторых случаях необходимо также оценивать достоверность полученных данных. В маркетинговом исследовании, как и в любом другом бизнесе, есть затраты. К ним относятся время, затраченное на получение одной единицы информации (опроса одного человека), и денежное вознаграждение. Соответственно, чем больше данных необходимо получить для удовлетворения целей исследования, тем больше ресурсов необходимо затратить. Таким образом, определение объема выборки является одной из приоритетных задач маркетинговых исследований. 4
Общую задачу определения объѐма выборки можно сформулировать как определение минимальногонеобходимого количества данных в конкретном исследовании. Далее будет сформулирована математическая постановка задачи. Цели и задачи исследования: 1. Рассмотреть классы возможных задач связанных с оптимизацией выборки; 2. Исследовать возможность уменьшения объема выборки маркетингового исследования; 3. Произвести вычисления на примере реального маркетингового исследования. Классы рассматриваемых задач 1. Маркетинговые исследования; 2. Оценка брака на заводе; 3. Оценка качества лесных угодий/сельскохозяйственных посевов; 4. Определения минимального количества показаний (температура, влажность, скорость ветра) региона, достаточногодля дальнейшего статистического исследования и удовлетворяющего необходимому наперед заданному уровню доверия. Обзор литературы Минимизация объѐма выборки является одним из основных направлений в маркетинговых исследованиях, так как позволяет уменьшить 5
затраты на проведение опросов, сохраняя при этом необходимую точность.Данная тематика включает широкий спектр вопросов. Одним из основных двигателей этого направления в настоящее время является Орлов Ю.Н[3][4]. В его работах рассматриваются вопросы оценки и прогнозирования, связанные с нестационарными временными рядами. Приведены примеры из фондовой и валютной бирж. Втом числе рассмотрен ряд задач, связанных с оцениванием уровня хаоса в выборке, что позволяет определить моменты, когда в выборку были внесены какие-либо изменения, и на их основании сделать соответствующие выводы. Оцениванию выборки и ее оптимизации посвящена работа Чичагова В. В.[5], в которой он сравнивает методы оценки выборки, такие как несмещенная оценка и оценка максимального правдоподобия. Продолжая анализировать выборки, О.А. Бакаева [6] выводит в своих работах формулы минимального объема выборки для различных типов выборок. Необычный метод сравнения выборок встречается в работе Мотренко А. П.[7],в которой автор рассматривает уменьшение объема выборки на основании сравнения гистограмм двух выборок и использования расстояния Кульбака-Лейблера. Тематика минимизации объема выборки также была поднята в работах преподавателей и студентов СПБГУ. Примером тому может служить работа Крамаренко Е. Ю.[8]. Фактически маркетинговое исследование является частью более общего вопроса, а именно «социального исследования» или «социального опроса». Если рассматривать данную тематику, то обязательно придется столкнуться с таким понятием, как корректировка выборочных данных. Этот вопрос подробно освещен в работах Орехова О.В. [9] 6
Применение: В настоящее время задача оценивания объема выборки имеет несколько вариаций и применима в различных сферах жизни, таких как: 1.Маркетинговые исследования. Одним из примеров исследований в этой области является работа OndřejVilikus[10], где автор рассматривает, как одну из важнейших частей исследования, формирование шаблона для опроса респондентов, который включает в себя параметры сложности анкеты и сложности каждого из вопросов в анкете. На основании этих данных делается вывод о необходимом объеме выборки респондентов.Также в работе рассматривается случай, когда респондент не смог выбрать в каком-то из вопросов ни одного варианта ответа. Некоторые из авторов заостряют своѐ внимание на стратифицированном(многослойном) исследовании. Так в работе [11] предполагается разбиение генеральной совокупности на некоторое количество страт (слоев) с коэффициентом значимости каждой из них и минимизации линейного критерия оценки стоимости. Делается вывод о том, что линейный критерий оценки стоимости является наиболее оптимальным для большинства стратифицированных исследований.Продолжая анализ стратифицированных исследований в работе [12], приводятся примеры двух методов для оценивания каждой из страт. При допущении фиксированной стоимости с заданным числом слоев и размеров выборок. 2.Изучение лесного покрова. Так ChristopheCoronaс коллегамирассматривают в работе [13] оптимизацию объема выборки применительно к изучению лесного покрова конкретной территории, а также вводят параметр шума-погрешности вычислений. Балансируя между значениями объема выборки и шума, они делают вывод о необходимом количестве деревьев в исследовании. 7
3. Сфера IT. Задача определения объема обучающей выборки машинного обучения рассмотрена в работе RichardH. Byrd[14]. Где также предложен метод увеличения выборки по отношению к методу Ньютона, основываясь на вычислении периодического градиента. 4. Страхование. Рассмотрено в работе [15],где авторы, используя Bootstrapping и линейный критерий оптимизации расходов компании, приходят к выводу, что цена ошибок оператора зачастую обходится компании слишком дорого, особенно с учетом параметра того, что само исследование стоит немалых денег. Кроме того, в работе даются оценочные значения для объема выборки. 5. Медицинские исследования. Хорошим примером в данном направлении является работа JohnM. Castelloe[16]. В данной задаче объем выборки невозможно рассматривать отдельно от корреляции влияния препарата на параметры пациента. Соответственно, чем выше влияние какого-либо препарата, тем меньшее количество респондентов необходимо для изучения. Приведены расчеты и формулы оценивания объема выборки. 6. Климатология. В работе [17] изложен вопрос оценки и построения прогноза в выборке одинаково распределенных случайных величин, где заданы лишь количества измерений и их критические значения. Вопрос может быть актуален для геологии, гидрологии. Также в статье приведены 2 метода для оценки оптимального объема выборки. Также есть фундаментальные наработки. В частности в работе A.Andropov[18] излагает метод нахождения объема выборки для сложной функции, включающей параллельное и последовательное соединение, путем разделения сложной функции на более простые с помощью дерева решений и нахождения оптимальных значений 8 на его ветвях.
Глава 1 . Определение объѐма выборки на основании гипотезы, что две выборки подчиняются одному закону распределения 1.1. Постановка задачи: Предположим, что после проведения маркетингового исследования, есть необходимость проведения повторного сбора информации. Можно ли использовать для такого исследования меньший объѐм данных? Имея выборку X состоящую из N элементов X={ }, требуется определить минимальное количество элементов в выборке, при котором с наперед заданным уровнем значимости α сохраняется распределение начальной выборки. Для этого необходимо определить критерий сравнения. Так как выборка задана качественными (номинальными) параметрами (хорошо, средне, плохо/наименования товаров и т.д.), то имеет смысл использовать критерий Пирсона [20]. Пусть - заданная начальная выборка - выборка, полученная после удаления из нее части элементов Требуется проверить, подчиняются ли выборки одному закону распределения: Гипотеза : две выборки подчиняются одному и тому же закону распределения на уровне. Гипотеза : выборки распределения 9 подчиняются разным законам
Критерий проверки гипотез : (1) Где – значение критерия согласия, полученное по формуле (1) Где и являются частотами попадания в i-й интервал для начального и эмпирического распределений. – значение критерия согласия, полученное по формуле (1) Введенная ранее величина тоже будет случайной величиной в силу случайности выборки X и потому подчиняющаяся распределению Суть критерия: сравнение и , где . задана c - степенями свободы и уровнем значимости α. Где m-количество интервалов в интервальном ряде. Гипотеза принимается верной на уровне значимости α, если > . Будем называть выборки согласованными, если выполняется условие: > . Примечание: К недостаткам критерия Пирсона относится потеря части первоначальной информации при малом количестве наблюдений в интервалах, что приводит к необходимостиобъединения интервалов с малым числом наблюдений или исключению таковых. 10
В связи с этим, как правило, требуют, чтобы в каждом из интервалов было не менее 5 элементов. 1.2.Один из способов определения количества элементов в выборке Есть разные способы выбирать элементы из выборки. Воспользуемся для начала алгоритмом, подробно рассмотренным в работе Крамаренко[8]: Имеем начальную выборку, состоящую из N элементов. Генерируем из нее N выборок из N-1 элементов путем последовательного удаления из начальной выборки по одному элементу. Выбираем случайную выборку из образованных таким способом и проверяем ее согласованность с начальной выборкой из N элементов. Если они согласованы, тогда считаем порожденную матрицу «основной» и путем убираем из нее еще 1 элемент, получаем N-1 выборку из N-2 элементов. Вновь выбираем случайную из порожденных выборок и проверяем на согласованность с начальной (состоящей из N-элементов).Если выборки оказались согласованность не другую согласованными, то из выборок порожденных стоит проверить на этом на шаге. Продолжаем до тех пор, пока выборки не окажутся несогласованными. В таком случае, мы нашли искомое n-минимальный объем выборки. Так как этот процесс может привести к нескольким различным ответам (в силу случайности исключения элементов), то необходимо проделать все действия несколько раз и посчитать среднее значение между полученными объемами выборки. 11
1.3.Дополнительные ограничения: Рассмотрим выражение а именно составляющую, отвечающую за согласованность в -м интервале распишем более детально Или иначе Где Стоит отметить очевидное ограничение: , так как в противном случае деление на 0- а, значит в каждом из -х интервалов должно оставаться минимум по одному значению. 12
Если рассматривать минимальное значение=0 при отдельный -й промежуток, то ясно, что , что возможно в 2х случаях: 1) мы не удаляли ни одного значения в данном интервале или же 2) при . Т.е. при удалении элементов из других интервалов случилась ситуация, когда частота попадания в данный интервал стала равна вероятности попадания в данный интервал значений из начальной выборки. И максимальное значение при , и min(или иначе ). Такое возможно, в случае, когда мы удаляли элементы исключительно из данного интервала. Тогда для всех интервалов выполнено 13
Глава 2: Определение минимального объѐма выборки. 2.1.Нахождение минимального количества элементов В описанном выше алгоритме есть неявные ограничения: в каком случае и из какого столбца убирать элементы. Постараемся оптимизировать процесс нахождения минимального количества элементов выборки. Для начала рассмотрим несколько случаев: 1-й случай. Будем называть его «Четкий лидер» Рассмотрим случай со 100 элементами, 3-мя интервалами и 1-м четко выраженным лидером. Допустим, что есть интервалы В данном случае при уменьшении количества элементов, вероятности в интервалах будутувеличиваться и уменьшаться до тех пор, пока не достигнут некого равновесного случая, а именно: 14
Схема поиска «равновесного» решения: Начать стоит с интервала, в который попало меньше всего значений. Попало 2 значения, то есть его можно уменьшить в 2 раза, чтобы количество попаданий равнялось 1. Полученная таблица частот и вероятностей: Так как 1,5 не целое, а нам нужны только целые значения, получаем: 2-й случай «2 чѐтких лидера» 15
В данном случае при уменьшении количества элементов, вероятности в интервалах будутувеличиваться и уменьшаться до тех пор, пока не достигнут некого равновесного случая, а именно: 2.2.Алгоритм приближения по значениям в каждом из интервалов: Рассмотрим следующий алгоритм: Подготовительный этап: Дано: количество интервалов для рассмотрения m. Объѐм начальной выборки N и процент попадания в каждый из m интервалов , уровень значимости β. Необходимо: 1. Посчитать частоты и вероятности попадания значений в каждый из интервалов. Где – вероятность попадания значения в –интервал, попавших значений в - интервал(частота). 16 -количество
2. Найти значение (квантиль) с уровнем значимости β и степенями свободы Убрать из рассмотрения -интервалов, в которых . Значения частот в этих интервалах не будут меняться в дальнейшем. Алгоритм: 1. Рассмотреть, есть ли среди интервалов, интервалы, в которых частота . Посчитать количество таких интервалов и обозначить через . Убрать из дальнейшего рассмотрения эти интервалов, т.е. значения частот в этих интервалах не будут меняться в дальнейшем. 2. Определить минимальную частоту : Зафиксировать интервал/интервалы с минимальной частотой. Пусть количество таких интервалов 3. Сократить частоты в ( , принять )-интервалах в раз. Так как частоты уменьшились, то уменьшилось и количество элементов в выборке и поменялись вероятности. Посчитать частоты, вероятности и количество элементов в новой выборке. Проверить новую и начальную выборки на соответствие критерию Пирсона > (см. параграф 1.1 «постановка задачи»). Если критерий согласия не выполняется, то перейти к пункту 4, если критерий выполняется, перейти к пункту 5. 4. Увеличить , . Вернуться в начало пункта 3(с теми же частотами, что были до последнего сокращения). Примечание: продолжать увеличивать критерия не выполнится. 17 до тех пор, пока условие
5. Убрать из дальнейшего рассмотрения интервалов, определенных в пункте 2. Обновить . 6. Продолжать пункты 2-5 до тех пор, пока . То есть пока из рассмотрения не будут убраны все интервалы. Итогом работы алгоритма является новая выборка с количеством элементов . 2.3.Насыщенность выборки Исследование насыщенности выборки – это определение такого количества экспериментов, после которого последующие эксперименты не приносят новой информации. Часто подобные исследования проводятся в социологии или психологии, используя открытые вопросы. Пример: необходимо узнать, какие проблемы вызывают больше всего беспокойств у людей в возрасте от 16 до 24. После проведения ряда исследований(предположим 30), удалось установить, что наиболее ценными и уникальными в своѐм роде было всего 15 ответов. Провели еще 30 опросов, выяснилось, что 2й опрос дал еще несколько уникальных ответов, допустим 2. Проводя еще ряд опросов, обнаружилось, что в них вообще не оказалось уникальных ответов, либо вероятность таковых слишком мала и,в целях исследования, их можно не принимать во внимание. Таким образом, на некоем шаге было определено, что после n-экспериментов новые опросы не дают статистически важной информации. Тогда n – точка насыщения. Полагаем, что в силу обстоятельств мы знаем, какие должны быть параметры у распределения(пример: аналогичное маркетинговое исследование, проводившееся в прошлый период). И задачей является проверить, появились ли значимые изменения по данному вопросу. 18
В данной работе предлагается начать проверку(повторное исследование) с рассмотрения малого количества анкет. Затем проверить статистические параметры: распределение, среднее и дисперсию. Если есть значимые отличия от известных параметров, то добавить новые элементы в выборку. Начать предполагается с размера выборки, определенного с помощью алгоритма в пункте 2.2. 2.4. Вычисления. Проводится маркетинговое исследование с целью узнать, какими критериями руководствуются жители Москвы в возрасте от 15 до 60 при выборе сока, а также установить популярность марок сока. В ходе 300 опросов[21] были получены следующие ответы на вопросы: 19
Результаты ответа на вопрос: «Какой самый важный критерий при выборе сока?» 20
Результаты по первому ответу на вопрос: «Какие марки сока вы знаете?» Говорить о функции распределения, средней или о среднеквадратическом отклонении качественных параметров, можно лишь «условно» в силу номинальности (не являются числовыми) самих параметров. Это означает, что для оценки параметров выборки необходимо ввести индексацию. Допустим, что в данном случае индексация введена так, чтобы данные принадлежали нормальному закону распределения. Примечание 1: стоит отметить, что если используется индексация, то для сравнения данных в других аналогичных исследованиях, индексация должна остаться той же или быть соответственно,пересчитаны статистические показатели. 21 пересмотрена и,
Примечание 2: предполагается, что индексация в большинстве случаев будет подбираться так, чтобы выборка соответствовала нормальному закону распределения. Результаты проверки на нормальность при использовании критерия Пирсона на уровне значимости 0,05 приведены в таблице 1.(См приложение «Таблица 1»). Итог: принимая во внимание индексацию с уровнем значимости в 5%, можно «условно» утверждать, что выборка подчиняется нормальному закону распределения. Далее будут приведены расчѐты для определения минимального объѐма выборки с помощью алгоритма из пункта 2.2 при уровне значимости α=0,05 и значением степеней свободы равного ( -1)(где – количество интервалов). Вычисления разделены на 2 типа: 1. Предполагается, что будет использован механизм, применяющийся для определения насыщенности выборки. То есть, когда на первом шаге берется малая исследуемая группа, далее к ее рассмотрению добавляется еще одна группа такого же количества и так далее. При добавлении каждой новой группы происходит проверка на согласованность с генеральной выборкой. В данной работе будем называть такой подход «не менее 1 элемента в интервале». 2. В силу того, что критерий Пирсона может давать не очень точные результаты при частоте в интервале равной 5, предполагается, что в каждом из интервалов будет не менее 5 элементов. Интервалы, которые изначально содержат менее 5 элементов,отбрасываются.В данной работе будем называть такой подход «не менее 5 элементов в интервале». Расчѐты«не менее 1 элемента в интервале»: 22
Выкладки для первого вопроса представлены в таблице 2. (См. приложение «Таблица 2»). Итог: минимально возможное количество элементов выборки, при котором может сохраняться первоначальное распределение =28. Выкладки для второго вопроса, представлены в таблице 3. (См. приложение «Таблица 3»). Итог: минимально возможное количество элементов выборки, при котором может сохраняться первоначальное распределение =21. Итог 1:В силу того, что оба вопроса относятся к одному исследованию, то нужно выбрать максимальное значение из полученных объѐмов. А именно: 28. Итог 2:Количество анкет, от которого стоит «отталкиваться» при проведении повторного опроса 28. То есть в первую исследуемую группу стоит включить 28 человек. Затем создать еще одну группу из 28 человек из оставшихся 272 и проанализировать изменение вероятностей при добавлении 2й группы к исследованию.Нужно добавлять новые группы до тех пор, пока не выполнится условие критерия согласия Пирсона на заданном уровне значимости. Расчѐты«не менее 5 элементов в интервале»: Выкладки для первого вопроса представлены в таблице 4. (См. приложение «Таблица 4»). Итог: минимальный объѐм выборки = 130. Выкладки для второго вопроса, представлены в таблице 5. (См. приложение «Таблица 5»). Итог: минимальный объѐм выборки = 115. 23
Итог: в силу того, что оба вопроса относятся к одному исследованию, нужно выбрать максимальное значение из полученных объѐмов и этого объѐма будет достаточно для проведения исследования. А именно: 130. 2.5. Оценка алгоритма: Так как для рассмотрения выбраны качественные данные и исследование проводится повторно, то для оценки минимального объема используется элемент, «Бесповторный выбор»[19]. попавший в выборочную При бесповторном совокупность, в отборе генеральную совокупность не возвращается.То есть объѐм генеральной выборки в процессе исследования сокращается. Основная формула для определения объѐма новой выборки: , где n – объѐм новой выборки; N – объем генеральной совокупности(в приведенном примере равен 300); t – коэффициент соответствия доверительной вероятности; ∆ – допустимая ошибка; y – доля исследуемого признака в генеральной совокупности 24
Используя «Бесповторный выбор», рассмотрим различные значения для уровнязначимости α, допустимой ошибки при условии, что доля исследуемого признака равной 0,24(вероятность самого популярного ответа).Получаем таблицы: Итог 1:для расчѐтов «не менее 1 элемента в интервале»при учете доли признака в генеральной совокупности=0,24 (24%), уровне значимости 5%, с доверительными границами ±17,% достаточный объем=29 анкетам. Итог 2:для расчѐтов«не менее 5 элементов в интервале»при учете доли признака в генеральной совокупности=0,24 (24%), уровне значимости 5%, с доверительными границами ±6,3% достаточный объем=127 анкет. 25
2.6.Применение алгоритма для других классов задач: Как отмечалось ранее, есть множество различных классов задач, где возможно использование алгоритма. В качестве еще одного примера применения рассмотрим задачу определения необходимого количества измерений в задаче мониторинга температур океанического течения. Задача: имеются выборка из температур океанического течения. Необходимо определить объѐм выборки температур для повторного исследования на уровне значимости 5%. Используя алгоритм из пункта 2.2. и расчѐты типа «не менее 1 элемента в интервале» получаем, что минимальное количество измерений, при котором может выполняться критерий согласия Пирсона на уровне значимости 5% равно 178. (См. «Приложение 3»). При расчѐтах «не менее 5 элементов в интервале» получаем объем выборки равный 788 элементам. (См. «Приложение 3»). 26
Выводы о проделанной работе: 1. Задача уменьшения объема выборки при повторном исследовании свойств генеральной совокупности является актуальной, так как позволяет сократить затраты на маркетинговое исследование. 2. Разработанный алгоритм приближения по значениям в каждом из интервалов позволяет сокращать объем выборки при повторном исследовании 3. Сравнение данного алгоритма с методом «бесповторный выбор» показывает его эффективность. 4. Возможности использования алгоритма приближения по значениям в каждом из интервалов не ограничиваются только маркетинговыми исследованиями. Область его применения может быть расширена. 27
Заключение В данной работе рассмотрены классы возможных задач, связанных с оптимизацией выборки. Также был разработан алгоритм для определения минимального объѐма выборки при повторном исследовании.Алгоритм может быть применѐн как к численным, так и к качественным параметрам (хорошо/средне/плохо), что продемонстрировано маркетингового исследования. 28 на примерах из
Список литературы 1. Котлер Ф., Армстронг Г., Сондерс Д., Вонг В. Основы марк етинга: Пер. с англ.2е Европ. Изд. М.; СПб.; К.: Издат. Дом "Вильямс", 2005: 502–512. 2. Сост. А.А. Грицанов, В.Л. Абушенко, Г.М. Евелькин, Г.Н. Соколова, О.В. Терещенко. Социология: Энциклопедия//Мн.: Книжный Дом, 2003.— 1312 с 3. Орлов Ю.Н., Шагов Д.О.Индикативные статистики для нестационарных временных рядов // Препринты ИПМим. М.В.Келдыша. 2011. № 53. 20 с 4. Орлов Ю.Н., Осминин К.П. Методы статистического анализа литературныхтекстов. // М.: Editorial URSS, Книжный дом «ЛИБРОКОМ», 2012.– 312 с. 5. Чичагов необходимого В. для использованием В. «Определение построения несмещенных объема асимптотических оценок» выборки, интервалов //«Вестник» с Пермского университета «Математика. Механика Информатика.» 2008 Вып. 4(20) 6. Бакаева О.А. Определение минимального объема выборки//«Вестник» Мордовского университета 2010 №4 Серия «физико-математические науки» 7. Мотренко А.П. «Оценка объема выборки в задачах прогнозирования»// ВКР Московский физико-технический институт. Москва 2014г. 8. Крамаренко Е.Ю. «Минимизация объема выборки в маркетинговых исследованиях»//СПбГУ 2014. 9. Орехов А.В. Рандомизированный алгоритм корректировки выборочных данных УНИВЕРСИТЕТА. // СЕРИЯ ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО 10: ПРИКЛАДНАЯ 29 МАТЕМАТИКА.
ИНФОРМАТИКА. ПРОЦЕССЫ УПРАВЛЕНИЯ. Издательство: СанктПетербургский государственный университет (Санкт-Петербург) ISSN: 1811-9905, 2015. 3. 96-104. 10. OndřejVilikus«Optimization of sample size and number of tasks per respondent in conjoint studies using simulated datasets» 11. SamanKhowaja,ShaziaGhufran& M. J. Ahsan «Multi-objective optimization for optimumallocation in multivariate stratified sampling withquadratic cost»//Journal of Statistical Computation and Simulation, 82:12, 1789-1798 14 Jul 2011 12. TimurKeskinturk,SebnemEr «A genetic algorithm approach to determine stratum boundaries andsample sizes of each stratum in stratified sampling»//Computational Statistics & Data Analysis 52 (2007) 53 – 67. Available online 18 April 2007 13. «Defining Christophe Corona,Jérôme Lopez Saez , Markus Stoffel optimal fordendrogeomorphic sample size, landslide sampling design reconstructions» and thresholds //journalQuaternary Geochronology homepage:// www.elsevier.com/locate/quageo 14. «Sample Richard H. Byrd,Gillian M. Chiny,JorgeNocedal,YuchenWux Size Selection in Optimization Methods for Machine Learning»//January 16, 2012 15. Nicholas Facchiano, Ashley Kingman, Amanda Olore, David Zuniga «Sampling Strategies for Error RateEstimation and Quality Control» 16. John M. Castelloe «Sample Size Computations and Power Analysiswith the SASâSystem» SAS Institute Inc., Cary, NC 17. Barranco-ChamorroI., J.L. Moreno-Rebollo, M.D. Jim´enez- Gamero,M.V. Alba-Fern´andez«Estimation of the sample size n based on record values»//Mathematics and Computers in Simulation 118 (2015) 58– 72. Availableonline 6 January 2015 30
18. AndronovA ,Merkuryev Y. «Optimization of statistical sample sizes in simulation»// Journal of Statistical Planning and Inference 85 (2000) 93–102 19. Кендалл М., Стьюарт А. «Статистические выводы и связи» М.: Наука, 1973. С 595-604. 20. Кобзарь А.И. «Прикладная математическая статистика для инженеров и научных работников» Издание второе, исправленное. Москва «Физматлит» 2012г 21. Данные по маркетинговым исследованиям были взяты с сайта компании FDFGroup: http://www.fdfgroup.ru/?id=261 31
Приложение 1: таблица проверки гипотезы о нормальном распределении выборки. Приложение 2: Таблицы результатов вычислительных экспериментов для задачи определения необходимого количества анкет при повторном маркетинговом исследовании. Таблица 2:применение алгоритма из пункта 2.2 к результатам исследования по вопросу:«Какой самый важный критерий при выборе сока?» («не менее 1 элемента в интервале»). 32
Первый шаг: Завершающий шаг метода: Примечание: здесь и далее под разницей вероятностей понимается соотношение типа Таблица 3:применение алгоритма из пункта 2.2 к результатам исследования по вопросу: «Какие марки сока вы знаете?» («не менее 1 элемента в интервале»). 33
Первый шаг: Завершающий шаг метода: Таблица 4:применение алгоритма из пункта 2.2 к результатам исследования по вопросу:«Какой самый важный критерий при выборе 34
сока?»(«не менее 5 элементов в интервале») Завершающий шаг: Таблица 5:применение алгоритма из пункта 2.2 к результатам исследования по вопросу: «Какие марки сока вы знаете?»(«не менее 5 элементов в интервале») Завершающий шаг 35
Приложение 3:Таблицы результатов вычислительных экспериментов для других рассмотренных задач. Пример реализации алгоритма в Exel. Таблица 6: начальные данные по температурам океанического течения. Таблица 7: расчеты по алгоритму из пункта 2.2 типа «не менее 1 элемента в интервале» 36
ЭКСПЕРИМЕНТ 1 удаление из 1го интервала СУММА 0,000789 0,003155 0,009992 0,026032 0,033921 0,067052 0,084407 0,090192 0,101762 0,149882 0,173547 0,124901 3 12 частота новых эл-тов1 38 99 129 255 4 12,66667 33 43 85 321 343 387 570 660 475 107 114,3333 129 190 220 158,3333 101,6667 Вероятности0,000789 новых эл-тов 0,003155 0,009992 0,026032 0,033921 0,067052 0,084407 0,090192 0,101762 0,149882 0,173547 0,124901 Разница вероятностей 0 0 3,01E-34 4,62E-34 0,0802 0,051275 0,002892 0 2,87E-33 2,28E-33 0 1,89E-33 0 4,44E-33 305 195 1 11 3803 ХИ крит 65 3,666667 1267,667 6,570631 0,0802 0,051275 0,002892 0 0 0 1 СУММА*N 0 1,22E-32 1,55E-29 Хи крит-Хи теор 6,570631 ЭКСПЕРИМЕНТ 2 удаление из 15го интервала 1й 2й 3й 4й 5й 6й 7й 8й 9й 10й 11й 12й 13й 0,000789 0,003155 0,009992 0,026032 0,033921 0,067052 0,084407 0,090192 0,101762 0,149882 0,173547 0,124901 3 12 38 99 частота новых эл-тов1 1,090909 3,454545 129 255 343 387 570 660 9 11,72727 23,18182 29,18182 31,18182 35,18182 51,81818 Вер-ти нов. эл-тов 0,002886 0,003149 0,009971 0,025977 0,033849 0,066912 Разн вер-тей0,005577 1,39E-08 321 14й 15й СУММА 0,0802 0,051275 0,002892 475 305 195 1 11 60 43,18182 27,72727 17,72727 3803 ХИ крит 1 346,4545 6,570631 0,08423 0,090003 0,101548 0,149567 0,173183 0,124639 0,080031 0,051168 0,002886 4,4E-08 1,15E-07 1,49E-07 2,95E-07 3,72E-07 3,97E-07 4,48E-07 6,6E-07 7,65E-07 1 СУММА*N 5,5E-07 3,53E-07 2,26E-07 1,27E-08 0,005582 1,933796 Хи крит-Хи теор 4,636835 ЭКСПЕРИМЕНТ 3 удаление из 2го интервала 1й 2й 3й 4й 5й 6й 7й 8й 9й 10й 11й 12й 13й 0,000789 0,003155 0,009992 0,026032 0,033921 0,067052 0,084407 0,090192 0,101762 0,149882 0,173547 0,124901 3 12 частота новых эл-тов1 38 99 129 255 1 3,166667 8,25 10,75 21,25 321 343 387 570 26,75 28,58333 32,25 47,5 660 475 6,2E-07 15й СУММА 1 305 195 11 3803 ХИ крит 55 39,58333 25,41667 16,25 1 317,75 6,570631 0,07999 0,051141 0,003147 1 СУММА*N Вер-ти нов. эл-тов 0,003147 0,003147 0,009966 0,025964 0,033832 0,066876 0,084186 0,089955 0,101495 0,149489 0,173092 0,124574 Разн вер-тей 0,00705 2,17E-08 6,87E-08 1,79E-07 2,33E-07 4,61E-07 5,81E-07 14й 0,0802 0,051275 0,002892 7E-07 1,03E-06 1,19E-06 8,59E-07 5,52E-07 3,53E-07 2,24E-05 0,007079 Хи крит-Хи теор 2,24947 4,321162 ЭКСПЕРИМЕНТ 4 удаление из 3го интервала 1й 2й 3й 4й 5й 6й 7й 8й 9й 10й 11й 12й 13й 0,000789 0,003155 0,009992 0,026032 0,033921 0,067052 0,084407 0,090192 0,101762 0,149882 0,173547 0,124901 3 12 частота новых эл-тов1 1 38 99 129 255 321 343 570 1 2,605263 3,394737 6,710526 8,447368 9,026316 10,18421 Вер-ти нов. эл-тов 0,009766 0,009766 0,009766 0,025443 0,033153 0,065536 0,082498 0,088152 Разн вер-тей0,102163 387 660 475 15 17,36842 14й 15й СУММА 0,0802 0,051275 0,002892 305 195 1 11 12,5 8,026316 5,131579 3803 ХИ крит 1 102,3947 6,570631 0,09946 0,146492 0,169622 0,122077 0,078386 0,050116 0,009766 0,01385 5,11E-06 1,33E-05 1,74E-05 3,43E-05 4,32E-05 4,61E-05 5,21E-05 7,67E-05 8,88E-05 6,39E-05 1 СУММА*N 4,1E-05 2,62E-05 0,016335 0,132856 13,60372 Хи крит-Хи теор -7,03309 ЭКСПЕРИМЕНТ 4.1 сокращение 3го интервала до 2х 1й 2й 3й 4й 5й 6й 7й 8й 9й 10й 11й 12й 13й 0,000789 0,003155 0,009992 0,026032 0,033921 0,067052 0,084407 0,090192 0,101762 0,149882 0,173547 0,124901 3 12 частота новых эл-тов1 1 38 99 129 255 321 343 387 570 2 5,210526 6,789474 13,42105 16,89474 18,05263 20,36842 Вер-ти нов. эл-тов 0,004956 0,004956 0,009911 0,025822 0,033646 Разн вер-тей 0,02201 0,001027 6,53E-07 0,06651 0,083725 0,089463 0,100939 1,7E-06 2,22E-06 4,38E-06 5,52E-06 5,9E-06 6,65E-06 660 475 30 34,73684 14й 15й СУММА 0,0802 0,051275 0,002892 305 195 1 11 25 16,05263 10,26316 3803 ХИ крит 1 201,7895 6,570631 0,14867 0,172144 0,123891 0,079551 0,050861 0,004956 1 СУММА*N 9,8E-06 1,13E-05 8,17E-06 5,24E-06 3,35E-06 0,001472 0,024573 4,958641 Хи крит-Хи теор 1,611991 ЭКСПЕРИМЕНТ 4.2 сокращение 4го интервала до 5х 1й 2й 3й 4й 5й 6й 7й 8й 9й 10й 11й 12й 13й 0,000789 0,003155 0,009992 0,026032 0,033921 0,067052 0,084407 0,090192 0,101762 0,149882 0,173547 0,124901 3 12 38 частота новых эл-тов1 1 2 99 129 255 321 343 387 570 660 5 6,515152 12,87879 16,21212 17,32323 19,54545 28,78788 33,33333 14й 15й СУММА 0,0802 0,051275 0,002892 475 305 195 1 11 23,9899 15,40404 9,848485 3803 ХИ крит 1 193,8384 6,570631 Вер-ти нов. эл-тов 0,005159 0,005159 0,010318 0,025795 0,033611 0,066441 0,083637 0,089369 0,100834 0,148515 0,171965 0,123762 0,079468 0,050808 0,005159 Разн вер-тей0,024209 0,001272 1,06E-05 2,16E-06 2,82E-06 5,58E-06 7,02E-06 7,5E-06 8,46E-06 1,25E-05 1,44E-05 1,04E-05 6,67E-06 4,26E-06 0,001776 1 СУММА*N 0,02735 5,301475 Хи крит-Хи теор 1,269157 ЭКСПЕРИМЕНТ 4.3 сокращение 5го интервала до 6 1й 2й 3й 4й 5й 6й 7й 8й 9й 10й 11й 12й 13й 0,000789 0,003155 0,009992 0,026032 0,033921 0,067052 0,084407 0,090192 0,101762 0,149882 0,173547 0,124901 3 12 38 99 частота новых эл-тов1 1 2 5 129 255 321 343 387 6 11,86047 14,93023 15,95349 570 660 475 14й 15й 305 195 18 26,51163 30,69767 22,09302 14,18605 9,069767 Вер-ти нов. эл-тов 0,005577 0,005577 0,011154 0,027886 0,033463 0,066148 0,083268 0,088975 0,100389 СУММА 0,0802 0,051275 0,002892 11 1 3803 ХИ крит 1 179,3023 6,570631 0,14786 0,171206 0,123217 0,079118 0,050584 0,005577 1 СУММА*N Разн вер-тей0,029065 0,001859 0,000135 0,000132 6,17E-06 1,22E-05 1,54E-05 1,64E-05 1,85E-05 2,73E-05 3,16E-05 2,27E-05 1,46E-05 9,33E-06 0,002492 0,033857 6,070648 37 Хи крит-Хи теор 0,499984
ЭКСПЕРИМЕНТ 4.4 сокращение 14го интервала до 9 1й 2й 3й 4й 5й 6й 7й 8й 9й 10й 11й 12й 13й 0,000789 0,003155 0,009992 0,026032 0,033921 0,067052 0,084407 0,090192 0,101762 0,149882 0,173547 0,124901 3 12 38 99 частота новых эл-тов1 1 2 5 129 255 321 343 Разн вер-тей0,029545 195 6 11,76923 14,81538 15,83077 17,86154 26,30769 30,46154 21,92308 14,07692 9 0,00192 0,000154 0,000162 1,45E-06 1,35E-05 570 660 15й 305 Вер-ти нов. эл-тов 0,005617 0,005617 0,011233 0,028083 0,033699 0,066102 0,083211 0,088914 387 14й СУММА 0,0802 0,051275 0,002892 475 1 11 3803 ХИ крит 1 178,0462 6,570631 0,10032 0,147758 0,171088 0,123131 0,079063 0,050549 0,005617 1 СУММА*N 1,7E-05 1,81E-05 2,04E-05 3,01E-05 3,49E-05 2,51E-05 1,61E-05 1,03E-05 0,002565 0,034532 6,148343 Хи крит-Хи теор 0,422288 ЭКСПЕРИМЕНТ 4.5 сокращение 6го интервала до 11 1й 2й 3й 4й 5й 6й 7й 8й 9й 10й 11й 12й 13й 0,000789 0,003155 0,009992 0,026032 0,033921 0,067052 0,084407 0,090192 0,101762 0,149882 0,173547 0,124901 3 12 38 99 129 частота новых эл-тов1 1 2 5 6 255 321 343 387 570 660 11 13,84706 14,79608 16,69412 24,58824 28,47059 14й 15й СУММА 0,0802 0,051275 0,002892 475 305 195 20,4902 13,15686 9 1 11 3803 ХИ крит 1 168,0431 6,570631 Вер-ти нов. эл-тов 0,005951 0,005951 0,011902 0,029754 0,035705 0,065459 0,082402 0,088049 0,099344 0,146321 0,169424 0,121934 0,078295 0,053558 0,005951 1 СУММА*N Разн вер-тей0,033779 0,002477 0,000365 0,000532 9,39E-05 3,78E-05 4,76E-05 5,09E-05 5,74E-05 8,46E-05 9,79E-05 7,05E-05 4,53E-05 0,000102 0,003234 0,041074 6,902162 Хи крит-Хи теор -0,33153 ЭКСПЕРИМЕНТ 4.6 сокращение 6го интервала до 12 1й 2й 3й 4й 5й 6й 7й 8й 9й 10й 11й 12й 13й 0,000789 0,003155 0,009992 0,026032 0,033921 0,067052 0,084407 0,090192 0,101762 0,149882 0,173547 0,124901 3 12 38 99 129 частота новых эл-тов1 1 2 5 6 255 321 343 387 570 660 14й 15й СУММА 0,0802 0,051275 0,002892 475 305 195 12 15,10588 16,14118 18,21176 26,82353 31,05882 22,35294 14,35294 9 1 11 3803 ХИ крит 1 181,0471 6,570631 Вер-ти нов. эл-тов 0,005523 0,005523 0,011047 0,027617 0,033141 0,066281 0,083436 0,089155 0,100591 0,148158 0,171551 0,123465 0,079277 0,049711 0,005523 Разн вер-тей0,028416 0,001777 0,000111 9,65E-05 1,79E-05 8,87E-06 1,12E-05 1,19E-05 1,35E-05 1,98E-05 1 СУММА*N 2,3E-05 1,65E-05 1,06E-05 4,77E-05 0,002393 0,032975 5,970097 Хи крит-Хи теор 0,600535 ЭКСПЕРИМЕНТ 4.7 сокращение 13го интервала до 14 1й 2й 3й 4й 5й 6й 7й 8й 9й 10й 11й 12й 13й 0,000789 0,003155 0,009992 0,026032 0,033921 0,067052 0,084407 0,090192 0,101762 0,149882 0,173547 0,124901 3 12 38 99 129 частота новых эл-тов1 1 2 5 6 255 321 343 387 570 660 14й 15й СУММА 0,0802 0,051275 0,002892 475 305 195 12 14,73443 15,74426 17,76393 26,16393 30,29508 21,80328 14 9 1 11 3803 ХИ крит 1 177,5049 6,570631 Вер-ти нов. эл-тов 0,005634 0,005634 0,011267 0,028168 0,033802 0,067604 0,083009 0,088698 0,100076 0,147398 0,170672 0,122832 0,078871 0,050703 0,005634 Разн вер-тей0,029755 0,001946 0,000163 0,000175 4,15E-07 4,53E-06 2,32E-05 2,48E-05 2,79E-05 4,11E-05 4,76E-05 3,43E-05 1 СУММА*N 2,2E-05 6,39E-06 0,002598 0,034869 6,189472 Хи крит-Хи теор 0,381159 ЭКСПЕРИМЕНТ 4.8 сокращение 7го интервала до 15 1й 2й 3й 4й 5й 6й 7й 8й 9й 10й 11й 12й 13й 0,000789 0,003155 0,009992 0,026032 0,033921 0,067052 0,084407 0,090192 0,101762 0,149882 0,173547 0,124901 3 12 38 99 129 255 частота новых эл-тов1 1 2 5 6 12 321 343 387 570 660 475 305 15 16,02804 18,08411 26,63551 30,84112 22,19626 14 Вер-ти нов. эл-тов 0,005562 0,005562 0,011124 0,027811 0,033373 0,066746 0,083433 0,089151 0,100587 0,148152 0,171544 Разн вер-тей0,028884 0,001836 0,000128 0,000122 8,83E-06 14й 1,4E-06 1,12E-05 1,2E-05 1,36E-05 15й СУММА 0,0802 0,051275 0,002892 0,12346 0,077871 1 195 11 3803 ХИ крит 9 1 179,785 6,570631 0,05006 0,005562 1 СУММА*N 2E-05 2,31E-05 1,66E-05 6,76E-05 2,88E-05 0,002464 0,033637 6,047362 Хи крит-Хи теор 0,52327 ЭКСПЕРИМЕНТ 4.9 сокращение 8го интервала до 16 1й 2й 3й 4й 5й 6й 7й 8й 9й 10й 11й 12й 13й 0,000789 0,003155 0,009992 0,026032 0,033921 0,067052 0,084407 0,090192 0,101762 0,149882 0,173547 0,124901 3 12 38 99 129 частота новых эл-тов1 1 2 5 6 Вер-ти нов. эл-тов 0,005568 0,005568 0,011137 0,027842 0,03341 255 321 12 15 343 387 570 660 14й 15й СУММА 0,0802 0,051275 0,002892 1 475 305 195 11 3803 ХИ крит 16 18,05248 26,58892 30,78717 22,15743 14 9 1 179,586 6,570631 0,06682 0,083525 0,089094 0,100523 0,148057 0,171434 0,123381 0,077957 0,050115 0,005568 1 СУММА*N Разн вер-тей0,028958 0,001845 0,000131 0,000126 7,68E-06 8,03E-07 9,21E-06 1,34E-05 1,51E-05 2,22E-05 2,57E-05 1,85E-05 6,27E-05 2,62E-05 0,002476 0,033738 6,058787 Хи крит-Хи теор 38 0,511844
ЭКСПЕРИМЕНТ 4.10 сокращение 9го интервала до 18 1й 2й 3й 4й 5й 6й 7й 8й 9й 10й 11й 12й 13й 0,000789 0,003155 0,009992 0,026032 0,033921 0,067052 0,084407 0,090192 0,101762 0,149882 0,173547 0,124901 3 12 38 99 129 255 321 343 частота новых эл-тов1 1 2 5 6 12 15 16 387 570 660 475 18 26,51163 30,69767 22,09302 Вер-ти нов. эл-тов 0,005577 0,005577 0,011154 0,027886 0,033463 0,066926 0,083658 0,089235 0,100389 0,14786 0,171206 0,123217 Разн вер-тей0,029065 0,001859 0,000135 0,000132 6,17E-06 2,38E-07 6,65E-06 1,02E-05 1,85E-05 2,73E-05 3,16E-05 2,27E-05 14й 15й СУММА 0,0802 0,051275 0,002892 305 195 14 9 1 11 3803 ХИ крит 1 179,3023 6,570631 0,07808 0,050195 0,005577 1 СУММА*N 5,6E-05 2,28E-05 0,002492 0,033885 6,075659 Хи крит-Хи теор 0,494972 ЭКСПЕРИМЕНТ 4.11 сокращение 12го интервала до 22 1й 2й 3й 4й 5й 6й 7й 8й 9й 10й 11й 12й 13й 0,000789 0,003155 0,009992 0,026032 0,033921 0,067052 0,084407 0,090192 0,101762 0,149882 0,173547 0,124901 3 12 38 99 129 255 321 343 387 частота новых эл-тов1 1 2 5 6 12 15 16 18 570 14й 15й СУММА 0,0802 0,051275 0,002892 660 475 305 195 26,4 30,56842 22 14 9 1 11 3803 ХИ крит 1 178,9684 6,570631 Вер-ти нов. эл-тов 0,005588 0,005588 0,011175 0,027938 0,033525 0,067051 0,083814 0,089401 0,100576 0,147512 0,170803 0,122927 0,078226 0,050288 0,005588 Разн вер-тей0,029192 0,001875 0,00014 0,00014 4,6E-06 2,89E-11 4,17E-06 6,93E-06 1,38E-05 3,75E-05 4,34E-05 3,12E-05 4,86E-05 1 СУММА*N 1,9E-05 0,002511 0,034066 6,096786 Хи крит-Хи теор 0,473845 ЭКСПЕРИМЕНТ 4.12 сокращение 10го интервала до 26 1й 2й 3й 4й 5й 6й 7й 8й 9й 10й 11й 12й 13й 0,000789 0,003155 0,009992 0,026032 0,033921 0,067052 0,084407 0,090192 0,101762 0,149882 0,173547 0,124901 3 12 38 99 129 255 частота новых эл-тов1 1 2 5 6 12 Вер-ти нов. эл-тов 0,005615 0,005615 0,011229 0,028073 0,033688 0,067376 Разн вер-тей0,029522 0,001917 0,000153 0,00016 321 343 387 15 16 18 570 14й 15й СУММА 0,0802 0,051275 0,002892 660 475 305 195 26 30,10526 22 14 9 1 11 3803 ХИ крит 1 178,1053 6,570631 0,08422 0,089835 0,101064 0,145981 0,169031 0,123522 0,078605 0,050532 0,005615 1 СУММА*N 1,6E-06 1,56E-06 4,15E-07 1,42E-06 4,79E-06 0,000102 0,000118 1,52E-05 3,17E-05 1,08E-05 0,002562 0,0346 6,162509 Хи крит-Хи теор 0,408123 ЭКСПЕРИМЕНТ 4.13 сокращение 11го интервала до 30 1й 2й 3й 4й 5й 6й 7й 8й 9й 10й 11й 12й 13й 0,000789 0,003155 0,009992 0,026032 0,033921 0,067052 0,084407 0,090192 0,101762 0,149882 0,173547 0,124901 3 12 38 частота новых эл-тов1 1 2 Вер-ти нов. эл-тов 0,005618 0,005618 0,011236 99 129 255 5 6 12 0,02809 0,033708 0,067416 14й 15й СУММА 0,0802 0,051275 0,002892 1 321 343 387 570 660 475 305 195 11 15 16 18 26 30 22 14 9 1 178 6,570631 0,08427 0,089888 0,101124 0,146067 0,168539 0,123596 0,078652 0,050562 0,005618 1 СУММА*N Разн вер-тей0,029563 0,001922 0,000155 0,000163 1,33E-06 1,97E-06 2,24E-07 1,03E-06 3803 ХИ крит 4E-06 9,71E-05 0,000145 1,37E-05 2,99E-05 9,93E-06 0,002568 0,034674 6,171932 Хи крит-Хи теор 39 0,3987
Таблица 8: расчеты по алгоритму из пункта 2.2 типа «не менее 5 элементов в интервале» Первый шаг: Формулы ,используемые для вычисления первого шага в Exel. Наиболее интересны первые два столбца и последние два, так как зстолбы между ними образуются с помощью копирования строк. (Первые 3 столбца первого шага) (Последние 3 столба первого шага) 40
Второй шаг (Первые 3 столбца второго шага. Формулы в Exel.) (Последние 3 столба первого шага. Формулы в Exel. Цветом отмечен столбец, который был зафиксирован после прохождения первого шага) 41
Завершающий шаг: (Первые 3 столбца завершающего шага. Формулы в в Exel.) (Последние 3 столба завершающего шага. Формулы в в Exel.) 42
Отзывы:
Авторизуйтесь, чтобы оставить отзыв