1. База данных
Для проведения статистического наблюдения формируется информационная база. Создание такой базы – начальная стадия экономико-статистического исследования. По результатам статистического наблюдения формируется информационная база данных.
При определении программы выборочного наблюдения необходимо определить минимальный объем выборки, который должен обеспечить требуемую точность. Методика расчета численности выборки n зависит от метода выбора, она рассчитывается по формуле, приведенной в табл. 1.
Таблица 1.
Расчет минимальной численности выборки
| Методы отбора | Формула объема выборки | |
| для средней | для доли | |
| Бесповторный | ||
Например, в металлообрабатывающем цехе работают 100 рабочих-сварщиков. Для этой совокупности произведем необходимый объем выборки. С помощью бесповторного метода предполагается произвести выборочное обследование для определения средней заработной платы среди сварщиков цеха. Определять необходимый объем выборки будем при условии, что с вероятностью 0,954 ошибка выборки не превысит 190 р. при среднеквадратическом отклонении 490 р.
(1)
Подставляем принятое значение в (1), получаем минимальный объем выборки:
( округлив=22)
Минимальный объем выборки составляет 22 единицы.
Из цеха методом случайного бесповторного отбора выбирают 22 рабочих- сварщиков, которые оформляются в виде информационной базы данных, представленной в табл.2.
Таблица 2.
| № п/п | Фамилия, имя, отчество | Заработная плата | 
| 1 | Аверьянов К.Д. | 1750 | 
| 2 | Лукьянова Т.А. | 1380 | 
| 3 | Севостьянов Л.И. | 2430 | 
| 4 | Иванов Т.А. | 2300 | 
| 5 | Поздняков А.А. | 1940 | 
| 6 | Сушков Б.А. | 2890 | 
| 7 | Ляпин Е.Л. | 3220 | 
| 8 | Федоров А.М. | 3010 | 
| 9 | Федосеев Л.А. | 2620 | 
| 10 | Кудряшов А.В. | 2754 | 
| 11 | Подгорный Р.В. | 2150 | 
| 12 | Смирнов К.А. | 3200 | 
| 13 | Ченцов А.С. | 3000 | 
| 14 | Гудович Г.К. | 2240 | 
| 15 | Лаптев С.В. | 1980 | 
| 16 | Титов О.В. | 1860 | 
| 17 | Матвеев В.М. | 3400 | 
| 18 | Сиденко А.В. | 2170 | 
| 19 | Сорокин П.В. | 1830 | 
| 20 | Елисеев Р.Д. | 2440 | 
| 21 | Колбачев А.А. | 2386 | 
| 22 | Сидоров А.С. | 3492 | 
| ИТОГО | 54442 | 
2.Обработка базы данных
Расчет ошибки выборки средней:
для бесповторного отбора:
, (2)
где - ошибка выборки средней;
- дисперсия;
- число единиц выборочной совокупности;
- число единиц генеральной совокупности.
Производим расчет средней по выборочной совокупности по формуле:
(3)
Подставим суммарную зарплату по выборочной совокупности из табл.2 в формулу (3) и число членов выборочной совокупности получаем:
Производим промежуточные расчеты и заносим результаты в табл.3.
Таблица 3.
Промежуточные результаты расчета
| № п/п | |||
| 1 | 1750 | -724,4 | 524755,36 | 
| 2 | 1380 | -1094,6 | 1198149,16 | 
| 3 | 2430 | -44,6 | 1989,16 | 
| 4 | 2300 | -174,6 | 30485,16 | 
| 5 | 1940 | -534,6 | 285797,16 | 
| 6 | 2890 | 415,4 | 172557,16 | 
| 7 | 3220 | 745,4 | 555621,16 | 
| 8 | 3010 | 535,4 | 286653,16 | 
| 9 | 2620 | 145,4 | 21141,16 | 
| 10 | 2754 | 279,4 | 78064,36 | 
| 11 | 2150 | -324,6 | 105365,16 | 
| 12 | 3200 | 725,4 | 526205,16 | 
| 13 | 3000 | 525,4 | 276045,16 | 
| 14 | 2240 | -234,6 | 55037,16 | 
| 15 | 1980 | -494,6 | 244629,16 | 
| 16 | 1860 | -614,6 | 377733,16 | 
| 17 | 3400 | 925,4 | 856365,16 | 
| 18 | 2170 | -304,6 | 92781,16 | 
| 19 | 1830 | -644,6 | 415509,16 | 
| 20 | 2440 | -34,6 | 1197,16 | 
| 21 | 2386 | -88,6 | 7849,96 | 
| 22 | 3492 | 1017,4 | 1035102,76 | 
| Итого | 54442 | 7149033,32 | 
Расчет дисперсии производим по формуле:
(4)
Подставляя данные в формулу (4) из табл.2 (гр.4), получим
3.Расчет предельной ошибки выборки
Методика расчета предельной ошибки выборки приведена в табл.4.
Таблица 4.
Расчет предельной ошибки выборки.
| Методы отбора | Предельные ошибки индивидуального отбора | |
| для средней | для доли | |
| Бесповторный | ||
Для нашего примера предельную ошибку рассчитаем по формуле
(5)
После расчета предельной ошибки выборки находят доверительный интервал для генеральных показателей. Для доверительный интервал определяется по формуле:
(6)
Для доли доверительный интервал определяется по формуле:
(7)
Подставляя результат расчета по формуле (4) в формулы (2) и (5), получаем среднюю и предельную ошибки отклонения:
Подставляя результаты расчета в формулу (7), получаем границы доверительного интервала:
4.Оценка распространения выборочных данных на генеральную 
совокупность
Если средняя заработная плата одного рабочего составляет 2474,6 р., а предельная ошибка выборки 214,8, то, зная численность рабочих цеха = 100, можно установить с принятой вероятностью пределы фонда оплаты их труда.
5. Построение вариационного ряда
Вариационные ряды – это ряды, построенные по количественному признаку. В настоящей работе производится построение вариационного возрастающего ряда. (См. табл.5).
Таблица 5
| 1 | 1380 | 
| 2 | 1750 | 
| 3 | 1830 | 
| 4 | 1860 | 
| 5 | 1940 | 
| 6 | 1980 | 
| 7 | 2150 | 
| 8 | 2170 | 
| 9 | 2240 | 
| 10 | 2300 | 
| 11 | 2386 | 
| 12 | 2430 | 
| 13 | 2440 | 
| 14 | 2620 | 
| 15 | 2754 | 
| 16 | 2890 | 
| 17 | 3000 | 
| 18 | 3010 | 
| 19 | 3200 | 
| 20 | 3220 | 
| 21 | 3400 | 
| 22 | 3492 | 
6. Построение эмпирического графика
График строится по данным возрастающего вариационного ряда. По оси абсцисс откладываются номер по порядку из вариационного ряда. По оси ординат располагается результативный признак, в нашем примере заработанная плата рабочих. (См. рис.1)
Рисунок 1
7. Составление группировки и расчет показателей по группам
Первым шагом при построении группировок является расчет числа групп и величины интервала, на которые будет разбита выборочная совокупность.
Для нахождения числа групп служит формула Стерджеса:
(9)
где n – число групп,
N – число единиц выборочной совокупности.
Получаем: n=5
В случае равных интервалов величина интервала может быть определена следующим образом:
, (10)
где - максимальное значение показателя,
- минимальное значение показателя,
- число групп.
Граничные значения каждой группы определяются следующим образом:
(11)
Таким образом, исходные данные разбиваются на следующие 5 групп:
1) 1380 - 1802,4
2) 1802,4 - 2224,8
3) 2224,8 - 2647,2
4) 2647,2 - 3069,6
5) 3069,6 - 3492
Для каждой группы рассчитываем среднюю величину. Этот расчет осуществляется по формуле:
(12)
где - индивидуальное значение величин, входящих в группу, например, в первую;
n – число единиц, входящих в группу, например, первую.
Индекс по группе рассчитывается по формуле:
(13)
Полученные расчетные данные заносим в табл. 6 и распределяем данные вариационного ряда по полученным группам.
Таблица 6.
Группировка данных
№ гр.  | 
Группа  | 
Повторяемость | Среднее значение по группе | Индекс i  | 
|
| абсолютная, чел. | относительная, % | ||||
| I | 1380-1802,4 | 2 | 10 | 1565 | 0,63 | 
| II | 1802,4-2224,8 | 6 | 30 | 1988,3 | 0,8 | 
| III | 2224,8-2647,2 | 6 | 30 | 2402,6 | 0,97 | 
| IV | 2647,2-3069,6 | 4 | 15 | 2913,5 | 1,17 | 
| V | 3069,6-3492 | 4 | 15 | 3328 | 1,34 | 
| Итого | 22 | 100 | 2474,6 | 1,0 | |
8. Расчет показателей вариации
Для измерения вариации в статистике используют ряд показателей вариации.
Размах вариации.
(14)
Среднее линейное отклонение.
Среднее линейное отклонение представляет собой простейший показатель колеблемости d.
(15)
Дисперсия и среднеквадратическое отклонение.
Дисперсия 
признака определяется на основе среднего квадратического отклонения и характеризует степень рассеяния, разброса данных.
(16)
Таблица 7.
Данные и промежуточные результаты для расчета показателей вариации.
№№ групп  | 
Группа | Абсолютное количество n | |||
| 1 | 1380-1802,4 | 2 | 370 | 136900 | |
| 1380 | 1565 | -185 | 34225 | ||
| 1750 | 185 | 34225 | |||
| 2 | 1802,4-2224,8 | 6 | 686,6 | 471419,56 | |
| 1830 | -158,3 | 25058,89 | |||
| 1860 | -128,3 | 16460,89 | |||
| 1940 | 1988,3 | -48,3 | 2332,89 | ||
| 1980 | -8,3 | 68,89 | |||
| 2150 | 161,7 | 26146,89 | |||
| 2170 | 181,7 | 33014,89 | |||
| 3 | 2224,8-2647,2 | 6 | 564 | 318096 | |
| 2240 | -162,6 | 26438,76 | |||
| 2300 | -102,6 | 10526,76 | |||
| 2386 | 2402,6 | -16,6 | 275,56 | ||
| 2430 | 27,4 | 750,76 | |||
| 2440 | 37,4 | 1398,76 | |||
| 2620 | 217,4 | 47241,02 | |||
| 4 | 2647,2-3069,6 | 4 | 366 | 133956 | |
| 2754 | -159,5 | 25440,25 | |||
| 2890 | 2913,5 | -23,5 | 552,25 | ||
| 3000 | 86,5 | 7482,25 | |||
| 3010 | 96,5 | 9312,25 | |||
| 5 | 3069,6-3492 | 4 | 472 | 222784 | |
| 3200 | -128 | 16384 | |||
| 3220 | 3328 | -108 | 11664 | ||
| 3400 | 72 | 5184 | |||
| 3492 | 164 | 26896 | |||
| Итого | 2459,2 | 1644236 | 
Внутригрупповые дисперсии определяются по формулам:
(17)
где - индивидуальное значение признака в i- группе
- средняя величина признака по i- группе
k - число единиц признаков в группе
Подставляя данные из табл.7 в формулу (17), рассчитаем внутригрупповые дисперсии:
Рассчитаем среднюю из внутригрупповых дисперсий:
: (18)
Межгрупповая дисперсия вычисляется:
Т.об. (19)
общая дисперсия будет равна:
При помощи элементарных преобразований формулы (16), получим формулу для расчета дисперсии методом моментов:
(20)
Рассчитаем среднее квадратическое отклонение по группам и по совокупности:
Общее среднеквадратическое отклонение определяем по этой же формуле:
Коэффициент корреляции рассчитаем по формуле:
(21)
Коэффициент детерминации рассчитаем по формуле:
(22)
K=17.0569
Коэффициент осцилляции или относительный размах Кн.
(23)
где - средняя по группе или по совокупности.
Коэффициент вариации определяется по формуле:
(24)
Библиографический список.
Методические указания к выполнению индивидуального задания по дисциплине «Статистика». Составитель Матвеев Д.Е., редактор Т.М.Курьянова.