Хелпикс

Главная

Контакты

Случайная статья





Основные понятия математической статистики



Лекция

Основные понятия математической статистики

 

Математическая статистика – раздел математики, изучающий математические приемы и методы обработки, систематизации и использования статистических данных для каких либо исследований.

Одно из основных понятий математической статистики – понятие совокупности. Совокупности можно разделить на генеральную и выборочную.

Генеральная совокупность – вся совокупность однотипных объектов, которая подлежит изучению.

Выборочная совокупность (выборка) – совокупность случайно отобранных объектов из генеральной совокупности.

Объемом совокупности называют количество элементов этой совокупности.

Объем генеральной совокупности обозначают N, а объем выборочной совокупности – n (n < N).

После обработки n объектов выборочной совокупности получают n чисел х1, х2, …, хn, которые называются вариантами и образуют ряд вариант или простой статистический ряд.

Пусть в вариационном ряду варианта х1 встречается n1 раз, х2n2 раз, хknk раз.

Числа n1, n2, …, nk называются частотами.

Также в математической статистике можно столкнуться с понятием относительной частоты, которая находится по формуле:

Из этих определений следуют равенства:

Статистическим распределением выборки называется соответствие между вариантами и частотами или относительными частотами.

 

xi x1 x2 xk
ni x1 x2 xk

 

 

xi x1 x2 xk
wi

 

Еще одно важное понятие – эмпирическая функция распределения.

Эмпирической функцией распределения называется функция F*(x), которая равна относительной частоте появления события (X < x):

 

 

В процессе анализа статистических данных существенную роль играет геометрическая иллюстрация этих данных. Для наглядности строят разные графики статистических распределений, в частности полигон и гистограмму.

Полигон частот – ломанная, прямолинейные отрезки которой соединяют соседние точки (xi;ni) (i = 1, 2, …, k). Для построения полигона на оси абсцисс откладывают варианты xi, а на оси ординат – соответствующие им частоты.

Полигон относительных частот – ломанная, прямолинейные отрезки которой соединяют соседние точки (xi;wi) (i = 1, 2, …, k). Для построения полигона на оси абсцисс откладывают варианты xi, а на оси ординат – соответствующие им относительные частоты.

Гистограмма частот (относительных частот) – ступенчатая фигура, состоящая из прямоугольников с основанием – частичными интервалами длины h и высотами .

Построение статистических распределений выборки и их графическое изображение – это только первый шаг на пути решения задач математической статистики. Следующий шаг предусматривает нахождение числовых характеристик, которые в компактной форме выражают наиболее существенные особенности статистического распределения и служат оценками (приближенными значениями) неизвестных параметров распределения количественного признака генеральной совокупности.

Одна из таких характеристик – средняя выборочная.

Средняя выборочная (средняя арифметическая вариант) статистического распределения определяется по формуле

Если все n вариант разные, то формула приобретает такой вид:

Пример. Из группы заводов одной из областей России случайным образом отобрано 30, по которым получены показатели основных фондов в миллионах рублей: 1, 2, 1, 3, 4, 1, 2, 2, 5, 3, 4, 3, 5, 4, 2, 3, 1, 3, 2, 2, 4, 3, 5, 3, 4, 2, 3, 2, 1, 3.

1. Определить объем выборки.

2. Составить статистическое распределение частот и относительных частот.

3. Составить распределение относительных частот.

4. Составить эмпирическую функцию распределения и построить ее график.

5. Построить полигон частот.

 

Решение

Объем выборки n = 30.

Данный ряд вариант запишем в виде вариационного ряда: 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 5, 5, 5.

Варианты: х1 = 1, х2 = 2, х3 = 3, х4 = 4, х5 = 5.

Частоты: n1 = 5, n2 = 8, n3 = 9, n4 = 5, n5 = 3.

В итоге получается статистическое распределение частот:

 

xi
ni

 

Контроль:

По формуле  последовательно вычисляем относительные частоты: w1 = , w2 = , w3 = , w4 = , w5 = .

Таким образом, статистическое распределение относительных частот имеет вид:

 

xi
wi

 

Построим эмпирическую функцию распределения.

Если , тогда нет ни одной варианты, меньшей от х, то есть  и F*(x) = 0.

Пусть . Тогда варианта х = 2 является меньшей от х, поэтому .

Если х удовлетворяет двойному неравенству , тогда меньшими от х являются варианты 1, 2, сумма относительных частот которых . Поэтому для (1; 2] .

Если х таково, что выполняется двойное неравенство , тогда меньшими от х являются варианты 1, 2, 3, сумма относительных частот которых . Поэтому для (2; 3] .

Аналогично находим значение F*(x) для интервалов (3; 4], (4; 5], (6;+ ).

Таким образом, получаем:

 

Построим график эмпирической функции распределения:

 

 

Построим полигон частот:

 



  

© helpiks.su При использовании или копировании материалов прямая ссылка на сайт обязательна.