|
||||||||||||||||||||||||||||||||||||||||||||||
Основные понятия математической статистикиЛекция Основные понятия математической статистики
Математическая статистика – раздел математики, изучающий математические приемы и методы обработки, систематизации и использования статистических данных для каких либо исследований. Одно из основных понятий математической статистики – понятие совокупности. Совокупности можно разделить на генеральную и выборочную. Генеральная совокупность – вся совокупность однотипных объектов, которая подлежит изучению. Выборочная совокупность (выборка) – совокупность случайно отобранных объектов из генеральной совокупности. Объемом совокупности называют количество элементов этой совокупности. Объем генеральной совокупности обозначают N, а объем выборочной совокупности – n (n < N). После обработки n объектов выборочной совокупности получают n чисел х1, х2, …, хn, которые называются вариантами и образуют ряд вариант или простой статистический ряд. Пусть в вариационном ряду варианта х1 встречается n1 раз, х2 – n2 раз, хk – nk раз. Числа n1, n2, …, nk называются частотами. Также в математической статистике можно столкнуться с понятием относительной частоты, которая находится по формуле: Из этих определений следуют равенства: Статистическим распределением выборки называется соответствие между вариантами и частотами или относительными частотами.
Еще одно важное понятие – эмпирическая функция распределения. Эмпирической функцией распределения называется функция F*(x), которая равна относительной частоте появления события (X < x):
В процессе анализа статистических данных существенную роль играет геометрическая иллюстрация этих данных. Для наглядности строят разные графики статистических распределений, в частности полигон и гистограмму. Полигон частот – ломанная, прямолинейные отрезки которой соединяют соседние точки (xi;ni) (i = 1, 2, …, k). Для построения полигона на оси абсцисс откладывают варианты xi, а на оси ординат – соответствующие им частоты. Полигон относительных частот – ломанная, прямолинейные отрезки которой соединяют соседние точки (xi;wi) (i = 1, 2, …, k). Для построения полигона на оси абсцисс откладывают варианты xi, а на оси ординат – соответствующие им относительные частоты. Гистограмма частот (относительных частот) – ступенчатая фигура, состоящая из прямоугольников с основанием – частичными интервалами длины h и высотами . Построение статистических распределений выборки и их графическое изображение – это только первый шаг на пути решения задач математической статистики. Следующий шаг предусматривает нахождение числовых характеристик, которые в компактной форме выражают наиболее существенные особенности статистического распределения и служат оценками (приближенными значениями) неизвестных параметров распределения количественного признака генеральной совокупности. Одна из таких характеристик – средняя выборочная. Средняя выборочная (средняя арифметическая вариант) статистического распределения определяется по формуле Если все n вариант разные, то формула приобретает такой вид: Пример. Из группы заводов одной из областей России случайным образом отобрано 30, по которым получены показатели основных фондов в миллионах рублей: 1, 2, 1, 3, 4, 1, 2, 2, 5, 3, 4, 3, 5, 4, 2, 3, 1, 3, 2, 2, 4, 3, 5, 3, 4, 2, 3, 2, 1, 3. 1. Определить объем выборки. 2. Составить статистическое распределение частот и относительных частот. 3. Составить распределение относительных частот. 4. Составить эмпирическую функцию распределения и построить ее график. 5. Построить полигон частот.
Решение Объем выборки n = 30. Данный ряд вариант запишем в виде вариационного ряда: 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 5, 5, 5. Варианты: х1 = 1, х2 = 2, х3 = 3, х4 = 4, х5 = 5. Частоты: n1 = 5, n2 = 8, n3 = 9, n4 = 5, n5 = 3. В итоге получается статистическое распределение частот:
Контроль: По формуле последовательно вычисляем относительные частоты: w1 = , w2 = , w3 = , w4 = , w5 = . Таким образом, статистическое распределение относительных частот имеет вид:
Построим эмпирическую функцию распределения. Если , тогда нет ни одной варианты, меньшей от х, то есть и F*(x) = 0. Пусть . Тогда варианта х = 2 является меньшей от х, поэтому . Если х удовлетворяет двойному неравенству , тогда меньшими от х являются варианты 1, 2, сумма относительных частот которых . Поэтому для (1; 2] . Если х таково, что выполняется двойное неравенство , тогда меньшими от х являются варианты 1, 2, 3, сумма относительных частот которых . Поэтому для (2; 3] . Аналогично находим значение F*(x) для интервалов (3; 4], (4; 5], (6;+ ). Таким образом, получаем:
Построим график эмпирической функции распределения:
Построим полигон частот:
|
||||||||||||||||||||||||||||||||||||||||||||||
|