![]()
|
|||||||
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА. Лекция 3Стр 1 из 2Следующая ⇒ МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Лекция 3 §4 Достаточные статистики
4.1. Предварительные соображения и определение Достаточная статистика — понятие фундаментальное. Часто возникает следующий вопрос. Имеется большая совокупность ξ = (ξ1, ξ2 … ξn) наблюдений случайного характера, по которой нужно делать какие-либо выводы относительно чего-то неизвестного; обозначим это неизвестное через a. можно ли сжать информацию, то есть хранить меньший объем данных, не потеряв при этом информацию об a? Простейший пример: неизвестная вероятность события, n раз испытываем, получаем n наблюдений. Можно ли оставить только число успехов. Или мы при этом потеряем информацию? Чтобы раэобраться, сначала ответим на предварительный вопрос: нужны ли нам наблюдения x, если распределение px(x) для x от a не зависит? меняется, а закон распределения остается одним и тем же. ответ очевиден: наблюдения x не нужны, наблюдения x можем не хранить. Следующий вопрос: имеется две совокупности наблюдений x и t. Известно, что распределение pt(t,a) для t зависит от a; также известно, что условное распределение x при условии известного значения t от a не зависит. Нужны ли нам в этом случае наблюдения x? Ответ очевиден: нет, не нужны, мы можем сжать информацию, выбросив x и оставив только t, поскольку распределение pt(t,a) зависит от a. Пусть ξ ≡ (ξ1, ξ2 … ξn) — вектор наблюдений, принимающий значения x ≡ (x1, x2…xn) и распределенный по закону
Пусть есть функция обозначим через Теперь имеем пару случайных величин xиt. При дальнейших рассуждениях полагаем случайную величину xдискретной (следовательно, t - тоже). Запишем закон распределения для пары; по формуле умножения вероятностей имеем:
Однако ясно, что слева написано распределение x, т.к. из события
В результате имеем соотношение
Т.е. распределение для всей совокупности x есть произведение распределения статистики Пусть второй сомножитель Это означает, что значение x ничего не добавляет к знаниям о параметре a, полученным на основании статистики Если x непрерывна, то рассуждения остаются справедливыми, нужно лишь в (1) вероятности заменить на плотности
Отсюда для условного распределения имеем
Если условное распределение x при известном Определение. Статистика Практический смысл достаточной статистики состоит в том, что любые статистические выводы о неизвестном параметре a можно делать без ущерба для качества, основываясь не на всех исходных данных, а только на достаточной статистике. Верно очевидное утверждение, что для любого способа Тривиальный эквивалентный способ состоит в следующем: по исходным наблюдениям x вычисляем достаточную статистику мы берем генератор случайных чисел и генерируем с.в. x’ с этим законом. При этом распределения для x’ и x совпадают. Применим исходную процедуру d к x’,
Пример 1. Пусть для определения параметра l некоторого однородного пуассоновского потока (например, источника радиоактивного излучения) На языке математической статистики это означает, что имеется Для ответа на этот вопрос нужно определить условную вероятность (3) получения значений х1, х2…хn при условии, что их суммарное значение известно и равно
В приведенной выкладке учтено, что сумма Поскольку условная вероятность (4) от Полезно отметить, что распределение (4) является полиномиальным с равными вероятностями Действительно, на отрезок, состоящий из n промежутков длиной вероятность попадания Вставить напоминание о полиномиальном распр-нии Эта полиномиальная вероятность равна правой части равенства (4). Мы получили важный результат для теории вероятностей: Утверждение. Для простейшего потока при известном числе точек на отрезке, положения точек независимы и равномерно распределены. Это утверждение можно использовать при генерации (при моделировании) простейшего потока событий. Итак, на числовой оси (удобно, но не обязательно, воспринимать ее как временнУю ось) нужно разбросать точки пуассоновского потока. Это можно сделать, по меньшей мере, двумя путями. Первый. Известно, что если l- параметр потока, то расстояние между соседними точками – случайная величина, распределенная по показательному закону с параметром l, и нужно последовательно генерировать эти случайные величины. Второй. пусть Т – длина отрезка, на котором нужно сгенерировать поток. Общее число n точек на Т - случайная величина, распределенная по закону Пуассона с параметром а = l Т. Сгенерируем n, получим некоторое целое n, а затем раскидаем независимо n точек на отрезке [0,T] с равномерным законом распределения
|
|||||||
|