При расчете ошибок возникает существенное затруднение: величины и p по генеральной совокупности неизвестны. Эти величины в условиях большой выборки заменяют величинами S (выборочная дисперсия) и w (выборочная доля), рассчитанными по выборочным данным. В таблице 7.3 приведены формулы расчета ошибок простой случайной выборки.
Таблица 7.3
|
Способ отбора единиц | |
повторный | бесповторный | |
Средняя ошибка для средней | ||
для доли | ||
Предельная ошибка для средней | ||
для доли |
Формулы предельной ошибки позволяют решать задачи трех видов:
1. Определение пределов генеральных характеристик с заданной степенью надежности (доверительной вероятностью) на основе показателей, полученных по данным выборки.
Доверительные интервалы для генеральной средней:
(7.1)
Доверительные интервалы для генеральной доли:
(7.2)
2. Определение доверительной вероятности того, что генеральная характеристика может отличаться от выборочной не более чем на определенную заданную величину.
Доверительная вероятность является функцией от t, определяемой по формуле: (7.3).
По величине t определяется доверительная вероятность.
3. Определение необходимого объема выборки, который с практической вероятностью обеспечивает заданную точность выборки (таблица 7.4).
Таблица 7.4
|
Способ отбора единиц | |
повторный | бесповторный | |
Численность выборки для средней | ||
для доли |
Механическая выборка - заключается в отборе единиц из генеральной совокупности через равные промежутки времени из определенного расположения их в генеральной совокупности, например, по алфавиту (из генеральной совокупности, разбитой на равные интервалы (группы)). При этом размер интервала в генеральной совокупности равен обратной величине доли выборки.
Типическая выборка -генеральная совокупность вначале расчленяется на однородные типические группы. Затем из каждой типической группы собственно-случайной или механической выборкой производится индивидуальный отбор единиц в выборочную совокупность.
Общее число единиц выборочной совокупности распределяется между группами пропорционально численности групп в составе генеральной совокупности. Такой отбор называется пропорциональным.
N – общая численность единиц в генеральной совокупности
, где
- численность отдельных групп генеральной совокупности,
n – общий объем выборочной совокупности.
Объем выборки для каждой группы:
(7.4), где - удельный вес данной группы в генеральной совокупности.
Кроме пропорционального размещения по группам численности единиц выборочной совокупности применяется так называемое оптимальное размещение, при котором число наблюдений в группе определяется по формуле:
(7.5).
В таблице 7.5 приведены формулы для расчета ошибок, где приняты следующие условные обозначения:
- средняя групповая выборочная дисперсия средней;
(7.6);
- внутригрупповая дисперсия данной (i-ой) группы в выборочной совокупности;
- средняя групповая выборочная дисперсия доли;
(7.7).
Предельная (максимально возможная) ошибка типической выборки:
;
Таблица 7.5
|
Способ отбора единиц | |
повторный | бесповторный | |
Средняя ошибка при пропорциональном размещении единиц для средней | ||
для доли | ||
Средняя ошибка при оптимальном размещении единиц для средней | ||
для доли |
Серийный или гнездовой отбор -это случайный выбор групп единиц с последующим сплошным наблюдением внутри отобранных серий.
В таблице 7.6 приведены формулы для расчета ошибок, где приняты следующие условные обозначения:
- межгрупповая выборочная дисперсия средней;
(7.8),
Где - средний уровень признака в серии;
- средний уровень признака для всей выборочной совокупности;
- число равных серий в выборочной совокупности;
- число равных серий в генеральной совокупности;
- межгрупповая выборочная дисперсия доли;
(7.9),
где - доля единиц, обладающих данным признаком в серии;
- доля единиц, обладающих данным признаком во всей выборочной совокупности.
Таблица 7.6
|
Способ отбора единиц | |
повторный | бесповторный | |
Средняя ошибка для средней | ||
для доли |
Комбинированный отбор -предполагает использование нескольких способов выборки. Можно комбинировать, например, серийную выборку и случайную. В этом случае, разбив генеральную совокупность на серии (группы) и отобрав нужное число серий, производят случайную выборку единиц в серии. Такая комбинированная выборку может быть повторной и бесповторной.
Средняя ошибка определяется по формуле:
При повторном отборе: (7.10)
При бесповторном отборе: (7.11).
Выборочный метод чаще всего применяется для получения характеристик генеральной совокупности по соответствующим показателям выборки. В зависимости от целей исследований это осуществляется или прямым пересчётом показателей выборки для генеральной совокупности, или посредством расчёта поправочных коэффициентов.
Решение типовых задач
7.1. На основе выборочного обследования 600 рабочих одной из отраслей промышленности установлено, что удельный вес женщин составил 0,4.
С какой вероятностью можно утверждать, что при определении доли женщин, занятых в этой отрасли, допущена ошибка ( ), не превышающая 5%?
Решение
Чтобы определить вероятность допуска той или иной ошибки, из формулы ( ) находим показатель t, связанный с вероятностью.
По условию задачи известны: объем выборки n=600; доля w=0,4.
По таблице значений F(t) для t=2,5 находим, что Р=0,988. То есть с вероятностью 0,988 можно утверждать, что при определении доли женщин (0,4) в общем числе рабочих допущена ошибка не более 0,05 (5%).
7.2.Из партии электроламп взята 20%-ная случайная бесповторная выборка для определения среднего веса спирали. Результаты выборки представлены в таблице 7.7.
Таблица 7.7
Вес, мг | 38-40 | 40-42 | 42-44 | 44-46 |
Число спиралей |
Определить с вероятностью 0,95 доверительные пределы, в которых лежит средний вес спирали, для всей партии электроламп.
Решение
Доверительные интервалы для генеральной средней с вероятностью Р:
.
.
; ; .
При вероятности Р=0,95, t=1,96 (по таблице значений F(t).
Доверительные интервалы для генеральной средней с вероятностью 0,95:
;
7.3.По городской телефонной сети в порядке случайной выборки (механический отбор) произвели 100 наблюдений и установили среднюю продолжительность одного телефонного разговора 5 мин. При среднем квадратическом отклонении 2 мин. Какова вероятность того, что ошибка репрезентативности при определении средней продолжительности телефонного разговора не превысит 18 сек.?
Решение
По условию задачи известны: объем выборки n=100; выборочная средняя =5мин.; выборочное среднее квадратическое отклонение S = 2 мин.; предельная ошибка выборки =18 сек.=0,3мин.
; .
Затем по таблице значений F(t) для t=1,5 находим, что вероятность равна 0,866.
Практикующие упражнения
7.4.Среди выборочно обследованных 100 семей региона по уровню душевого дохода (выборка 2%-ная, механическая) малообеспеченных оказалось 300 семей. Требуется с вероятностью 0,997 определить долю малообеспеченных семей во всем регионе.
7.5.Для определения среднего возраста 1200 студентов факультета необходимо провести выборочное обследование методом случайного бесповторного отбора. Предварительно установлено, что среднее квадратическое отклонение возраста студентов равно 10 годом.
Сколько студентов нужно обследовать, чтобы с вероятностью 0,954 средняя ошибка выборки не превышала 3 года?
7.6.На основе выборочного обследования в отделении связи города предполагается определить долю писем частных лиц в общем объеме отправляемой корреспонденции. Никаких предварительных данных об удельном весе этих писем в общей массе отправляемой корреспонденции не имеется.
Определить численность выборки, если результаты выборки дать с точностью до 1% и гарантировать это с вероятностью 0,95.
7.7.На предприятии в порядке случайной бесповторной выборки было опрошено 100 рабочих из 1000 и получены следующие данные об их доходе за месяц (таблица 7.8):
Таблица 7.8
Месячный доход, руб. | 1200-2000 | 2000-2800 | 2800-3600 | 3600-4400 |
Число рабочих |
Определить:
1) среднемесячный размер дохода у работников данного предприятия, гарантируя результат с вероятностью 0,997;
2) долю рабочих предприятия, имеющих месячный доход 2800 руб. и выше, гарантируя результат с вероятностью 0,954;
3) необходимую численность выборки при определении среднего месячного дохода работников предприятия, чтобы с вероятностью 0,954 предельная ошибка выборки не превышала 100 руб.;
4) необходимую численность выборки при определении доли рабочих с размером месячного дохода 2800 руб. и выше, чтобы с вероятностью 0,954 предельная ошибка не превышала 4%.
7.8.Операция шлифования при обработке детали производится в цехе на трех станках. Для определения процента брака для всей партии продукции, выработанной за день, проведена типическая 10%-ная выборка. Отбор деталей из выработки каждого станка – случайный бесповторный; объем выборки пропорционален размеру выпуска. На первом станке было обработано 1700 деталей, на втором – 2000, на третьем – 1800. Число забракованных изделий в выборке: по первому станку – 2, по второму – 3, по третьему – 3.
Определить:
1) доверительные интервалы, в которых с вероятностью 0,95 заключен процент брака для всей партии продукции;
2) вероятность того, что процент брака для всей партии продукции отличается от полученного по выборке не более чем на 0,6%.
7.9.При контрольной проверке качества проведено 5%-ное выборочное обследование партии деталей. При этом из 100 отобранных в выборку деталей 90 оказались соответствующими требованиям стандарта. Средний вес одной детали в выборке составил 50 г., среднее квадратическое отклонение равно 1,5 г.
Определить:
1) с вероятностью 0,954 возможные значения доли стандартных изделий и среднего веса одной детали во всей партии;
2) объем случайной бесповторной выборки, чтобы с вероятностью 0,997 предельная ошибка при определении среднего веса детали для всей партии не превышала 0,1 г.;
3) объем случайной бесповторной выборки, чтобы с вероятностью 0,997 предельная ошибка при определении среднего доли стандартных деталей для всей партии не превышала 1%.
7.10.Для изучения стажа работников проведена 1%-ная механическая выборка, результаты которой представлены в таблице 7.9:
Таблица 7.9
Группы работников по стажу, лет | До3 | 3-5 | 5-7 | 7-9 | Свыше 9 |
Выборочная численность, чел. |
По данным обследования определить:
1) средний стаж работы;
2) пределы, в которых с вероятностью 0,997 находится средний стаж работников;
3) пределы, в которых с вероятностью 0,997 находится доля предпринимателей со стажем свыше 7 лет.
|
© helpiks.su При использовании или копировании материалов прямая ссылка на сайт обязательна.
|
|