|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Техника расчета 4 страницаВ границах ± 4S имеется 2j = 2 0,49997 = 0,99994, или 99,94% всех дат, и только 0,06% вне их. В дальнейшем применяется показатель "t", указывающий, на сколько средних квадратических отклонений данная величина отличается от средней. Этот показатель называется нормированным отклонением и рассчитывается по формуле: t = . Доли особей, находящиеся в пределах ± tS (t = 1,2,3,4), указывают на ту вероятность, с которой взятая наугад особь будет иметь значение признака, отличающееся от средней не более чем на tS, или любая средняя будет больше или меньше генеральной средней не более чем на t . Это предположение допускается во всех случаях при определении выборочных показателей и имеет характер основной гипотезы всякого биометрического исследования. Определение любого биометрического показателя невозможно без предварительного установления условных границ вероятности того, что взятая наугад дата окажется в заданных пределах. Эта гипотеза применяется при определении достоверности разности двух выборочных величин, достоверности коэффициента корреляции и т.д. Данные таблицы 16 показывают, что 68,3% вероятности того, что в интервале ± 1S может быть заключена генеральная средняя, является сравнительно невысоким уровнем: вероятность ошибки здесь составляет 1 случай из 3. С большей уверенностью можно утверждать, что генеральная средняя покрывается интервалом ± 2S, так как вероятность здесь равна 95,4%, возможность ошибки - 1 случай из 22. При интервале в ± 3S практически можно быть уверенным в правильности суждения, поскольку возможность ошибки здесь достаточно мала - 1 случай из 370 возможных. Фактически все распределение полностью укладывается в пределах ± 4S, вероятность правильного суждения здесь 99,9936%, возможность ошибки составляет всего 1 случай на 15625 возможных. Таблица 16 Вероятность (Р) нахождения любой даты в пределах ± tS
Как видно, вероятность отклонения от средней величины более чем на 3S очень мала. Эта закономерность обосновывает правило трех сигм. Три величины стандартного отклонения (три сигмы) как бы ограничивают пределы случайного рассеяния внутри вариационного ряда. То, что находится в пределах ±3S, относится к данному вариационному ряду, то, что за этими пределами, вероятнее всего к нему не относится. Чем выше требования к вероятности вывода, тем шире должен быть интервал, который может обеспечить ее достоверность. Уровень этой вероятности принято называть доверительной вероятностью, или надежностью. В настоящее время применяются три степени вероятности того, что заключение о границах, вмещающих все распределения, будет достоверным. Для удобства работы применяют "круглые" числа: 1 уровень - 95% 2 уровень - 99% 3 уровень - 99,9% . В этих случаях границы доверительного интервала составляют соответственно: ± 1,96S ± 2,58S ± 3,30S . Обычно значения показателей вероятности обозначаются через Р (Probability), соответственно чему делаются записи при указании уровней вероятности или уровней значимости: P ³ 0,95 или P ≤ 0,05 P ³ 0,99 или P ≤ 0,01 P ³ 0,999 или P ≤ 0,001 . Определенному значению вероятности соответствует уровень значимости. Так, вероятности 0,95 (95%) соответствует уровень значимости 0,05 (5%), вероятности 0,99 (99%) - уровень значимости 0,01 (1%). Уровень значимости показывает, с какой вероятностью возможна ошибка в результатах опыта. В научных публикациях при оценке достоверности результата может указываться или уровень вероятности, или уровень значимости. Какой уровень вероятности может считаться достаточным при оценке результатов исследования? В каких случаях можно довольствоваться одним уровнем и когда требуется более высокий уровень вероятности суждения? Первый уровень вероятности, соответствующий 95% доверительному интервалу (Р³0,95), считается достаточно надежным для оценки результатов большинства биологических исследований (общая биология, цитология, физиология, генетика, ботаника, зоология, зоотехния, ветеринария, медицина). В этом случае t уровень равен 1,96, выборочная средняя от генеральной отличается не более чем на 2 . Вероятность ошибки 1:20 считается допустимой. Большую вероятность ошибки, как, например, 1:10 при Р ³ 0,90, в этих исследованиях допускать не следует. Второй уровень вероятности в 99% (Р³0,99) требуется в экономических исследованиях, связанных с затратами труда и денежных средств. В этом случае допускается возможность ошибки 1:100, t=2,58, выборочная средняя отличается от генеральной не более чем на 2,58× . Этот уровень вероятности применяется также при повторных биологических исследованиях, если предшествующие эксперименты вызывают сомнения и требуют уточнения. Третий уровень вероятности Р³0,999, соответствующий 99,9% уровню вероятности безошибочного суждения, отвечает самым высоким требованиям надежности результатов эксперимента. В этом случае возможность ошибки составляет всего лишь 1:1000. Такая высокая степень вероятности требуется при особо ответственных работах, а именно: в экспериментах с вредными и ядовитыми веществами, при проверке спорных теоретических вопросов и др. Указанные выше взаимосвязи показателей t и соответствующих степеней вероятности справедливы в исследованиях на достаточно многочисленных выборках. Если же в исследованиях взята небольшая, малочисленная выборка, то распределение выборочных величин достаточно сильно отличается от нормального, а значит, не подчиняется закономерностям нормального распределения. В таких случаях оно следует закону распределения малых выборок, установленному английским ученым В.Госсетом (1876-1937), подписывавшим свои работы псевдонимом Student (Стьюдент). Распределение Стьюдента отличается от нормального тем больше, чем меньше объем изучаемой выборки. Значения величины t для трех степеней вероятности и для любого объема выборки приводятся в таблице 17 значений критерия Стьюдента. Таблица 17 Таблица значений критерия t (критерия Стьюдента)
Таким образом, для каждого значения численности выборки определяется своя величина t для трех степеней вероятности. Например, для степени вероятности Р = 0,95 при численности выборки n = 30 (и больше) показатель t = 2,0. При n = 10 t = 2,3; при n = 3 показатель вероятности t = 4,3, а при n = 2 t = 12,7. При использовании этой таблицы для нахождения соответствующего значения критерия t необходимо брать ту строку, которая соответствует числу степеней свободы, т. е. числу n - 1, если n -численность выборки.
ДОВЕРИТЕЛЬНЫЕ ГРАНИЦЫ ГЕНЕРАЛЬНОЙ СРЕДНЕЙ. ДОСТОВЕРНОСТЬ РАЗНОСТИ ДВУХ ВЫБОРОЧНЫХ СРЕДНИХ ВЕЛИЧИН И ДВУХ ДОЛЕЙ Доверительные границы генеральной средней Для того чтобы определить, чему равняется генеральная средняя величина, рассчитываются два возможных ее значения - минимальное и максимальное. Крайние значения, в пределах которых может находиться генеральная средняя, называются генеральными границами. При расчете этих границ исходят из того, что генеральная величина может отстоять от выборочной величины (например, генеральная средняя арифметическая от выборочной средней арифметической) не более чем на величину t-кратной ошибки репрезентативности выборочного показателя. При этом величина t устанавливается в зависимости от следующих условий: а) ответственности исследования - I, II, III уровни вероятности; б) объема выборки: при малом числе показателей, отобранных в выборку, t устанавливается по таблице Стьюдента. Применяется формула = ± t . Это значит, что величина генеральной средней может иметь следующие значения: не менее – t и не более + t . Пример. В птичнике методом механического отбора отобрано 60 яиц и произведено их взвешивание. Получены следующие данные, характеризующие эту выборку: = 57,14 г; S = 4,58; = 0,59. На основе этих данных можно сделать заключение, какова средняя масса яйца в этом птичнике в данный период, т. е. чему равна генеральная средняя по массе яйца в этом птичнике: = ± tSх для Р ³ 0,95 и n = 60 показатель t = 2.0. = 57,14 ± 2 ´0,59 = 57,14 ± 1,18 = 55,96 : 58,32 56 ¸ 58 Это значит, что средняя величина яйца по всему птичнику лежит в пределах от 56 до 58 г. Пример. При нарушении кальциевого питания кур-несушек в их организме произошли изменения минерального обмена, а вследствие этого изменения в костяке. Изменения, произошедшие в скелете, определялись (в целях диагностики) измерением толщины стенки бедренной кости. Обследовано 23 больные курицы и (для контроля) 8 здоровых. Получены следующие данные: для больной птицы 1 = 0,68 мм; = 0,055 мм для здоровой птицы 2 = 1,71 мм; = 0,159 мм . При Р³0,95 находим по таблице Стьюдента t1 = 2,1 и t2 = 2,3. Рассчитываем генеральные параметры: для больной птицы: 1 = 0,68 ± 2,1´0,055 = 0,68 ± 0,115 1 =0,565 ¸ 0,795; 0,56 ¸ 0,80 для здоровой птицы: 2 = 1,71 ± 2,3´0,159 = 1,71 ± 0,366 2 = 1,344 ¸ 2,076; 1,34 ¸ 2,1 . Несмотря на очень широкие пределы генеральной средней, что обусловлено малым объемом выборки (особенно для здоровой птицы), измерение толщины стенки бедренной кости оказалось достоверным объективным показателем, отражающим состояние минерального обмена в организме птицы. На основании полученных данных можно сказать, что у здоровой птицы средняя толщина стенки бедренной кости должна быть не менее 1,34 мм, у больной она не превышает 0,80 мм. Достоверность разности двух средних величин В научных исследованиях очень часто необходимо сравнивать две (или больше) арифметические средние величины. Это сравнение достигается определением разности двух величин: D = 1 - 2. При статистическом анализе важно получить ответ на вопрос: насколько разность выборочных средних правильно отражает различие соответствующих генеральных средних, или насколько достоверна выборочная разность? Достоверность выборочной разности измеряется особым показателем достоверности разности - td. Критерий достоверности разности средних рассчитывается по формуле: td = , где 1 - 2 - разность средних величин; - ошибка разности средних. Критерий td не имеет знака, следовательно, знак разности средних во внимание не принимается. Каждая выборочная средняя имеет свою ошибку репрезентативности, поэтому разность между ними тоже имеет свою ошибку репрезентативности. Определение достоверности выборочной разности с практической точки зрения сводится к вопросу обобщения результатов, полученных в эксперименте, т. е. насколько возможно полученные в выборке данные перенести на генеральные совокупности. Как видно из формулы, достоверность выборочной разности определяется ее отношением к собственной ошибке. Разность считается достоверной (значимой), если критерий достоверности разности (td) равен или превышает принятый в исследовании показатель вероятности безошибочного суждения (по таблице значений критерия Стьюдента): td ³ td 0,95 - I уровень вероятности или td ³ td 0,99 - II уровень вероятности или td ³ td 0,999 - III уровень вероятности. Полученные в этих расчетах результаты можно разделить на две категории. 1. При td ³ td st разность достоверна (значима). Это значит, что выводы, полученные в выборочной разности, можно перенести на генеральную разность. Иными словами, если средняя величина первой выборочной больше средней величины второй выборочной, то средняя всей первой генеральной совокупности больше средней второй генеральной совокупности. 2. При td < td st разность недостоверна. Это значит, что выводы, полученные при сравнении выборочных средних, нельзя перенести на соответствующие генеральные совокупности. При этом важно понять, что отсутствие достоверности выборочных величин не позволяет сделать никаких определенных выводов - ни о наличии, ни об отсутствии различий между соответствующими генеральными средними величинами. Разность может быть недостоверной либо вследствие недостаточного объема изучаемой выборки, либо из-за отсутствия разницы между изучаемыми генеральными совокупностями. Пример. В эксперименте изучалось действие добавок в кормосмеси птицы кальция и витамина С на толщину скорлупы яиц. Группа I получила в рационе 3,1% кальция, группа II – 4,1% кальция и 50 мг витамина С на 1 кг кормосмеси. Для исследования брались выборки по 40 яиц в каждой группе. Скорлупа измерялась в трех точках яйца - по экватору, в тупом и остром конце, за основу принимались средние величины. Получены следующие данные: в I группе: 1= 0,3216 мм; = 0,00364; n1 = 40 во II группе: 2= 0,3461 мм; = 0,00317; n2 = 40 td 1-2 = ; td 1-2 = = = = 5,05; td 1-2 = 5,05 Число степеней свободы n = n1 + n2 – 2 . Следует обратить внимание на то, что в данном случае при определении числа степеней свободы вычитается величина 2. Это определяется тем, что число степеней свободы рассчитывается для двух средних арифметических, следовательно, имеется два (элемента) ограничения свободного разнообразия. Продолжая расчет, находим: n = 40 + 40 – 2 = 78. Согласно таблице критерия Стьюдента при n = 78: t0,95 = 2,0 t0,99 = 2,6 t0,999 = 3,4 или tst = 2,0 - 2,6 - 3,4 . Полученное в расчете значение td больше, чем t0,999 по таблице Стьюдента, т. е. td > t0,999, так как 5,05 > 3,4. Это говорит о том, что в эксперименте имеется достоверное увеличение толщины скорлупы при III уровне достоверности (Р³0,999). Значит, в аналогичных условиях содержания птицы указанный уровень кальция и витамина С всегда обеспечит увеличение толщины скорлупы яйца. При отсутствии таблицы можно исходить из правила трех сигм: если разница средних превышает ошибку разности почти в три раза, она достоверна с вероятностью не менее 0, 99. Выборочные доли и достоверность их разности В зоотехнических исследованиях нередко приходится иметь дело с таким материалом, когда весь объем изучаемой выборки распределяется на две части по наличию или отсутствию у изучаемых объектов того или иного признака. Такие признаки называются качественными, или альтернативными. В частности, при инкубировании партии яиц из одной части выводятся цыплята, из другой нет. Таким образом, заложенная в инкубатор партия яиц разделяется на две доли, которые могут быть выражены в процентах. Для выборочной доли можно рассчитать ошибку репрезентативности. Основываясь на свойствах выборочной доли, можно рассчитать достоверность разности двух выборочных долей, в частности, достоверность процента выводимости из двух сравниваемых партий яиц. При расчете принимаются следующие обозначения: р - доля объектов, обладающих признаком; q = 1 - р - доля объектов, не обладающих изучаемым признаком. Квадратическое отклонение доли S = . Особенность квадра-тического отклонения доли заключается в том, что оно никогда не бывает больше 0,5, т.е. Smax = 0,5. Ошибка репрезентативности доли находится из основной формулы ошибки: Sp = = = ; Sp = . При определении достоверности разности двух долей применяется формула критерия достоверности разности: td = , где d = p1 – p2 - разность долей; Sd = = - ошибка разности долей. Критерий достоверности разности двух долей составляет: td = Уровень достоверности разности долей определяется сопоставлением полученного значения td со значениями критерия по таблице Стьюдента, соответствующими трем степеням вероятности безошибочного суждения (Р1= 0,95; Р2= 0,99; P3 = 0,999). Число степеней свободы определяется как n1 + n2 - 2, где n1 и n2 - число всех определений в каждой выборке. Пример. С целью определения влияния продолжительности хранения инкубационных яиц в условиях тропического лета на выводимость цыплят проведено сравнительное инкубирование двух партий яиц. Яйца первой партии до закладки в инкубатор хранились при температуре +30.. +32°С в течение четырех суток. Яйца второй партии находились в аналогичных условиях только одни сутки. От первой партии заложено в инкубатор 134 яйца, вывелось 106 цыплят I категории, процент выводимости – 80,6%. От второй партии заложено в инкубатор 162 яйца, вывелось 148 цыплят I категории, процент выводимости составил 91,4%. Какова достоверность разности между выводимостью первой и второй партий яиц? Доли составляют p1 = 0,806 и q1 =0,194 для первой и p2 = 0,914 и q2 = 0,086 для второй партии. Для обеих партий яиц находим квадраты ошибок репрезентативности: = = = 0,0011; = 0,0011 = = = 0,00048; = 0,00048 . Разность двух долей составляет р1 – p2 = 0,914 – 0,806 = 0,108. Подставляем полученные значения в формулу td - критерия: td = = = 2,72. Число степеней свободы в настоящем расчете составило: n = 134 + 162 – 2 = 294 . Согласно таблице значений критерия Стьюдента при таком числе степеней свободы фиксированные значения критерия следующие: tst = 2,0 – 2,6 – 3,3. Полученный показатель td, равный 2,72, больше фиксированного значения tst, соответствующего второму уровню вероятности. Значит, разность между выводимостью двух изучаемых партий яиц достоверна при Р³ 0,99, т.е. при втором уровне значимости. ДОСТОВЕРНОСТЬ РАСХОЖДЕНИЯ РАСПРЕДЕЛЕНИЙ ЧАСТОТ ПРИЗНАКА. РАСЧЕТ КРИТЕРИЯ ЛЯМБДА КОЛМОГОРОВА-СМИРНОВА (l ) В практических и научно-исследовательских работах нередко возникает необходимость сравнивать распределение частот признака, т.е. рассчитывать, насколько один ряд чисел отличается от другого по характеру распределения дат. При этом важно определить, настолько ли велико расхождение между двумя распределениями, чтобы его можно было считать достоверным. Для этих целей используются расчеты показателей, называемых критерием c2 (хи-квадрат) и критерием лямбда (l). Критерий "l" предложен русскими учеными А. Н Колмогоровым и Н В Смирновым и применяется для определения достоверности расхождения между любыми двумя распределениями частот одного и того же признака. Метод может употребляться для сравнения распределений с разным числом классов и дат, при расчете не требуется определять число степеней свободы. Единственным условием применения критерия лямбда является достаточная численность выборки - не менее нескольких десятков дат. При одинаковом числе классов и одинаковом числе дат критерий лямбда рассчитывается по формуле: l= . Для определения критерия лямбда составляются ряды накопленных частот для обоих сравниваемых распределений. Рассчитываются разности между соответствующими частотами. Берется максимальная разность и делится на корень квадратный из общего числа дат, образующих эмпирическое распределение ( ). Найденное значение величины "l" сравнивается со стандартными значениями критерия: 1,36; 1,63; 1,95, соответствующими обычным трем степеням вероятности достоверного различия – Р1 = 0,95; Р2 = 0,99; Р3 = 0,999. Для обычных биологических исследований можно допускать большую вероятность различия частот распределений, определяемую третьим порогом вероятности Р = 0,999 и наибольшим предельным значением l. Это значит, что в обычных исследованиях, где не требуется очень высокая точность, даже при больших расхождениях между распределениями, когда l близка к своему наибольшему значению, различия между распределениями можно считать недостоверными.
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|