Хелпикс

Главная

Контакты

Случайная статья





Техника расчета 9 страница



количественных признаков

Обычно расчет статистического комплекса делается по специальным рабочим формулам, упрощающим вычислительную работу.

В статистических комплексах малого и большого объема техника расчета несколько различается. Понятия "большая" или "малая" выборки в значительной степени относительны и определяются наличием вычислительной техники той или иной разрешающей способности.

Однофакторные комплексы состоят только из одного фактора, имеющего несколько градаций. Для однофакторных комплексов требование пропорциональности или равномерности не действует, они ортогональны при любом соотношении частот по градациям фактора.

Прежде чем начать расчет статистического комплекса, следует для облегчения работы преобразовать значение результативного признака. При этом неудобные для работы многозначные или дробные числа могут быть преобразованы в малозначные числа.

После проведения счетной работы с преобразованными датами показатели h2 и F не требуют поправок, их значения получаются точными. Другие показатели требуют восстановления согласно изложенным выше правилам.

Рассмотрим технику расчета однофакторного статистического комплекса для количественных признаков при малом объеме выборки на примере влияния фактора возраста на массу яиц.

В примере (табл.31) для расчета взяты данные от десяти кур. Результативным признаком является масса яиц, для фактора возраста устанавливаются три градации, соответствующие разным периодам яйцекладки: в начале, середине и в конце ее.

Таблица 31

Градации фактора

А1 А2 А3

Полученные в исследовании числа легко преобразуются путем вычитания из всех чисел минимальной постоянной величины 45. В результате получаются достаточно удобные для расчета числа. Порядок расчета данного статистического комплекса приведен в алгоритме (табл. 32). В левой части алгоритма ведется расчет предварительных и вспомогательных величин, в правой части - расчет дисперсий, варианс, показателей h2 и F.

В первой строке указаны градации фактора А и их число. Ниже этой строчки в левой части данного алгоритма столбиками записаны преобразованные значения результативного признака (даты xi) для каждой градации фактора А. В третьей строке записаны частоты по градациям (по 10) и их сумма (N = Sn = 30). В четвертой строке приводится сумма дат по градациям и их общая сумма (SSx = 229). В пятой строке по градациям рассчитываются величины Hi, представляющие собой частные от деления квадратов сумм дат по каждой градации на соответствующие частоты, и сумма полученных величин (Hi =1977,1). Шестая строка представляет собой суммы квадратов дат по вариациям (Sxi2) и их суммы по всему комплексу (SSxi2 =2071). Наконец, в седьмой строке записываются частные средние результативного признака по градациям, а также средняя по всему комплексу.


Таблица 32

Алгоритм дисперсионного анализа однофакторного статистического комплекса, расчет влияния фактора возраста кур на массу яиц

Преобразование: xi - 45

Даты

Градации

r = 3

Дисперсии:

факториальная:

CX = SHi – HS

CX=1977,1– 1748 = 229,1

случайная:

СZ=Sx2 - SHi

CZ=2071-1977,1=93,9

общая:

СY=Sx2 - HS

CY=2071-1748=323

 

 

А1 А2 А3

xi

HS=

HS= =1748,0

HS=1748,0

n N=30

Вариансы:

факториальная

= = =114,55

случайная

= = =3,48

 

Sxi SSxi=229
Hi= 152,1 722,5 1102,5 SHi=1977,1
Sxi2 SSx i2=2071
3,9 8,5 10,5 =7,63 = = =0,709
48,9 53,5 55,5 = 52,63 F= = =32,9 n1=r-1=2 n2=N-r=27 Fst=3,3 – 5,5 – 9,0

 

В данном примере эти средние величины получены в преобразованном виде. Чтобы восстановить их действительное значение, необходимо к каждой средней прибавить ту величину, которая была вычтена из каждой даты в начале работы с цифровым материалом - 45. Эти средние величины в восстановленном виде приводятся в восьмой строке. Средние величины показывают, что с возрастом кур масса яиц возрастает. Однако средние величины только иллюстрируют действие фактора возраста, дают только первое, внешнее представление о происходящем процессе.

Чтобы сделать окончательные выводы, необходимо определить степень воздействия изучаемого фактора на результативный признак (или силу его влияния) и достоверность этого воздействия или достоверность полученных в эксперименте результатов. 

Для проведения дальнейших расчетов необходимы вспомогательные величины: SHi; Sx2 и HS. Первые две величины имеются, а для получения третьей необходимо возвести в квадрат сумму всех дат результативного признака и разделить полученную величину на объем выборки:

HS= .

Дальнейшие расчеты указаны в правой половине алгоритма.

Дисперсии рассчитываются не непосредственно, а по рабочим формулам, упрощающим счетную работу.

1. Факториальная дисперсия:

CX = SHi – HS; CX =1977,1 – 1748 = 229,1;          CX = 229,1.

2. Случайная дисперсия:

СZ=Sx2 - SHi; СZ = 2071 - 1977,1 = 93,9;              СZ = 93,9.

3. Общая дисперсия:

СY=Sx2 - HS; СY = 2071 – 1748 = 323;                   СY = 323.

Расчет может быть проверен, поскольку действует равенство дисперсий:

СY = СX + СZ; СY = 229,1 + 93,9 = 323.

Затем рассчитываются значения варианс, для чего необходимо предварительное определение числа степеней свободы для каждого значения дисперсий:

1. Факториальная варианса:

= ; = =114,55;                          = 114,55.

2. Случайная варианса:

= ; = =3,48;                               = 3,48.

3. Степень влияния организованного фактора

= ; = = 0,709;            = 0,71.

4. Критерий Фишера, характеризующий достоверность влияния изучаемого фактора:

F= ; F= =32,9;                                    F = 32,9.

Полученное значение F сравнивается с его стандартными значениями, имеющимися в специальных статистических справочниках. Эти стандартные значения находятся на пересечении столбцов и строчек, соответствующих числу степеней свободы, причем за n1 принимается число степеней свободы для факториальной дисперсии (nX), а за n2 - число степеней свободы для случайной дисперсии (nZ). В нашем примере для n1 = 2 и n2 = 27 стандартные значения равны 3,3-5,5-9,0.

Поскольку расчетное значение F = 32,9 превышает наивысшее значение Fst (32,9>9,0), полученный результат достоверен при третьем уровне вероятности (Р>0,999).

Таблица 33

Разнообразие С n S2 Показатели влияния
Факториальное 229,1 114,55 =0,71
Случайное 93,9 3,48 F = 32,9
Общее 323,0 11,3 P>0,999

Полученные в расчете показатели разнообразия и показатели влияния фактора заносятся в сводную таблицу алгоритма. Произведенный расчет дает основание сделать следующее заключение.

В изучаемой популяции кур с возрастом существенно увеличивается масса яйца, фактор возраста оказывает большое и достоверное влияние при Р>0,999. Среди всех возможных факторов доля влияния возраста на результативный признак составляет 71%, а 29% влияния приходится на другие, не учтенные в данном исследовании факторы.

Дисперсионный анализ двухфакторных равномерных или пропорциональных комплексов количественных признаков

При расчете влияния двух факторов в одном статистическом комплексе появляются новые требования к организации комплекса, которых не было при расчете однофакторного комплекса. Обязательным требованием в двухфакторных комплексах является независимость изучаемых факторов. Удобнее работать с комплексами, в которых имеется пропорциональное или равномерное распределение частот, - в этих случаях расчет значительно облегчается. Как все статистические комплексы, двухфакторные комплексы должны быть рэндомизированы, перед расчетом варианты могут быть предварительно преобразованы.

В отличие от однофакторных, двухфакторные статистические комплексы позволяют выявить не только долю каждого фактора в отдельности, но и долю их совместного влияния, вызывающего дополнительную дисперсию (САВ). Эта дисперсия не является результатом простой суммы действия обоих факторов, а возникает благодаря их совместному, интегрированному взаимодействию.

Техника расчета двухфакторного комплекса может быть рассмотрена на следующем примере. В условиях тропического климата проводился эксперимент по изучению влияния различных уровней кальция (фактор А) и аскорбиновой кислоты (фактор В) на толщину скорлупы яиц у кур-несушек. Изучались три уровня кальция (3,7%, 4,0% и 4,5%) и три уровня аскорбиновой кислоты (без добавок витамина, 50 мг и 100 мг на один килограмм смеси). По каждому варианту кормосмеси использовались 4 группы кур в качестве повторностей. Средние данные по каждой повторности приведены ниже.

Для удобства проведения расчетов данные по измерениям толщины скорлупы яиц предварительно преобразованы путем умножения каждой из дат на 1000 и последующего вычитания 300. Получаются целые двухзначные числа, которые и записываются в форму расчета статистического комплекса.

Таблица 34

Уровни кальция в кормосмеси, %

А1 – 3,7

А2 – 4,0

А3 – 4,5

Уровни аскорбиновой кислоты, мг

В1-0 В2-50 В3-100 В1-0 В2-50 В3-100 В1-0 В2-50 В3-100
0,327 0,333 0,332 0,317 0,340 0,354 0,334 0,342 0,346
0,319 0,328 0,338 0,345 0,330 0,341 0,350 0,340 0,343
0,325 0,343 0,338 0,341 0,321 0,344 0,333 0,339 0,358
0,316 0,333 0,339 0,349 0,363 0,353 0,345 0,349 0,355

В двухфакторном статистическом комплексе расчет производится в основном так же, как и в случае однофакторного комплекса. В части I алгоритма ведутся расчеты предварительных и вспомогательных величин. Как и в случае однофакторного комплекса, последовательно по строчкам записываются значения n и N, суммы дат Sхi по градациям и в целом по комплексу, суммы квадратов дат Sхi2 по градациям и по комплексу в целом, величины Hi (представляющие собой частные от деления квадратов сумм дат по градациям на соответствующие частоты) и сумма полученных величин (SHi =56894). В двух последних строчках (часть 1 алгоритма) записываются средние значения результативного признака в преобразованном и восстановленном виде. Находится также вспомогательная величина НS. В дальнейшем рассчитываются новые показатели: дисперсия отдельно по каждому изучаемому фактору (СА и Св) и дисперсия, характеризующая взаимодействие этих двух факторов (САВ). Для этого в части 2 алгоритма по каждой градации фактора А и фактора В отдельно подсчитываются сумма частот n и сумма дат Sхi. На основе полученных величин рассчитывается ряд значений Hi =  - отдельно по каждой градации каждого фактора. Сумма этих величин в разрезе каждого фактора (НА и HВ) является исходной величиной для определения влияния каждого фактора. Если из нее вычесть общую для комплекса поправку HS = , получаем точное значение дисперсии по данному фактору. Например:

СА = HA – HS = 55900 - 54678 = 1222.

Поскольку в начале исследования даты были преобразованы умножением на 1000 и вычитанием 300, восстановленное значение дисперсии получается делением расчетной величины на 10002 (1000000). Восстановленное значение дисперсии СА = 0,001222.

Аналогично находится величина CВ = 0,000822. Эти действия записываются в части 3 алгоритма. Как и в расчете однофакторного комплекса, получаются значения CХ, СY и СZ.

Специфической особенностью расчета двухфакторного комплекса является нахождение дисперсии, характеризующей взаимодействие двух факторов (САВ): она получается вычитанием дисперсий СА и СВ из факториальной дисперсии СХ:

САВ = СХ - СА – СВ.

Дальнейшее определение величин ; υ; Si2 и F показано в части 3 алгоритма.

Зная число степеней свободы, по таблице стандартных значений критерия Фишера легко определить уровень достоверности влияния каждого изучаемого фактора. Анализ полученных результатов позволяет заключить: сила влияния фактора А или уровня кальция в кормосмеси на толщину скорлупы яиц оказалась равной 26,6% от всех влияний и достоверной при Р>0,99. Сила влияния фактора В, т.е. аскорбиновой кислоты, равна 17,9% от влияния всех других факторов и достоверна при Р>0,95.

 


Таблица 35

Алгоритм дисперсионного анализа двухфакторного равномерного статистического комплекса.

Расчет влияния различных уровней кальция (фактор А) и аскорбиновой кислоты (фактор В) в кормосмесях кур на толщину скорлупы яиц. Признак преобразован умножением на 1000 и вычитанием 300.

Часть 1

Даты

А1

А2

А3

rA = 3

rB = 3

B1 B2 B3 B1 B2 B3 B1 B2 B3
xi 27 19 25 16 33 28 43 33 32 38 38 39 17 45 41 49 40 30 21 63 54 41 44 53 34 50 33 45 42 40 39 49 46 43 58 55 HS= = =54578
n N = 36
Sxi Sx = 1403
Sxi2 Sx2 = 59273
Hi = 1892,2 4692,2 5402,2 5776,0 5929,0 9216,0 6561,0 7225,0 10201,0 S Hi = 56894
=  = 38,8
Восстанов-ленное 0,322 0,334 0,337 0,338 0,338 0,348 0,340 0,342 0,350  = 0,3388

 


Таблица 35

Часть 3

  А В АВ Х Z

Y

C HA – H HB – H CX – CA - CB SHi - HS Sx2 - SHi

Sx2 - HS

восстановленное 0,001222 0,000822 0,000172 0,002216 0,002379

0,004595

= 0,266 0,179 0,037 0,432 0,518

1,000

υ rA – 1 rB – 1 (rA-1)(rB-1) rA×rB-1 N- rA×rB 27

N – 1

S2 = 0,000611 0,000411 0,000043 0,000277  

 

F = 0,55 - n1   n2
            9,0 5,5 3,3 6,3 4,1 2,7 4,8 3,3 2,3

 


Таблица 35

Часть 2

Градации n i Hi = Hi по факторам
А1 0,3310

HA = HA1 + HA2 + HA3

 

 

HA = 55900

А2 41,5 0,3415
А3 44,5 0,3445
В1 33,4 0,3334

HB = HB1 + HB2 + HB3

 

 

HB= 55500

В2 38,4 0,3384
В3 45,1 0,3451

Полученная в данном анализе степень совместного влияния двух факторов оказалась очень небольшой (3,7%) и недостоверной (Р<0,95). Это позволяет заключить, что кальций и аскорбиновая кислота в кормосмесях оказывают самостоятельное влияние на толщину скорлупы яиц, действие одного фактора не создает взаимодействия с другим.

В результате общее влияние организованных в эксперименте факторов составило 48% от влияния всех других возможных факторов и достоверно при первом уровне значимости (Р>0,95).

 

Дисперсионный анализ однофакторного статистического комплекса                  для качественных признаков

Особенностью дисперсионного анализа статистических комплексов для качественных признаков является то, что общие и частные средние арифметические по градациям факторов и по всему комплексу выражаются долями, т.е. частью особей в группе, обладающих интересующими нас признаками. Доля получается в результате деления числа особей с наличием интересующего нас признака в данной градации на общее число особей, имеющихся в ней. Так, если число особей (или измерений) в комплексе равно n, а число особей (или измерений) с данным признаком равно m, то отношение  составит долю с данным признаком, или p = . Эта величина р имеет то же значение, что и среднее арифметическое для количественных признаков. Доля особей, не имеющих данного признака, выражается как q = 1- p.

Ранее было показано, что квадратическое отклонение для качественных признаков выражается формулой

S = ,

отсюда варианса равна S2 = p - q.

Дисперсия для качественных признаков рассчитывается по формуле:

С = n ´ S2 или С = n ´ ×p ´ q.

Если в эту формулу подставить значения р и q, то получим

С = n ´  (1 - ) или С = m - .

Это есть основная формула дисперсии для качественных признаков. Рабочие формулы дисперсий для однофакторного комплекса качественных признаков имеют следующий вид:

СХ = SHi - HS

CZ = Sm - SHi

CY = Sm - HS ,

где SHi = S ; HS = .

Рассмотрим технику расчета дисперсионного анализа  комплекса для качественных признаков на примере материалов по эмбриональной смертности во время инкубации яиц с разной степенью мраморности скорлупы. Партия яиц была распределена на части по степени выраженности мраморности скорлупы в соответствии с баллами мраморности от 1 до 5. Большая цифра балла говорит о большой выраженности мраморности скорлупы. После этого яйца были заложены на инкубацию в отдельных лотках. Полученные результаты записаны в табл. 36.

Таблица 36

Результаты инкубации яиц разной степени мраморности скорлупы

 

 

Показатели

Обозначения

Баллы мраморности скорлупы яиц (градации)

Заложено яиц на инкубацию n
Погибло эмбрионов m

Эти исходные материалы включаются в форму алгоритма для дисперсионного анализа.



  

© helpiks.su При использовании или копировании материалов прямая ссылка на сайт обязательна.