Хелпикс

Главная

Контакты

Случайная статья





Les chemins 24 страница



использовать так называемые гистограммы-способ графического

представления в виде примыкающих друг к другу прямоугольников:

Фон                      Поел* воздействия                    Фон                     После воздействия

Опытная группа                                                       Контрольная групп*

 

Наконец, для еще более наглядного представления общей конфигу­рации распределения можно строит полигоны распределения частот. Для этого отрезками прямых соединяют центры верхних сторон всех прямоугольников гистограммы, а затем с обеих сторон «замыкают» площадь под кривой, доводя концы полигонов до горизонтальной оси (частота = 0) в точках, соответствующих самым крайним значениям распределения. При этом получают следующую картину:

 Частоты

Контрольная группа                                                      Опытная группа

Если сравнить полигоны, например, для фоновых (исходных) значе­ний контрольной группы и значений после воздействия для опытной группы, то можно будет увидеть, что в первом случае полигон почти симметричен (т. е, если сложить полигон вдвое по вертикали, проходя­щей через его середину, то обе половины наложатся друг на друга)* тогда как для экспериментальной группы он асимметричен и смещен влево (так что справа у него как бы вытянутый шлейф).

Полигон для фоновых данных контрольной группы сравнительно близок к идеальной кривой, которая могла бы получиться для бесконеч­но большой популяции. Такая кривая -кривая нормального распределе­ния -имеет колоколообразную форму я строго симметрична. Если же количество данных ограничено (как в выборках, используемых для научных исследований), то в лучшем случае получают лишь некоторое приближение (аппроксимацию) к кривой нормального распределения.

 Приложение f>

Если вы построите полигон для фоновых значений опытной группы и значений после воздействия для контрольной группы, то вы наверняка заметите, что так же будет обстоять дело и в этих случаях.

Оценка центральной тенденции

Если распределения для контрольной группы и для фоновых значе­ний в опытной группе более или. менее симметричны, то значения, получаемые в опытной группе после воздействия, группируются, как уже говорилось, больше в левой части кривой. Это говорит о том, что после употребления марихуаны выявляется тенденция к ухудшению показате­лей у большого числа испытуемых.

Для того чтобы выразить подобные тенденции количественно, ис­пользуют три вида показателей моду, медиану и среднюю.

1. Мода (Мо)-это самый простой из всех трех показателей. Она соответствует либо наиболее частому значению, либо среднему значе­нию класса с наибольшей частотой. Так, в нашем примере для экспери­ментальной группы мода для фона будет равна 15 (этот результат встречается четыре раза и находится в середине класса 14-15-16), а после воздействия (середина класса 8-910),

Мода используется редко и главным образом для того, чтобы дать общее представление о распределении. В некоторых случаях у распреде­ления могут быть две моды; тогда говорят о бимодальном распределе­нии. Такая хартина указывает на то> что в данном совокупности имеются две относительно самостоятельные группы (см,, например, данные Триона, приведенные в документе 3.5).

Бимодальное распределение

*                                                                                                                                                                                                                                                                                                                                                                                                                                                                           

2, Медиана (Me) соответствует центральному значению в последова­тельном ряду всех полученных значений. Так, для фона в эксперимен­тальной группе, где мы имеем ряд

10 11 12 13 14 14 15 15 15 15 17 17 19 20 21,

медиана соответствует 8-му значению, т.е. 15. Для результатов воздей­ствия в экспериментальной группе она равна 10.

В случае если число данных п, четное, медиана равна средней арифметической между значениями, находящимися в раду на л/2-м и я/2 + 1-м местах. Так, для- результатов воздействия для восьми юношей опытной группы медиана располагается между значениями, находящимися на 4-м (8/2 = 4) и 5-м местах в ряду. Если выписать весь

Статистика и обработка данных

2У7

ряд для этих данных;, а именно

7 8 9 II 12 13 14 16,

то окажется, что медиана соответствует (II + 12)/2 =11,5 (видно, что медиана не соответствует здесь ни одному из полученных значений),

3. Средняя арифметическая (1Й) (далее просто «средняя») - это наибо­лее часто используемый показатель центральной тенденции. Ее приме­няют, в частности, в расчетах, необходимых для описания распределения и для его дальнейшего анализа. Ее вычисляют t разделив сумму всех значений данных на число этих данных. Так, для нашей опытной группы она составит- 15,2(228/15) для фона и 11,3(169/15) для результатов воздействия.

Если теперь отметить все эти три параметра на каждой из кривых для экспериментальной группы, то будет видно, что при нормальном расп­ределении они более или менее совпадают, а при асимметричном расп ред е л е ни и - нет.

Прежде чем идти дальше, полезно будет вычислить все эти показате­ли для обеих распределений контрольной группы-они пригодятся нам в дальнейшем:  . .

Приложение Б

Оценка разброса

Как мы уже отмечали, характер распределения результатов после воздействия изучаемого фактора в опытной группе дает существенную информацию о том, как испытуемые выполняли задание. Сказанное относится и к обоим распределениям в контрольной группе:

Контрольная группа        Мода (Мо) Мели* не (Me) Средни а (м)

Фон:                                                                .................
После воздействия: ч • - •:....... • •......• •      ,...••.«••-.

Сразу бросается в глаза, что если средняя в обоих случаях почти одинакова, то во втором распределении результаты больше разбросаны, чем в первом, В таких случаях говорят, что у второго распределения больше диапазон, или размах вариаций, т.е, разница между максималь­ным и минимальным значениями.

Так, если взять контрольную группу, то диапазон распределения для фона составит 22 — 10 = 12, а после воздействия 25 — 8 — 17. Это позво­ляет предположить, что повторное выполнение задачи на глазодвига­тельную координацию оказало на испытуемых из контрольной группы определенное влияние; у одних показатели улучшились, у других ухуд­шились1. Однако для количественной оценки разброса результатов

1 Здесь мог проявиться эффект плацебо связанный с тем, что запах дыма травы вызвал у испытуемых уверенность в том, что они находятся под воз­действием наркотика. Для проверки этого предположения следовало бы повто­рить эксперимент со второй контрольной группой, в которой испытуемым будут давать только обычную сигарету.

 u /lOfHtonmKit thmiwx

относительно средней в том или ином распределении существуют более точные методы, чем измерение диапазона.

Чаще всего для оценки разброса определяют отклонение каждого из полученных значений от средней (М-М)> обозначаемое буквой d, а затем вычисляют среднюю арифметическую всех этих отклонений. Чем она больше, тем больше разброс данных и тем более разнородна выборка. Напротив, если эта средняя невелика, то данные больше сконцентриро­ваны относительно их среднего значения и выборка более однородна.

Итак, первый показатель, используемый для оценки разброса,-это среднее отклонение. Его вычисляют следующим образом (пример, кото­рый мы здесь приведем, не имеет ничего общего с нашим гипотетиче­ским экспериментом). Собрав все данные и расположив их в ряд

3 5 6 9 11 14,

находят среднкУю арифметическую для выборки:

Затем вычисляют отклонения каждого значения от средней и сумми­руют их:

Однако при таком сложении отрицательные и положительные отклоне­ния будут уничтожать друг друга, иногда даже полностью, так что результат (как в данном примере) может оказаться равным нулю. Из этого ясно, что нужно находить сумму абсолютных значений индиви­дуальных отклонений и уже эту сумму делить на их общее число. При этом получится следующий результат:

среднее отклонение равно

Общая формула:

где (сигма) означает сумму; \d\- абсолютное значение каждого инди­видуального отклонения от средней; «-число данных.

Однако абсолютными значениями довольно трудно оперировать в алгебраических формулах* используемых в более сложном статистиче­ском анализе. Поэтому статистики решили пойти по «обходному пути», позволяющему отказаться от значений с отрицательным знаком, а имен­но возводить все значения в квадрат, а затем делить сумму квадратов на

19-443

flfHLtlKXCVIttlC Л

число данных. В нашем примере это выглядит следующим образом:

В результате такого расчета получают так называемую варианеу1* Формула для вычисления вариансы, таким образом, следующая:

Наконец, чтобы получить показатель, сопоставимый по величине со средним отклонением, статистики решили извлекать из вариансы квад­ратный корень. При этом получается так называемое стандартное отклонение:

 

В нашем примере стандартное отклонение равно

Следует еще добавить* что для того, чтобы более точно оценить стандартное отклонение для малых выборок (с числом элементов менее 30), в знаменателе выражения под корнем надо использовать не /г, а п — 1:

-

 

Вернемся теперь к нашему эксперименту и посмотрим, насколько полезен оказывается этот показатель для описания выборок.

На первом этапе, разумеется, необходимо вычислить стандартное

Г

1 Варнанса представляет собой один из показателей разброса, используемых в некоторых статистических методиках (например, при вычислении критерия F; см, следующий раздел). Следует отметить, что в отечественной литературе варианту часто называют дисперсией.-Прим. rtepee.

* Стандартное отклонение для популяции обозначается маленькой греческой буквой сигма , а для выборки - буквой s. Это касается и вариансы, т.е. квадрата стандартного отклонения: для популяции она обозначается , а для выборки -

 tt vtipafwniKct

отклонение для всех четырех распределений. Сделаем это сначала для фона опытной группы:

Расчет стандартного отклонения1 для фона контрольной группы

Испытуемые Число пора*  Средняя женных мише-ней в серии

Отклоне-  Квадрат от-

кие от    клонздия от

средней (*/) средней (dl)

2 3   10 12 • 15,8 15,8 15,8   -ЗД + 5,8 + 3,8   10,24 33,64 14,44  
- - - 15,8 -6,2 г 38,44

Сумма

Стандартное отклонение

1 Формула для расчетов н сами расчеты приведены здесь лишь в качестве иллюстрации. В наше время гораздо проще при об* рести такой карманный микрокалькулятор, в котором подобные расчеты уже заранее запрограммированы, и для расчета стан­дартного отклонения достаточно лишь ввести данные, а затем нажать клавишу s.

О чем же свидетельствует стандартное отклонение, равное 3,07? Оказывается, оно позволяет сказать, что большая часть результатов (выраженных здесь числом пораженных мишеней) располагается в пре­делах 3,07 от средней, т.е. между 12,73 (15,8 - 3,07) и 18,87 (15,8 4- 3,07),

Для того чтобы лучше понять, что подразумевается под «большей частью результатов», нужно сначала рассмотреть те свойства стандарт­ного отклонения, которые проявляются при изучении популяции с нор­мальным распределением.

Статистики показали, что при нормальном распределении «большая часть» результатов, располагающаяся в пределах одного стандартного отклонения по обе стороны от средней, в процентном отношении всегда одна и та же и не зависит от величины стандартного отклонения: она соответствует 68% популяции (т, е. 34% ее элементов располагается слева и 34%-справа от средней):

При.южеши* Б

6ЭГ27%

М-0     М    М+о

Точно гак же рассчитали, что 94,45% элементов популяции при нормальном распределении не выходит за пределы двух стандартных отклонений от средней:

и что в пределах трех стандартных отклонений умещается почти вся популяция-99,73%.

Учитывая, что распределение частот фона контрольной группы довольно близко к нормальному, можно полагать, что 68% членов всец популяции, из которой взята выборка, тоже будет получать сходные результаты, т,е, попадать примерно в 13-19 мишеней из 25, Распределе­ние результатов остальных членов популяции должно выглядеть следу­ющим образом;

Статистики tt обработка данных

Гипотетическая популяция,

из которой взята контрольная группа (фон)

Что касается результатов той же группы после воздействия изучаемо­го фактора, то стандартное отклонение для них оказалось равным 4,25 (пораженных мишеней). Значит, можно предположить, что 68% резуль­татов будут располагаться именно в этом диапазоне отклонений от средней, составляющей 16 мишеней, т. е. в пределах от 11,75 (16 — 4,25) до 20,25 (16 + 4,25), или, округляя, 12 — 20 мишеней из 25. Видно, что здесь разброс результатов больше, чем в фоне. Эту разницу в разбросе между двумя выборками для контрольной группы можно графически представить следующим образом:

Приложение И

-t<7

После воздействия

Поскольку стандартное отклонение всегда соответствует одному и тому же проценту результатов, укладывающихся в его пределах вокруг средней, можно утверждать, что при любой форме кривой нормального распределения та доля ее площади, которая ограничена (с обеих сторон) стандартным отклонением, всегда одинакова и соответствует одной и той же доле всей популяции. Это можно проверить на тех наших выборках, для которых распределение близко к нормальному,-на дан­ных о фоне для контрольной и опытной групп.

Итак, ознакомившись с описательной статистикой, мы узнали» как можно представить графически и оценить количественно степень разбро­са данных в том или ином распределении. Тем самым мы смогли понять, чем различаются в нашем опыте распределения для контрольной группы до и после воздействия. Однако можно ли о чем-то судить по этой разнице-отражает ли она действительность или же это просто артефакт, связанный со слишком малым объемом выборки? Тот же вопрос (только еще острее) встает и в отношении экспериментальной группы, подверг­нутой воздействию независимой переменной. В этой группе стандартное отклонение для фона и после воздействия тоже различается примерно на 1 (3,14 и 4,04 соответственно). Однако здесь особенно велика разница между средними-15,2 и 11,3* На основании чего можно было бы утверждать, что эта разность средних действительно достоверна, т,е\ достаточно велика, чтобы можно было с уверенностью объяснить ее влиянием независимой переменной, а не простой случайностью? В какой степени можно опираться на эти результаты и распространять их на всю популяцию, из которой взята выборка, т, е. утверждать, что потребление марихуаны и в самом деле обычно ведет к нарушению глазодвигатель­ной координации?                                               -

На все эти вопросы и пытается дать ответ индуктивная статистика.

u u oopitwowKu (кишы.\

Индуктивная статистика

Задачи индуктивной статистики заключаются в том, чтобы опреде­лять, насколько вероятно, что две выборки принадлежат к одной популяции.

Давайте наложим друг на друга,, с одной стороны, две кривые-до и после воздействия-для контрольной группы и> с другой стороны, две аналогичные кривые для опытной группы. При этом масштаб кривых должен быть одинаковым.

Видно, что в контрольной группе разница между средними обоих распределений невелика, и поэтому можно думать, что обе выборки принадлежат к одной и той же популяции. Напротив, в опытной группе большая разность между средними позволяет предположить что рас­пределения для фона и воздействия относятся к двум различным популяциям, разница между которыми обусловлена тем, что на одну из них повлияла независимая переменная.

Проверка гипотез

Как уже говорилось, задача индуктивной статистики - определять достаточно ли велика разность между средними двух распределений для того, чтобы можно было объяснить ее действием независимой перемен­ной, а не случайностью, связанной с малым объемом выборки (как,

2%

по-видимому, обстоит дело в случае с опытной группой нашего экспе­римента).

При этом возможны две гипотезы:

1) нулевая гипотеза (Но), согласна которой разница между распреде­лениями недостоверна; предполагается, что различие недостаточно зна­чительно, и поэтому распределения относятся к одной и той же популя­ции, а независимая переменная не оказывает никакого влияния;

2) альтернативная гипотеза (НД какой является рабочая гипотеза нашего исследования. В соответствии с этой гипотезой различия между обоими распределениями достаточно значимы и обусловлены влиянием независимой переменной.

Основной принцип метода проверки гипотез состоит в том, что выдвигается нулевая гипотеза Но, с тем чтобы попытаться опровергнуть ее и тем самым подтвердить альтернативную гипотезу Нх, Действитель­но, если результаты статистического теста, используемого для анализа разницы между средними, окажутся таковы, что позволят отбросить Но, это будет означать, что верна HL, т.е. выдвинутая рабочая гипотеза по дт ве рж дается.

В гуманитарных науках принято считать, что нулевую гипотезу можно отвергнуть в пользу альтернативной гипотезы, если по результа­там статистического теста'вероятность случайного возникновения най­денного различия не превышает 5 из 100!. Если же этот уровень достоверности не достигается, считают, что разница вполне может быть случайной и поэтому нельзя отбросить нулевую гипотезу.

Для того чтобы судить о том, какова вероятность ошибиться, принимая или отвергая нулевую гипотезу, применяют статистические методы, соответствующие особенностям выборки.

Так, для количественных данных (см. дополнение БЛ) при распреде­лениях, близких к нормальным, используют параметрические методы, основанные на таких показателях, как средняя и стандартное отклоне­ние. В частности, для определения достоверности разницы средних для двух выборок применяют метод Стьюдента, а для того чтобы судить о различиях между тремя или большим числом выборок,-тест F, или дисперсионный анализ.

Если же мы имеем дело с неколичественными данными или выборки слишком малы для уверенности в том, что популяции, из которых они взяты, подчиняются нормальному распределению, тогда используют непараметрические методы -критерий х2 (лм-квадрат) для качественных данных и критерии знаков, рангов, Манна-Уитни, Вилкоксона и др, для порядковых данных.

Кроме того, выбор статистического метода зависит от того, явля­ются ли те выборки, средние которых сравниваются, независимыми (т. е,, например, взятыми из двух разных групп испытуемых) кли зависимыми

\ Разумеется, рнск ошибиться будет еще меньше, если окажется, что эта вероятность составляет 1 на 100 или* еще лучше, I на 1000.

Статистика и оорашгпжи данных

(т. е. отражающими результаты одной и той же группы испытуемых до и после воздействия или после двух различных воздействий).

Дополнение Б.З. Уровни достоверности (значимости)

Тот или иной вывод с некоторой вероятностью может оказаться ошибочным, причем эта вероятность тем меньше, чем больше имеется данных для обоснования этого вывода. Таким образом, чем больше получено результатов, тем в большей степени по различиям между двумя выборками можно судить о том, что действительно имеет место в той популяции, из которой взяты эти выборки.

Однако обычно используемые выборки относительно невелики, и в этих случаях вероятность ошибки может быть значительной, В гумани­тарных науках принято считать, что разница между двумя выборками отражает действительную разницу между соответствующими популя­циями лишь в том случае, если вероятность ошибки для этого утвержде­ния не превышает 5%, т.е. имеется лишь 5 шансов из 100 ошибиться, выдвигая такое утверждение. Это так называемый уровень достоверно­сти (уровень надежности, доверительный уровень) различия. Если этот уровень не превышен, то можно считать вероятным, что выявленная нами разница действительно отражает положение дел в популяции (отсюда еще одно название этого критерия-порог вероятности).

Для каждого статистического метода этот уровень можно узнать из таблиц распределения критических значений соответствующих крите­риев (f, х1 и т, д.); в этих таблицах приведены цифры для уровней 5% (0,05), 1% (0,01) или еще более высоких. Если значение критерия для данного числа- степеней свободы (см. дополнение Б.4) оказывается ниже критического уровня, соответствующего порогу вероятности 5%, то нулевая гипотеза не может считаться опровергнутой, и это означает, что выявленная разница недостоверна.

Параметрические методы

Метод Стьюдента (tf-тест)

Это параметрический метод, используемый для проверки гипотез о достоверности разницы средних при анализе количественных данных о популяциях с нормальным распределением и с одинаковой вариан-сой *.

Метод Стьюдента различен для независимых и зависимых выборок. Независимые выборки получаются при исследоваиии двух различных

1 К сожалению, метод Стьюдента слишком часто используют для малых выборок, не убедившись предварительно в том, что данные в соответствующих популяциях подчиняются закону нормального распределения (например, ре­зультаты выполнения слишком легкого задания, с которым справились все испытуемые* или же, наоборот, слишком трудного задания не дают нормального распределения).

групп испытуемых (в нашем эксперименте это контрольная и опытная группы). В случае независимых выборок для анализа разницы средних применяют формулу

где -средняя первой выборки;  -средняя второй выборки;

 -стандартное отклонение

для первой выборки;  -стандартное отклонение

для второй выборки;  -число элементов в первой

и второй выборках.

Теперь осталось лишь найти в таблице значений t (см. дополнение Б.5) величину, соответствующую п — 2 степеням свободы, где л-общее число испытуемых в обеих выборках (см. дополнение Б,4), и сравнить эту величину с результатом расчета по формуле.

Если наш результат больше, чем значение для уровня достоверности 0,05 (вероятность 5%), найденное в таблице* то можно отбросить нулевую гипотезу (Но) и принять альтернативную гипотезу (НД т,е, считать разницу средних достоверной.

Если же, напротив, полученный при вычислении результат меньше, чем табличный (для п-2 степеней свободы), то нулевую гипотезу нельзя отбросить и, следовательно, разница средних недостоверна,

В нашем эксперименте с помощью метода Стьюдента для независи­мых выборок можно было бы, например, проверить, существует ли достоверная разница между фоновыми уровнями (значениями, получен­ными до воздействия независимой переменной) для двух групп. При этом мы получим:

Сверившись с таблицей значений /, мы можем прийти к следующим выводам; полученное нами значение / — 0,53 меньше того, которое соответствует уровню достоверности 0,05 для 26 степеней свободы I ; следовательно, уровень вероятности для такого / будет выше

0,05 и нулевую гипотезу нельзя отбросить; таким образом, разница между двумя выборками недостоверна, т. е. они вполне могут принадле­жать к'одной популяции.

Сокращенно этот вывод записывается следующим образом:

 недостоверно.

 

Однако наиболее полезным f-тест окажется для нас при проверке

1 Как уже говорилось, поскольку объем выборок в данном случае невелик, а результаты опытной группы после воздействия не соответствуют нормальному распределению, лучше использовать непараметрический метод, например U-тест Манна -Уитни.

Спитш-тика и мраоотка омнных

гипотезы о достоверности разницы средней между результатами опыт­ной и контрольной групп после воздействия1. Попробуйте сами найти для этих выборок значения и сделать соответствующие выводы:

Значение t ....., чем табличное для 0,05 (.....степеней свободы).

Следовательно, ему соответствует порог вероятности ___•, чем 0,05,

В связи с этим нулевая гипотеза может (не может) быть отвергнута. Разница между выборками достоверная (недостоверна?):

Дополнение Б.4. Степени свободы

Для того чтобы свести к минимуму ошибки, в таблицах критических значений статистических критериев в общем количестве данных не учитывают те, которые можно вывести методом дедукций. Оставшиеся данные составляет так называемое число степеней свободы* т. е. то число данных из выборки, значения которых могут быть случайными.

Так, если сумма трех данных равна 8, то первые два из них могут принимать любые значения, но если они определены, то третье значение становится автоматически известным. Если, например, значение первого данного равно 3>а второго-1, то третье может быть равным только 4. Таким образом, в такой выборке имеются только две степени свободы. В общем случае для выборки в п данных существует п-1 степень свободы.

Если у нас имеются две независимые выборки, то число степеней свободы для первой из них составляет пг-\, а для второй-л2-Ь А поскольку при определении достоверности разницы между ними опираются на анализ каждой выборки, число степеней свободы, по которому нужно будет находить критерий г в таблице, будет составлять К + «а) - 2.     "                                         .

Если же речь идет о двух зависимых выборках, то в основе расчета лежит вычисление суммы разностей, полученных для каждой, пары результатов (т.е., например, разностей между результатами до и после воздействия на одного и того же испытуемого). Поскольку одну (любую) из этих разностей можно вычислить» зная остальные разности и их сумму, число степеней свободы для определения- критерия г будет равно и- 1.



  

© helpiks.su При использовании или копировании материалов прямая ссылка на сайт обязательна.