Les chemins 25 страница

Метод Стьюдента для зависимых выборок

К зависимым выборкам относятся» например, результаты одной и той же группы испытуемых до и после воздействия независимой переменной. В нашем случае с помощью статистических методов для зависимых выборок можно проверить гипотезу о достоверности разни-

300 Пщмож*-нш* В

цы между фоновым уровнем и уровнем после воздействия отдельно для опытной и для контрольной группы.

Для определения достоверности разницы средних в случае зависимых выборок применяется следующая формула:

где -разность между результатами

в каждой паре;

-сумма этих частных разностей; -сумма квадратов частных разностей.

Полученные результаты сверяют с таблицей и отыскивая в ней значения, соответствующие « — 1 степени свободы; «-это в данном случае число пар данных (см. дополнение Б.З).

Перед тем как использовать формулу, необходимо вычислить для каждой группы частные разности между результатами во всех парах, квадрат каждой из этих разностей, сумму этих разностей и сумму их квадратов1.

Необходимо произвести следующие операции:

Контрольная группа. Сравнение результатов для фонд н после

воздействия

Испытуемые	Фок	После uov	d
		дейстзия
Д 1			+ 2
	ю-	S	-2
г			+ 1
			-2
			+3
			-2
			— 2
Ю 1		J7	+2
			+ 1
				_
			+ 1
	15 .		+ 1
			-3
			_	—
			+ 3

1 Все эти расчеты необходимо сделать в чисто учебных целях. Сегодня существуют более быстрые методы, при которых основная работа сводятся к вводу данных в программируемый микрокалькулятор или в компьютер, который автоматически выдает результат. Приведенная здесь таблица помогает понять все расчеты, которые осуществляются такими машинами.

и ищпюотки данных 301

Величина / = 0,39 ниже той, которая необходима для уровня значимости 0,05 при 14 степенях свободы. Иными словами, порог вероятности для такого / выше 0,05. Таким образом, нулевая гипотеза не может быть отвергнута, и разница между выборками недостоверна. В сокращенном

виде это записывается следующим образом:

'л

недостоверно.

Теперь попробуйте самостоятельно применить метод Стьюдента для зависимых выборок к обоим распределениям опытной группы с учетом того, что вычисление частных разностей для дар дало следующие результаты:

Значение t....., чем то, которое соответствует уровню значимости G>05

для.....степеней свободы. Значит, нулевая гипотеза....., а различи»

между выборками.....

Запишите это в сокращенном виде.

Дисперсионный анализ (тест F Снедекора)

Метод Снедекора-это параметрический тест, используемый в тех случаях, когда имеются три или большее число выборок. Сущность этого метода заключается в том, чтобы определить, является ли разброс средних для различных выборок относительно общей средней для всей совокупности данных достоверно отличным от разброса данных относительно средней в пределах каждой выборки. Если все выборки принадлежат одной и той же популяции, то разброс между ними должен быть не больше, чем разброс данных внутри их самих.

В методе Снедекора в качестве показателя разброса используют вариансу (дисперсию). Поэтому анализ сводится к тому, чтобы сравнить вариансу распределений между выборками с вариансами в пределах каждой выборки, или:

различие .....

где -варианса средних каждой выборки относительно общей

средней:

-варианса данных внутри каждой выборки. Если различие между выборками недостоверно, то результат должен быть близок к 1, Чем больше будет F по сравнению с 1, тем более достоверно различие.

ft pit. r* мнение

Таким образом, дисперсионный анализ показывает, принадлежат ли выборки к одной популяции, но с его помощью нельзя выделить те выборки, которые отличаются от других. Для того чтобы определить те пары выборок, разница между которыми достоверна, следует после дисперсионного анализа применить метод Шеффе* Поскольку, однако, этот весьма ценный метод требует достаточно больших вычислений, а к нашему гипотетическому эксперименту он неприменим, мы рекомендуем читателю для ознакомления с ним обратиться к какому-либо специальному пособию по статистике.

Непараметрические методы

Метод %2 («хи-квадрат»)

Для использования непараметрического метода х2 не требуется вычислять среднюю или стандартное отклонение. Его преимущество состоят в том, что для применения его необходимо знать лишь зависимость распределения частот результатов от двух переменных; это позволяет выяснить, связйы они друг с другом или, наоборот, независимы. Таким образом, этот статистический метод используется для обработки качественных данных (см. дополнение БЛ)+ Кроме того, с его помощью можно проверить, существует ли достоверное различие между числом людей, справляющихся или нет с заданиями какого-то интеллектуального теста, и числом этих же людей, получающих при обучении высокие или низкие оценки; между числом больных, получивших новое лекарство, и числом тех, кому это лекарство помогло; и, наконец, существует ли достоверная связь между возрастом людей и их успехом или неудачей в выполнении тестов на память и т. п. Во всех подобных случаях этот тест позволяет определить число испытуемых, удовлетворяющих одному и тому же критерию для каждой из переменных,

При обработке данных нашего гипотетического эксперимента с помощью метода Стьюдента мы убедились в том, что употребление марихуаны испытуемыми из опытной группы снизило у них эффективность выполнения задания по сравнению с контрольной группой. Однако к такому же выводу можно быдо бы прийти с помощью другого метода -х2- Для этого метода нет ограничений, свойственных методу Стьюдента: он может применяться н в тех случаях, когда распределение не является нормальным, а выборки невелики.

При использовании метода х2 достаточно сравнить число испытуемых в ТОЙ и другой группе, у которых снизилась результативность, и подсчитать, сколько среди них было получивших и не получивших наркотик; после этого проверяют, есть ли связь между этими двумя переменными.

Из результатов нашего опыта, приведенных в таблице в дополнении Б,2, видно, что из 30 испытуемых, составляющих опытную и контрольную группы, у 18 результативность снизилась, а 13 из них получили марихуану. Теперь надо внести значение этих так называемых эмпирических частот (Э) в специальную таблицу:

и oopainrnwa *>шшы.\


		Результаты
	Ухудшение Без изменений или улучшение		Итого • -
ос	После употребления наркотика
О О	Без наркотика
	Итого

Эмпирические частоты (Э)

Далее надо сравнить эти данные с теоретическими частотами (Т), которые были бы получены, если бы все различия были чисто случайными. Если учитывать только итоговые данные, согласно которым, с одной стороны, у 18 испытуемых результативность снизилась, а у 12-повысилась, а с другой-15 из всех испытуемых курили марихуану, а 15-нет, то теоретические частоты будут следующими:

Результаты

Ухудшение Без изменений Итого

или улучшение

После употреб-				1 с
в лен и я на кортика				1 э
5 Без наркотика				1С

Итого

Теоретические частоты (Т)

Метод х2 состоит в том, что оценивают, насколько сходны между собой распределения эмпирических и теоретических частот. Если разница между ними невелика, то можно полагать, что отклонения эмпирических частот от теоретических обусловлены случайностью. Если же, напротив, эти распределения будут достаточно разными, можно будет считать, что различия между ними значимы и существует связь между действием независимой переменной и распределением эмпирических частот*

Для вычисления определяют разницу между каждой эмпирической

304 fIpu.w.iKvrt!ti' Fi

и соответствующей теоретической частотой по формуле

а затем результаты, полученные по всех таких сравнениях, складывают:

В нашем случае все это можно представить следующим образом:

Наркотик, ухудшение	+4	1,77 -
Наркотик, улучшение	-4 -	2,66
Без наркотика, ухудшение	_4	1,77
Без наркотика, улучшение	+4	2,66

Для расчета числа степеней свободы число строк в табл. 2 (в конце приложения Б) за вычетом единицы умножают на число столбцов за вычетом единицы. Таким образом, в нашем случае число степеней свободы равно (2 — 1)* (2 — 1) = 1,

Табличное значение (см, табл, 2 в дополнении Б.5) для уровня значимости 0,05 и 1 степени свободы составляет 3,84, Поскольку вычисленное нами значение намного больше, нулевую гипотезу можно считать опровергнутой. Значит, мевду употреблением наркотика и глазодвигательной координацией действительно существует связь1.

Критерий знаков (биномиальный критерий)

Критерий знаков-это еще один непараметрический метод, позволяющий легко проверить, повлияла ли независимая переменная на выпол-

1 Следует, однако, отметить* что если число степеней свободы больше 1, то критерий нельзя применять, когда в 20 или более процентах случаев теоретические частоты меньше 5 или когда хотя бы в одном случае теоретическая частота равна 0 (Siegel, 1956).

if и ooptwonma йштых%

нение задания испытуемыми. При этом методе сначала подсчитывают

число испытуемых, у которых результаты снизились, а затем сравнивают его с тем числом, которого можно было ожидать на основе чистой случайности (в нашем случае вероятность случайного события 1:2). Далее определяют разницу между этими двумя числами, чтобы выяснить, насколько она достоверна.

При подсчетах результаты, свидетельствующие о повышении эффективности, берут со знаком плюс, а о снижении-со знаком минус; случаи отсутствия разницы не учитывают.

Расчет ведется по следующей формуле;

где Л"-сумма «плюсов» или сумма «минусов»;

«/2-число сдвигов в ту или в другую сторону при чистой случайности (один шанс из двух 1);

0,5-поправочный коэффициент, который добавляют к Х9 если X < л/2, или вычитают, если X > п/2.

Если мы сравним в нашем опыте результативность испытуемых до воздействия (фон) и после воздействия, то получим

Итак, в 13 случаях результаты ухудшились а в 2-улучшились. Теперь нам остается вычислить Z для одного из этих двух значений X:

1 Такая вероятность характерна, например, для п бросаний монеты. В случае же если п раз бросают игральную кость то вероятность выпадения той или иной грани уже равна одному шансу из 6 (л/6).

20 443

Опытная группа
Фон:						17-
После воздействия:											И
Знак:	—	—	—	+	—	—	—	—	—	+	—	—

Из таблицы значений Z можно узнать, что Z для уровня значимости 0,05 составляет 1,64. Поскольку полученная нами величина Z оказалась выше табличной, нулевую гипотезу следует отвергнуть; значит, под действием независимой переменной глазодвигательная координация действительно ухудшилась.

Критерий знаков особенно часто используют при анализе данных, получаемых в исследованиях по парапсихологии. С помощью этого критерия легко можно сравнить, например, число так называемых телепатических или психокинетических реакций (X) (см, досье 5,1) с числом сходных реакций, которое могло быть обусловлено чистой случайностью (гс/2).

Другие непараметрические критерии

Существуют и другие непараметрические критерии, позволяющие проверять гипотезы с минимальным количеством расчетов.

Критерий рангов позволяет проверить, является ли порядок следования каких-либо событий или результатов случайным, или же он связан с действием какого-то фактора, не учтенного исследователем. С помощью этого критерия можно, например, определить, случаен ли порядок чередования мужчин и женщин в очереди. В нашем опыте этот критерий позволил бы узнать, не чередуются ли плохие и хорошие результаты каждого испытуемого опытной группы после воздействия каким-то определенным образом или не приходятся ли хорошие результаты в основном на начало или конец испытаний.

При работе с этим критерием сначала выделяют такие последовательности, в которых подряд следуют значения меньше медианы, и такие, в которых подряд идут значения больше медианы. Далее по таблице распределения k (от англ> runs-последовательности) проверяют, обусловлены ли эти различные последовательности только случайностью.

При работе с порядковыми данными 1 используют такие непараметрические тесты, как тест U (Манна-Уитни) и тест Т Вилкоксона, Тест U позволяет проверить, существует ли достоверная разница между двумя независимыми выборками после того, как сгруппированные данные этих выборок классифицируются и ранжируются и вычисляется сумма рангов для каждой выборки. Что же касается критерия Т, то он используется для зависимых выборок и основан как на ранжировании, так и на знаке различий между каждой парой данных.

Чтобы показать применение этих критериев на примерах, потребовалось бы слишком много места. При желании читатель может подробнее ознакомиться с ними по специальным пособиям.

1 Такие дачные чаще всего получаются при ранжировании количественных данных, которые нельзя обработать с помощью параметрических тестов.

it и обработка данных

Корреляционный анализ

При изучении корреляций стараются установить, существует ли какая-то связь между двумя показателями в одной выборке (например* между ростом и весом детей или между уровнем IQ и школьной успеваемостью) либо между двумя различными выборками (например, при сравнении пар близнецов), и если эта связь существует, то сопровождается ли увеличение одного показателя возрастанием (положительная корреляция) или уменьшением (отрицательная корреляция) другого.

Иными словами, корреляционный анализ помогает устанойить, можно ли предсказывать возможные значения одного показателя, зная величину другого.

До сих пор при анализе результатов нашего опыта по изучению действия марихуаны мы сознательно игнорировали такой показатель, как время реакции. Между тем было бы интересно проверить, существует ли связь между эффективностью реакций и их быстротой. Это позволило бы, например, утверждать, что чем человек медлительнее» тем точнее и эффективнее будут его действия и наоборот.

С этой целью можно использовать два разных способа: параметрический метод расчета коэффициента Браве - Пирсона (г) и вычисление коэффициента корреляции рангов Спирмена (rj, который применяется к порядковым данным, т.е. является непараметрическим» Однако разберемся сначала в том, что такое коэффициент корреляции.

Коэффициент корреляции

Коэффициент корреляции - это величина, которая может варьировать в пределах от +1 до — L В случае полной положительной корреляции этот коэффициент равен плюс 1, а при полной отрицательной-минус L На графике этому соответствует прямая линия, проходящая через точки пересечения значений каждой пары данных:

Переменная I

А '

Переменная В

Полная положительная корреляция [г = +1)

20'

Приложение

В случае же если эти точки не выстраиваются по прямой линии, а образуют «облако», коэффициент корреляции по абсолютной величине становится меньше единицы и по мере округления этого облака приближается к нулю:

В случае если коэффициент корреляции равен 0, обе переменные полностью независимы друг от друга,

В гуманитарных науках корреляция считается сильной, если ее коэффициент выше 0,60; если же он превышает 0,90, то корреляция считается очень сильной. Однако для того, чтобы можно было делать выводы о связях между переменными, большое значение имеет объем выборки: чем выборка больше, тем достовернее величина полученного коэффициента корреляции. Существуют таблицы с критическими значениями коэффициента корреляции Браве-Пирсона и Спирмена для разного числа степеней свободы (оно равно числу пар за вычетом 2, т. е. п — 2). Лишь в том случае> если коэффициенты корреляции больше этих критических значений, они могут считаться достоверными. Так, для того чтобы коэффициент корреляции 0,70 был достоверным, в анализ должно быть взято не меньше 8 пар данных при вычислении

г (табл. В.4) и 7 пар данных при вычислении (табл

5 в дополнении Б,5).

С тиши-тика и /юраоотка thin пых 30Q

Коэффициент Браве-Пирсона

Для вычисления этого коэффициента применяют следующую формулу (у разных авторов она может выглядеть по-разному):

где -сумма произведений данных из каждой пары;

п - число пар;

-средняя для данных переменной X;

-средняя для данных переменной У;

-стандартное отклонение Для распределения х;

-стандартное отклонение для распределения у. Теперь мы можем использовать этот коэффициент для того, чтобы установить, существует ли связь между временем реакции испытуемых и эффективностью их действий. Возьмем, например, фоновый уровень контрольной группы.

Д1
Д2
ДЗ 1 г К>8		г

Отрицательное значение коэффициента корреляции может означать, что чем больше время реакция, тем ниже эффективность. Однако величина его слишком мала для того, чтобы можно было говорить о достоверной связи между этим двумя переменными.

Теперь попробуйте самостоятельно подсчитать коэффициент корреляции для экспериментальной группы после воздействия, зная, что

j j -

.40 Приложение Ь

Какой вывод можно сделать из этил результатов? Если вы считаете, что между переменными есть связь, то какова она-прямая или обратная? Достоверна ли она [см. табл. 4 (в дополнении Б. 5) с критическими значениями г]?

Коэффициент корреляции рангов Спнрмена rs

Этот коэффициент рассчитывать проще, однако результаты получаются менее точными, чем при использовании г, Это связано с тем, что при вычислении коэффициента Спирмена используют порядок следования данных, а не их количественные характеристики и интервалы между классами.

Дело в том, что при использовании коэффициента корреляции рангов Спирмена (г,) проверяют только, будет ли ранжирование данных для какой-либо выборки таким же, как и в ряду других данных для этой выборки, попарно связанных с первыми (например, будут ли одинаково «ранжироваться» студенты при прохождении ими как психологии, так и математики, или даже при двух разных преподавателях психологии?). Если коэффициент близок к + 1, то это означает, что оба ряда практически совпадают, а если этот коэффициент близок к — 1, можно говорить о полной обратной зависимости.

Коэффициент rs вычисляют по формуле

где d- разность между рангами сопряженных значений признаков (независимо от ее знака), а п- число пар.

Обычно этот непараметрический тест используется в тех случаях, когда нужно сделать какие-то выводы не столько об интервалах между данными, сколько об их рангах, а также тогда, когда кривые распределения слишком асимметричны и не позволяют использовать такие параметрические критерии, как коэффициент г (в этих случаях бывает необходимо превратить количественные данные в порядковые).

Поскольку именно так обстоит дело с распределением значений эффективности и времени реакции в экспериментальной группе после воздействия, можно повторить расчеты,'которые вы уже проделали для этой группы, только теперь не для коэффициента г, а для показателя rF Это позволит посмотреть, насколько различаются эти два показателя.

Cniwrntcnmtcti if оораштгка ошшых

?М


Испыту-	Эффек-	Время	Ранга	Ранги	d	d*
емые	тивность	реакции	X*	У*
	.V	у
Д8					. 7	49
Д9			L		]
Д ю				11,5	3,5	12,25
Д и				7,5	4,5	20,25
Д 12				13,5	11,5	132,25
Д 13			8,5		6,5	42,25
Д 14			8,5	9,5
Ю9					1,5	2,25
Ю 10	.7
Д 11				9,5	2,5	6,25
Ю 12						I
Ю 13
Ю 14				7,5	4,5	20,25
Ю 15				13,5	6,5	42,25
Ю 16
						428 .

* Следует помнить, что

1) для числа попаданий 1-й ранг соответствует самой высокой, л 15-й-самой низкой результативности, тогда как для времени реакции 1-й ранг соответствует самому короткому времени, а 15-й-самому долгому;

⇐ Предыдущая 20 21 22 23 242526 27 28 29 Следующая ⇒