Хелпикс

Главная

Контакты

Случайная статья





Les chemins 23 страница



Все эти виды деятельности мало отличаются от тех операций, которые лежат в основе научного исследования и состоят в синтезе данных, полученных на различных группах объектов в том или ином эксперименте, в их сравнении с целью выяснить черты различия между ними, в их сопоставлении с целью выявить показатели, изменяющиеся в одном направлении, и, наконец, в предсказании определенных фактов на основании тех выводов, к которым приводят полученные результаты. Именно в этом заключается цель статистики в науках вообще, особенно в гуманитарных, В последних нет ничего абсолютно достоверного, и без статистики выводы в большинстве случаев были бы чисто интуитивны­ми и не могли бы составлять солидную основу для интерпретации данных, полученных в других исследованиях.

Для того чтобы оценить огромные преимущества, которые может дать статистика, мы попробуем проследить за ходом расшифровки и обработки данных, полученных в эксперименте. Тем самым, исходя из конкретных результатов и тех вопросов, которые они ставят перед исследователем, мы сможем разобраться в различных методиках я не­сложных способах их применения. Однако, перед тем как приступить к этой работе, лам будет полезно рассмотреть в самых общих чертах три главных раздела статистики.

1. Описательная статистика, как следует из названия, позволяет описывать, подытоживать и воспроизводить в виде таблиц или графиков

 Приложение f>

данные того или иного распределения, вычислять среднее для данного распределения и его размах и дисперсию.

2. Задача индуктивной статистики -проверка того, можно ли рас­пространить результаты, полученные на данной выборке на всю популя­цию из которой взята эта выборка- Иными словами, правила этого раздела статистики позволяют выяснить, до какой степени можно путем индукции обобщить на большее число объектов ту или иную закономер­ность, обнаруженную при изучении их ограниченной группы в ходе какого-либо наблюдения или эксперимента. Таким образом, при помо­щи индуктивной статистики делают какие-то выводы и обобщения, исходя из данных, полученных при изучении выборки.

3. Наконец, измерение корреляции позволяет узнать, насколько связа­ны между собой две переменные, с тем чтобы можно было предсказы­вать возможные значения одной из них, если мы знаем другую.

Существуют две разновидности статистических методов или тестов, позволяющих делать обобщение или вычислять степень корреляции. Первая разновидность-это наиболее широко применяемые параметри­ческие методы* в которых используются такие параметры*, как среднее значение или дисперсия данных. Вторая разновидность - это непарамет­рические методы, оказывающие неоценимую услугу в том случае, когда исследователь имеет дело с очень малыми выборками или с качествен­ными данными (см. документ БЛ); эти методы очень просты с точки зрения как расчетов, так и применения. Когда мы познакомимся с раз­личными способами описания данных и перейдем к их статистическому анализу, мы рассмотрим обе эти разновидности,

Как уже говорилось, для того чтобы попытаться разобраться в этих различных областях статистики, мы попробуем ответить на те вопросы, которые возникают в связи с результатами того или иного исследования. В качестве примера мы возьмем тот эксперимент, который приведен в главе 3, а именно-изучение влияния потребления марихуаны на глазодвигательную координацию и на время реакции. Методика, ис­пользуемая в этом гипотетическом эксперименте, а также результаты, которые мы могли бы в нем получить, представлены в дополнении Б.21.

При желании вы можете заменить какие-то конкретные детали этого эксперимента на другие-например, потребление марихуаны на потреб­ление алкоголя или лишение сна,-или, что еще лучше, подставить вместо этих гипотетических данных те, которые вы действительно получили в вашем собственном исследовании. В любом случае вам

1 Важное примечание. В разделах, посвященных описательной и индуктивной статистике, мы будем рассматривать только те данные эксперимента, которые имеют отношение к зависимой переменной «поражаемые мишени». Что касается такого показателя, как время реакции, то мы обратимся к нему только в разделе о вычислении корреляции. Однако само собой разумеется, что уже с самого начала значения этого показателя надо обрабатывать так же, как и переменную «поражаемые мишени». Мы предоставляем читателю заняться этим самостоя­тельно с помощью карандаша и бумаги.

Статистика и обработки донных                             279

придется принять «правила нашей игры» и выполнять те расчеты, которые здесь от вас потребуются; только при этом условии до вас «дойдет» существо предмета, если это уже не случилось с вами раньше1.

Дополнение Б.1. Некоторые основные понятия

Популяция н выборка2

Одна из задач статистики состоит в том, чтобы анализировать данные, полученные на части популяции, с целью сделать выводы относительно популяции в целом.

Популяция в статистике не обязательно означает какую-либо группу людей или естественное сообщество; этот термин относится ко всем существам или предметам, образующим общую изучаемую совокуп­ность, будь то атомы или студенты, посещающие то или иное кафе.

Выборка-это небольшое количество элементов, отобранных с по­мощью научных методов так, чтобы она была репрезентативной, т.е, отражала популяцию в целом,

_

Данные и их разновидности

Данные в статистике-это основные элементы, подлежащие анализу. Данными могут быть какие-то количественные результаты, свойства, присущие определенным членам популяции, место в той или иной последовательности-в общем любая информация, которая может быть классифицирована или разбита на категории с целью обработки3.

Построение распределения - это разделение первичных данных, Полу­ченных на выборке, на классы или категории с целью получить обобщен­ную упорядоченную картину, позволяющую их анализировать.

Существуют три типа данных:

' L Количественные данные* получаемые при измерениях (например, данные о весе, размерах, температуре, времени, результатах тестирова­ния и т+ п.). Их можно распределить по шкале с равными интервалами.

2. Порядковые данные соответствующие- местам этих элементов в последовательности, полученной при их расположении в возрастаю­щем порядке (1-й, ..., 7-й, ..., ЮО-й, ...; А, Б, В. ...).

 

1 Для того чтобы облегчить задачу, мы советуем вам снять фотокопии таблиц Б.1 и Б.2: тогда на всех этапах рассуждений и расчетов данные будут у вас перед глазами.

2 В отечественной литературе приняты термины соответственно «генераль­ная совокупность» и «выборочная совокупность».- Прим. перев.

3 Не следует смешивать «данные» с теми «значениями», которые эти данные могут принимать. Для того чтобы всегла различать их, Шатийон (Chatillon, 1977) рекомендует запомнить следующую фразу: «Данные часто принимают одни и те же значения» (та? если мы возьмем, например* шесть данных -8, 13, 10, 8, 10 и 5, то они принимают лишь четыре разных значения -5, 8, 10 и 13).

 Приложение Б

3. Качественные данные, представляющие собой какие-то свойства элементов выборки или популяции. Их нельзя измерить, и единственной их количественной оценкой служит частота встречаемости (число лиц с голубыми или с зелеными глазами, курильщиков и не курильщиков, утомленных и отдохнувших, сильных и слабых и т, п,).

Из всех этих типов данных только количественные данные можно анализировать с помощью методов, в основе которых лежат параметры (такие, например, Как средняя арифметическая). Но даже к количествен­ным данным такие методы можно применить лишь в том случае, если число этих данных достаточно, чтобы проявилось нормальное распреде­ление. Итак, для использования параметрических методов в принципе необходимы три условия: данные должны быть количественными, их число должно быть достаточным, а их распределение-нормальным. Во всех остальных случаях всегда рекомендуется использовать непара­метрические методы.

Дополнение Б.2* Влияние потребления марихуаны

на глазодвигательную координацию н время реакции          .

(гипотетический эксперимент)

Процедура

На группе из 30 добровольцев-студентов4 и студенток, курящих обычные сигареты, но не марихуану,-был проведен опыт по изучению глазодвигательной координации. Задача испытуемых заключалась в том, чтобы поражать предъявляемые на дисплее движущиеся мишени, манипулируя подвижным рычагом. Каждому испытуемому были предъ­явлены 10 последовательностей из 25 мишеней.

Для того чтобы установить исходный уровень, рассчитали среднее число попаданий из 25, а также среднее время реакции для 250 попыток. Далее группа была разделена на две подгруппы как можно более равным образом. Семь девушек и восемь юношей из контрольной группы получили сигарету с обычным табаком и сушеной травой, дым от которой напоминал по запаху дым марихуаны. В отличие от этого семь девушек и восемь юношей из опытной (экспериментальной) группы получили сигарету с табаком и марихуаной. Выкурив сигарету, каждый испытуемый снова был подвергнут, тесту на глазодвигательную коорди­нацию, (Более подробно этот опыт описан в главе 3).

В табл+ Б,2,1 и Б,2+2 представлены средние результаты обоих измере­ний для испытуемых той и другой группы до и после воздействия.

Средняя    15,8           16,0 Средняя 15,2 11.3
Стандарт­ное от­клонение   3,07          4,25 Стандарт­ное от­клонение ЗД7 4,04
Девушки: Д1-Д14

Юноши: Ю1

 

Ю16  

Таблица Б.2.2. Время реакции испытуемых контрольной

и опытной групп (среднее время 1/10 с в серии нз 10 испытаний)

Контрольная группа

 

Опытная группа

Испы- Фон После воз- Испы- Фон После воз-
туемые (до воз- действия туемые (до воз- действия
  дейст- (табак с   дейст- (табак с ма-
  вия) нейтраль-   вия) рихуаной)
-   ной добав-     -
    кой)      
Д 1 да
И
1$

Статистика и обработка данных

Таблица Ь.2Л. Результативность испытуемых контрольной и

опытной групп (среднее чнсло пораженных мише­ней из 25 в 10 сериях испытаний)

Контрольная группа

 

Опытная группа

Испы- Фон После воз- Испы- Фон После воз-
туемые (до воз- действия туемые (до воз- действия
  дейст- (табак с   дейст- (табак с ма-
  вия) нейтраль-   вия) рихуаной)
    ной добав-      
    кой)   -  
Д 1 Д 8
б
Ю 1 Ю9 .  9
б
Итого Итого

Приложение В

     

Продолжение табл, Б.2.2

Ю L Ю 9
. 10
И
И И
!2
П
Средняя 13,4 12,7 Средняя 14,06 17,9
Стандарт-     Стандарт-    
ное от-     нос от-    
клонение 2,29 2,09 клонение 2,28 2,97

Девушки: Д1-Д14

т

Юноши: Ю1\Ю16

           

Описательная статистика

Описательная статистика позволяет обобщать первичные результа­ты, полученные при наблюдении или в эксперименте. Процедуры здесь сводятся к группировке данных по их значениям, построению распреде­ления их частот, выявлению центральных тенденций распределения (например, средней арифметической) и, наконец, к оценке разброса данных по отношению к найденной центральной тенденции.

Группировка данных

Для группировки необходимо прежде всего расположить данные каждой выборки в возрастающем порядке. Так, в нашем эксперименте для переменной «число пораженных мишеней» данные будут распола­гаться следующим образом:

Опытная группа (дополнить цифрами}

Фон:................... *...............•. - •......

Пост воздействия; .....,.,,,,*...,.;,,,........м........ *.........

Контрольная группа                                  
Фон:  
После voatintCTBMif:  

Статистика и обработка Данных                             283

Распределение частот (числа пораженных мишеней)

Уже при первом взгляде не получение ряды можно заметить, что многие данные принимают одни и те же значения, причем одни значения встречаются чаще, а другие-реже. Поэтому было бы интересно вначале графически представить распределение различных значений с учетом их частот. При этом получают следующие столбиковые диаграммы:

Контрольная группа

После воздействий (дополнить столбиками!

Опытная группа

  £0
              Фон              

После воздействии {дополнить столбиками)

 

Такое распределение данных по их значениям дает нам уже гораздо больше, чем представление в виде радов. Однако подобную группировку используют в основном лишь для качественных данных, четко разде­ляющихся на обособленные категории (см. дополнение Б. I),

Что касается количественных данных, то они всегда располагаются на непрерывной шкале и, как правило, весьма многочисленны. Поэтому такие данные предпочитают группировать по классам, чтобы яснее видна была основная тенденция распределениям

Такая группировка состоит в основном в том, что объединяют данные с одинаковыми или близкими значениями в классы и определяют частоту для каждого класса. Способ разбиения на классы зависит от того, что именно экспериментатор хочет выявить при разделении изме­рительной шкалы на равные интервалы. Например, в нашем случае можно сгруппировать данные по классам с интервалами в две или три единицы шкалы:

 

 

 

 

 

X

X

 

 

 

 

 

 

 

 

 

 

X

X

 

X

 

X

 

 

 

 

X

 

X

X

X

X

 

х

X

X

 

 

X

 

£2

 

 

 

 

 

 

Фом

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

л.

 

 

 

 

 

 

 
                                                                                                         
         

Приложение

Б          

Контрольная групп*

   

 

 

   

 

 

 

   

 

 

  X

 

 

 

X  

 

 

  X

 

 

 

X  

 

 

X ж

 

 

 

X X

X

 

X X

X

 

X

X х

X

 

X X

X

 

X       X

X X

 

*           х

X X

X       X

Клксы 10-11 12-13 14 15 ieir 13-19 20-21 гг-га   9-1 12-14 15-17 16-го 21-23  
Частоты е э г   А    
 

 

  Фон

 

 

  Фан

 

     

(с интервалами в 2 ъд.\

     

(с интервалами в, 3 вд,}

 

(заполнить таким же образом)

_                                                                                                                                                                                                                                                                                                          

Выбор того или иного типа группировки зависит от различных соображений. Так, в нашем случае группировка с интервалами между классами в две единицы хорошо выявляет распределение результатов вокруг центрального «пика». В то же время группировка с интервалами в три единицы обладает тем преимуществом, что дает более обобщен­ную и упрощенную картину распределения* особенно если учесть, что число элементов в каждом классе невелико1. Именно поэтому в дальней* шем мы будем оперировать классами в три единицы.

Опытная групп*

Классы в-10          
Частоты            
 

Фон

Классы 5-7          
Частоты            

После воздействий (с интервалами в 3 ед.)

Данные, разбитые на классы по непрерывной шкале, нельзя предста­вить графически так, как это сделано выше. Поэтому предпочитают

1 При большом количестве данных число классов по возможности должно быть где-то в пределах от 10 ло 20, с интервалами до 10 и более.

                             
Классы а-э                          
Частоты                            
   

После воздействия {с интервалами в 2 ед.)

     

После воздействия (с интервалами в 3 ед-1

 

"_____________Статистика и обработка данных____________285



  

© helpiks.su При использовании или копировании материалов прямая ссылка на сайт обязательна.