Комментарии
10 Комментарии
Анонимный написал(а)…
Сергей, здравствуйте. Очень надеюсь, что вы заметите этот комментарий и сможете нам помочь. Мы – небольшая группа, которая затеяла некоммерческий краудфандинговый фармакологический проект. Суть его сводится к тестированию веществ на крысах. У нас есть контракт с одной лабораторией, и мы можем за ту сумму, которую планируем собрать, испытать 5 веществ (плюс плацебо и интактные) на 7 крысах, т.е. 7 групп по 7 крыс. Проблема в том, что мы не знаем, как прикинуть, какую статистически значимую разницу мы сможем на таком количестве животных засечь, и нам не хочется проводить исследование, заведомо понимая, что статистически достоверного результата не будет. Сами мы химики, и со сложной статистикой не сталкивались, а там ненормальное распределение и куча множественных сравнений. У нас есть материалы одной диссертации, которые вроде как должны помочь, но мы не очень понимаем, как именно их использовать. Помогите, нам, пожалуйста. С уважением, Дмитрий. (superhimik.livejournal.com)
21 мая 2014 г., 15:44
Sergey Mastitsky написал(а)…
Здравствуйте, Дмитрий!
Описанная Вами проблема – по сути, проблема о статистической мощности при наличии нескольких зависимых переменных – не имеет простого решения. Если копнете литературу по клиническим испытаниям – увидите, насколько эта проблема обширна и обсуждаема. В значительной мере отсутствие «простого» решения затрудняется тем, что не существует какого-то общепринятого подхода (читай «модели») для анализа такого рода данных, тогда как разговор о статистической мощности можно вести только в приложении к конкретному методу/модели. Кроме того, сам исследовательский вопрос можно сформулировать по-разному, что также будет определять выбор соответствующих статистических методов (например, можно попробовать multivariate analysis of variance (MANOVA), но можно также рассматривать все и как проблему классификации на основе большого числа предикторов, с последующим выявлением предикторов, наиболее «важных» для разграничения классов).
Максимум, что я могу сделать со своей стороны для вас – это подсказать, в «какую сторону смотреть» для нахождения приемлемого решения. Для начала, несколько, статей, обсуждающих проблему:
http://goo.gl/dj2iYO http://goo.gl/rvfelw http://goo.gl/UPUAjW http://goo.gl/FAyNrp
Многие из обсуждаемых в этих статьях методы легко реализуются в R. Примеры здесь:
http://r-analytics.blogspot.de/2014/01/multcomp.html http://r-analytics.blogspot.de/2013/11/blog-post_11.html http://r-analytics.blogspot.de/2013/11/blog-post.html http://r-analytics.blogspot.de/2013/10/blog-post_13.html
Для R имеются также специальные пакеты, позволяющие выполнять множественные сравнения при наличии нескольких зависимых переменных:
http://cran.r-project.org/web/packages/multxpert/index.html http://cran.r-project.org/web/packages/SimComp/index.html см. также комментарии к сообщению: http://r-analytics.blogspot.de/2013/10/blog-post.html
Наконец, просто чтобы примерно прикинуть, чего можно ожидать от ваших размеров групп, попробуйте сделать расчеты мощности, игнорируя тот факт, что в действительности будет проводиться большое число сравнений для нескольких зависимых переменных, измеренных на одних и тех же животных. См. примеры здесь:
http://r-analytics.blogspot.de/2012/10/t.html http://r-analytics.blogspot.de/2012/10/blog-post.html http://www.statmethods.net/stats/power.html
Надеюсь, это как-то поможет. Успехов с проектом!
27 мая 2014 г., 12:06
Анонимный написал(а)…
Сергей, спасибо!
27 мая 2014 г., 17:12
Артем написал(а)…
А в чем разница в учете эффекта множественных критериев в описанном случае (с помощью критерия Тьюки) и в случае когда мы изучаем влияние фактора на несколько параметров (где обычно применяется например FDR или какой-нибудь FWER)? Разве это не аналогичные ситуации?
21 января 2016 г., 15:07
Kella написал(а)…
Здравствуйте! Интересная статья, спасибо!
Не понятен один момент - внутригрупповая дисперсия для подсчёта критерий Тьюки (MSw) считается на двух проверяемых парах групп в данный момент или над всеми выборками?
17 октября 2016 г., 21:58
Кинзерский Александр написал(а)…
Добрый день, такой вопрос: а если для метода Тьюки использовать рандомизацию разности средних, тогда отпадает условие равенства дисперсий и нормальности распределения?
13 марта 2017 г., 19:00
Анонимный написал(а)…
"Отличие от критерия Стьюдента заключается в том, как рассчитывается стандартная ошибка SE" При расчете доверительных интервалов используется квантиль(95%)*SE. В случае со Стьюдентом квантиль находится по известной таблице со степенью свободы n-1. Как найти квантиль в данном случае и какие у него будут степени свободы? Александр
30 мая 2017 г., 12:34
Unknown написал(а)…
Доброго времени суток, есть ли непараметрический аналог критерия Тьюки? я правильно понимаю: после проведения дисперсионный анализ по Краскелу-Уоллису, по идее, что бы получить p.value с поправкой на множественные сравнения нужно и можно использовать TukeyHSD(), но R не дает этого сделать, может я что то не так делаю, или где-то ошибаюсь. q <- kruskal.test(возраст ~ Диагноз, data = mydata) TukeyHSD(q) # Диагноз: Factor w/ 5 levels "Норма","ОГ","ПОУГ",..: 1 2 4 5 4 4
И второй вопрос: реализована ли в R возможность расчета отличий средних значений другой переменной (например уровень систолического артериального давления), с поправкой на возраст, при условии отличного от нормального распределения возраста в подгруппах. Заранее спасибо за ответ.
14 октября 2017 г., 12:40
White Unicorn написал(а)…
Здравствуйте! Очень интересная и информативная статья! Я на данный момент студент второго курса и пока недостаточно хорошо владею основами статистики. Моей целью является сравнение 4 групп животных (по 30 особей каждая) по 13 морфологическим признакам т.е. по каким из этих признаков значимо отличаются группы и какие именно группы. Я правильно понимаю, что для этого я должен использовать MANOVA? Для того чтобы сделать поправку на множественное сравнение, должен ли я использовать поправку Бонферрони (так как имею 4 группы) или критерий Тьюки, а может для подобного анализа существует другой критарий? Заранее спасибо!
9 ноября 2017 г., 16:05
Dr. Tseitlin написал(а)…
Мне не нравится представление, предложенное выдающимся статистиком Тьюки. Оно – и громоздкое, и малоэффективное (какие-то нелепые коробки)! Я предпочитаю пользоваться построением и сравнением функций распределения выборок более иллюстративным методом доверительных интервалов (МДИ) http://biometrica.tomsk.ru/A-metod-HPI-2.pdf
24 января 2019 г., 21:52
|