Подсчет критерия Q Розенбаума. Автоматический расчет U-критерия Манна-Уитни

Подсчет критерия Q Розенбаума. Автоматический расчет U-критерия Манна-Уитни
Подсчет критерия Q Розенбаума. Автоматический расчет U-критерия Манна-Уитни

Q-критерий Розенбаума

Непараметрический критерий, который используется для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. Данный критерий является не достаточно мощным, то есть, если критерий Q не выявляет достоверных различий, это еще не означает, что их действительно нет. В этом случае стоит применять критерий U-Манна-Уитни или j * Фишера.

Критерий применяется в тех случаях, когда данные представлены в порядковой, интервальной шкале или шкале отношений. Признак должен варьировать в каком-то диапазоне значений.

Ограничения критерия:

1) n 1 и n 2 ³11 (n 1 и n 2 - объемы соответственно 1-й и 2-й выборок).

2) Объемы выборок должны примерно совпадать. Так,

а) если n 1 и n 2 £50, то ú n 1 -n 2 ê£10;

б) если 51£n 1 и n 2 £100, то ú n 1 -n 2 ê£20;

в) если n 1 и n 2 >100, то n 1 / n 2 или n 1 /n 2 £2.

3) Диапазон разброса значений в двух выборках должны не совпадать между собой, т.е. либо max 1 ¹max 2 , либо min 1 ¹min 2 .

Эмпирическое значение критерия вычисляется по формуле:

Критические значения критерия можно определить по таблице 1 приложения 2.

Различия между выборками считаются достоверными, если Q эмп ³Q 0,01 ; незначимыми, если Q эмп < Q 0,05 ; достоверными на 5% уровне, если Q 0,05 £ Q эмп

Пример. С учащимися шестого класса (15 человек) и восьмого (17 человек) были проведены 8 субтестов теста структуры интеллекта Р. Амтхауера, и получен обобщенный показатель. Результаты представлены в таблице 15. Можно ли утверждать, что учащиеся восьмого класса превосходят учащихся шестого класса по обобщенному показателю теста Р. Амтхауера?

Таблица 15

Индивидуальные значения обобщенного показателя теста Р. Амтхауера учащихся шестого (n 1 =15) и восьмого (n 2 =17) классов

6 класс 8 класс
Обобщенный показатель Обобщенный показатель Обобщенный показатель Обобщенный показатель

Решение : Данные представлены в интервальной шкале,

n 1 =15 и n 2 =17 это >11; ún 1 - n 2 ï=2< 10;

max 1 =94 ¹ max 2 =107.

Следовательно, для решения данной задачи мы имеем право применять критерий Q.

Для вычисления необходимо упорядочить данные по убыванию. При этом значения выборки, где данные предположительно, выше записываются в 1 ряд, а где ниже, - соответственно во 2-й ряд. Так, в нашем случае 1 ряд – значения учащихся 8 класса, 2 ряд – 6 класса (таблица 16).

Сформулируем экспериментальную гипотезу: учащиеся 8-го класса превосходят учащихся 6-го класса по обобщенному показателю теста Р. Амтхауера.

Таблица 16

Упорядоченные по убыванию обобщенного

показателя теста Р. Амтхаера индивидуальные

значения учащихся 8 и 6 классов

1 ряд – учащиеся 8 класса 2 ряд – учащиеся 6 класса
S 1 =4
71 71
69 69
S 2 =7
54 54

Определим максимальное значение в ряду 2-м и подсчитаем количество значений в ряду 1-м, лежащих выше этого значения: S 1 =4.

Ограничения критерия

Назначение критерия

Непараметрические критерии для сравнения независимых выборок

Непараметрический критерий Розенбаума (критерий «хвостов»)

Критерий Розенбаума применяется для оценки различий между двумя выборками по уровню какого-либо признака.

Этот метод сравнивает два ряда упорядоченных значений и определяет, достаточно ли сильно они различаются или насколько велика область значений в выборках, которые не пересекаются. При этом 1-м рядом (выборкой, группой) называется тот ряд значений, в котором значения, по предварительной оценке, выше, а 2-м рядом - тот, где они предположительно ниже.

Чем больше область неперекрещивающихся значений (чем больше «хвосты»), тем более вероятно, что различия достоверны.

Расчетное (эмпирическое) значение критерия Q отражает то, насколько велика зона совпадения между рядами. Поэтому чем больше Q эмп. , тем более вероятно, что различия достоверны.

1. Признак должен быть измерен по ординальной, интервальной или пропорциональной шкале.

2. Выборки должны быть независимыми.

3. В каждой выборке должно быть не меньше 11 наблюдений. Объемы выборок должны примерно совпадать. При этом указываются следующие правила:

а) если в каждой выборке меньше 50 наблюдений, то абсолютная величина разности между N 1 и N 2 должна быть больше 10 наблюдений;

б) если в каждой выборке больше 51 наблюдения, но меньше 100, то абсолютная величина разности между N 1 и N 2 не должна быть больше 20 наблюдений;

в) если в каждой выборке больше 100 наблюдений, то допускается, чтобы одна из выборок была больше другой не более чем в 1,5-2 раза.

3. Диапазоны разброса значений (x max –x min ) в двух выборках не должны совпадать между собой. Применение критерия бессмысленно, если «хвосты» равны 0. Однако при этом между средними могут существовать статистически значимые различия, обусловленные, например, разносторонне направленной асимметрией распределений.

1. В каждой выборке отдельно упорядочить значения признака по возрастанию. При этом считать 1-й выборку тот ряд значений, в котором значения по предварительной оценке выше, а 2-й - ту выборку, в которой значения предположительно ниже.

2. Найти самое высокое значение в выборке 2.

4. Найти в выборке 1 самое маленькое значение.

6. Вычислить расчетное значение критерия Розенбаума по формуле Q эмп. =S 1 +S 2

Эти шаги проиллюстрированы на рисунке 17.



Рис. 17. Критерий Розенбаума

7. Правило принятия решения (правило вывода):

Если N 1 ,N 2 <26, то по таблице критических значений критерия Розенбаума (см. соответствующее приложение в книге Сидоренко Е. В.) в зависимости от N 1 и N 2 найти критическое значение критерия.

Если N 1 ,N 2 >26, то Q эмп. =8 при р =0,95 и Q эмп. =10 при р=0,99.

Если Q эмп. < Q кр. , различия между выборками статистически незначимы, Н 0 принимается, то есть статистически значимых различий по выраженности признака в двух независимых выборках нет.

Если Q эмп. ≥ Q кр. , различия между выборками статистически достоверны, Н 0 отвергается и принимается Н 1 , то есть в одной из выборок статистически значимо чаще встречаются более высокие значения.

Использование критерия: для оценки различий между двумя и более выборками по уровню какого-либо признака, измеренного количественно. Объем выборки не менее 11 испытуемых. Критерий применяется, когда данные представлены в порядковой шкале (№№ участников или степень возрастания признака).

H 0 Qэмп < Qкр: Уровень признака в выборке S 1 не превышает уровень признака S 2. Различия не достоверны.

H 1 Qэмп >/= Qкр : Уровень признака в выборке S 1 превышает уровень признака S 2. Различия достоверны.

1. Упорядочить значения отдельно в каждой выборке по степени возрастания признака; принять за первую выборку ту, значения признака в которой предположительно выше, а за вторую – ту, где значения признака предположительно ниже.

2. Определить максимальное значение признака во второй выборке и подсчитать количество значений признака в первой выборке, которые больше его (S 1).

3. Определить минимальное значение признака в первой выборке и подсчитать количество значений признака во второй выборке, которые меньше его (S 2).

5. По таблице определить критические значения критерия для данных n 1 и n 2.

H 0 , H 1

U-критерий Манна-Уитни

Использование критерия: U-критерий определяет, достаточно ли мала зона перекрещивающихся значений между двумя ранжированными рядами. Чем меньше значение критерия, тем вероятнее, что различия между значениями параметра в выборках достоверны. Объем выборки: в каждой из выборок должно быть не менее 3 значений признака. Допускается, чтобы в одной выборке было два значения, но во второй тогда не менее пяти. В выборочных данных не должно быть совпадающих значений или таких совпадений должно быть очень мало.

H 0 Qэмп >/= Qкр: Существенного различия между уровнем признака в выборках не выявлено.

H 1 Qэмп < Qкр : Признается наличие существенного различия между уровнем признака в рассматриваемых выборках. Различия достоверны.

1. Составить единый ранжированный ряд из обеих сопоставляемых выборок, расставив их элементы по степени нарастания признака и приписав меньшему значению меньший ранг. Общее количество рангов получится равным: N = n 1 + n 2, где n 1 - количество единиц в первой выборке, а n 2 - количество единиц во второй выборке. Большее количество единиц обозначается nx.

2. Определить сумму первой выборки (Σ R1), сумму второй выборки (ΣR2), общую сумму рангов (ΣR). Проверить по формуле ΣR=N ּ(N +1)

3. Разделить единый ранжированный ряд на два, состоящие соответственно из единиц первой и второй выборок. Подсчитать отдельно сумму рангов, пришедшихся на долю элементов первой выборки, и отдельно - на долю элементов второй выборки. Определить большую из двух ранговых сумм (Tx ), соответствующую выборке с nx единиц.

4. Определить значение U-критерия Манна-Уитни по формуле: .

5. По таблице для избранного уровня статистической значимости определить критическое значение критерия для данных n 1 и n 2.

H 1 , H 0

Критерий знаков G

Использование критерия: Критерий знаков G предназначен для установления общего направления сдвига исследуемого признака. Он позволяет установить, в какую сторону в выборке в целом изменяются значения признака при переходе от первого измерения ко второму. Критерий знаков применим и к тем сдвигам, которые можно определить лишь качественно. Сдвиги, которые оказываются преобладающими, называются типичными . Сдвиги противоположного направления называются нетипичными . Если значения признака не меняются, сдвиг нулевой , и его можно исключить из рассмотрения.

H 0 Qэмп >/= Qкр : в состоянии изучаемого свойства нет значимых различий при первичном и вторичном измерениях.

H 1 Qэмп < Qкр : состояния изучаемого свойства существенно различны в одной и той же совокупности при первичном и вторичном измерениях этого свойства.

2. Определить преобладающее направление сдвига.

3. Определить количество нетипичных сдвигов и обозначить их число Gэмп

4. По таблице определить Gкр

n – общее количество ненулевых сдвигов

n0 – количество нулевых сдвигов

nобщ – количество испытуемых

H 1 , H 0

Коэффициент ранговой корреляции Спирмена

Использование критерия: Объем выборки: не менее 5 и не более 40 наблюдений.

H 0 Q эмп < Q кр:

H 1 Q эмп >/= Q кр

1. Определить каждому из признаков ранг по возрастанию (наименьшему значению присвоить наименьший ранг).

2. Определить разности рангов каждой пары сопоставляемых значений.

3. Возвести в квадрат каждую разность и суммировать полученные результаты.

4.Вычислить коэффициент корреляции рангов по формуле:

5. Определить по таблице rкр

H 0 , H 1

Коэффициент ранговой корреляции Кендалла

Использование критерия: это непараметрический метод, который используется с целью статистического изучения связи между явлениями. В этом случае дается оценка тесноты установленной связи с помощью количественно выраженного коэффициента.

H 0 Q эмп < Q кр: Корреляция между x и y не отличается от нуля.

H 1 Q эмп >/= Q кр : Корреляция между x и y достоверно отличается от нуля.

1. Упорядочить первый признак x по возрастанию, в соответствии с ним переставить значения y.

3. Проверить по формуле P+Q=N (N -1)

5. Вычислить τкр по таблице Т-критериев Стьюдента. τкр (k; α), k=N-2

6. Вычислить Т коэффициент: Тэмп = | τэмп |ּ√N -2

1. Проверить, выполняются ли ограничения: n 1 n 2 ≥11, n 1 n 2 ≈n 2 Упорядочить значения отдельно в каждой выборке по степени воз­растания признака. Считать выборкой 1 ту выборку, значения в ко­торой предположительно выше, а выборкой 2 - ту, где значения предположительно ниже.

3. Определить самое высокое (максимальное) значение в выборке 2.

5. Определить самое низкое (минимальное) значение в выборке 1.

8. По Табл. I Приложения I определить критические значения Q для данных n 1 и n 2 . Если Q эмп равно Q 0,05 или превышает его, Н 0 от­вергается.

9. При n 1 n 2 >26сопоставить полученное эмпирическое значение с Q к p = 8 (р≤ 0,05) и Q к p = 10(p≤ 0,01). Если Q эмп превышает или по крайней мере равняется Q к p = 8, H 0 отвергается.

2.3. U - критерий Манна-Уитни

Назначение критерия

Критерий предназначен для оценки различий между двумя вы­борками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между малыми выборками, когда n 1 n 2 ≥ 3 или n 1 =2, n 2 ≥5, и является более мощным, чем критерий Ро­зенбаума.

Описание критерия

Существует несколько способов использования критерия и не­сколько вариантов таблиц критических значений, соответствующих этим способам (Гублер Е. В., 1978; Рунион Р., 1982; Захаров В. П., 1985; McCall R., 1970; Krauth J., 1988).

Этот метод определяет, достаточно ли мала зона перекрещиваю­щихся значений между двумя рядами. Мы помним, что 1-м рядом (выборкой, группой) мы называем тот ряд значений, в котором значе­ния, по предварительной оценке, выше, а 2-м рядом - тот, где они предположительно ниже.

Чем меньше область перекрещивающихся значений, тем более ве­роятно, что различия достоверны. Иногда эти различия называют раз­личиями в расположении двух выборок (Welkowitz J. et al., 1982).

Эмпирическое значение критерия U отражает то, насколько вели­ка зона совпадения между рядами. Поэтому чем меньше U эмп, тем более вероятно, что различия достоверны.

Гипотезы

Н 0: Уровень признака в группе 2 не ниже уровня признака в группе 1.

H 1: Уровень признака в группе 2 ниже уровня признака в группе 1.

Графическое представление критерия U

На Рис. 2.5. представлены три из множества возможных вариан­тов соотношения двух рядов значений.

В варианте (а) второй ряд ниже первого, и ряды почти не пере­крещиваются. Область наложения слишком мала, чтобы скрадывать различия между рядами. Есть шанс, что различия между ними досто­верны. Точно определить это мы сможем с помощью критерия U.

В варианте (б) второй ряд тоже ниже первого, но и область пе­рекрещивающихся значений у двух рядов достаточно обширна. Она может еще не достигать критической величины, когда различия придет­ся признать несущественными. Но так ли это, можно определить толь­ко путем точного подсчета критерия U.

В варианте (в) второй ряд ниже первого, но область наложения настолько обширна, что различия между рядами скрадываются.

Ограничения критерия U

1. В каждой выборке должно быть не менее 3 наблюдений: n 1 n 2 ≥3; допускается, чтобы в одной выборке было 2 наблюдения, но тогда во второй их должно быть не менее 5.

2. В каждой выборке должно быть не более 60 наблюдений; n 1 n 2 ≤60. Однако уже при n 1 n 2 >20 ранжирование становиться достаточно трудоемким.

На наш взгляд, в случае, если n 1 n 2 >20, лучше использовать другой критерий, а именно угловое преобразование Фишера в комбина­ции с критерием λ, позволяющим выявить критическую точку, в кото­рой накапливаются максимальные различия между двумя сопоставляе­мыми выборками (см. п. 5.4). .Формулировка звучит сложно, но сам метод достаточно прост. Каждому исследователю лучше попробовать разные пути и выбрать тот, который кажется ему более подходящим.

Пример

Вернемся к результатам обследования студентов физического и психологического факультетов Ленинградского университета с помощью методики Д. Векслера для измерения вербального и невербального ин­теллекта. С помощью критерия Q Розенбаума мы в предыдущем па­раграфе смогли с высоким уровнем значимости определить, что уровень вербального интеллекта в выборке студентов физического факультета выше. Попытаемся установить теперь, воспроизводится ли этот резуль­тат при сопоставлении выборок по уровню невербального интеллекта. Данные приведены в Табл. 2.3.

Можно ли утверждать, что одна из выборок превосходит другую по уровню невербального интеллекта?

Таблица 2.3

Индивидуальные значения невербального интеллекта в выборках студентов физического (щ=\4) и психологического (п2 = 12) факультетов

Студенты-физики Студенты-психологи
Код имени испытуемого Код имени испытуемого Показатель невербального интеллекта
1. И.А. 1. Н.Т. ИЗ
2. К.А. 2. О.В.
3. К.Е. 3. Е.В.
4. П.А. 4. Ф.О.
5. С.А. 5. И.Н.
6. Ст.А. 6. И.Ч.
7. Т.А. 7. И.В.
8. Ф.А. 8. К.О.
9. Ч.И. 9. P.P.
10. ЦА. 10. Р.И.
11. См.А. 11. O.K.
12. К.Ан. 12. Н.К.
13. Б.Л.
14. Ф.В.

Критерий U требует тщательности и внимания. Прежде всего, необходимо помнить правила ранжирования.

Правила ранжирования

1. Меньшему значению начисляется меньший ранг. Наименьшему значению начисляется ранг 1.

Наибольшему значению начисляется ранг, соответствующий количе­ству ранжируемых значений. Например, если n=7, то наибольшее значение получит ранг 7, за возможным исключением для тех слу­чаев, которые предусмотрены правилом 2.

2. В случае, если несколько значений равны, им начисляется ранг, представляющий собой среднее значение из тех рангов, которые они получили бы, если бы не были равны.

Например, 3 наименьших значения равны 10 секундам. Если бы мы измеряли время более точно, то эти значения могли бы различаться и составляли бы, скажем, 10,2 сек; 10,5 сек; 10,7 сек. В этом случае они получили бы ранги, соответственно, 1, 2 и 3. Но поскольку полученные нами значения равны, каждое из них получа­ет средний ранг:

Допустим, следующие 2 значения равны 12 сек. Они должны были бы получить ранги 4 и 5, но, поскольку они равны, то получают средний ранг:

3. Общая сумма рангов должна совпадать с расчетной, которая опре­деляется по формуле:

где N - общее количество ранжируемых наблюдений (значений). Несовпадение реальной и расчетной сумм рангов будет свидетельст­вовать об ошибке, допущенной при начислении рангов или их сум­мировании. Прежде чем продолжить работу, необходимо найти ошибку и устранить ее.

При подсчете критерия U легче всего сразу приучить себя дейст­вовать по строгому алгоритму.

АЛГОРИТМ 4


©2015-2019 сайт
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-03-31

Критерий Q Розенбаума основан на сравнении двух упорядоченных рядов наблюдений. Первым рядом считается тот, где максимальная и минимальная величины больше, чем в другом ряду. Подсчитываются число S - количество наблюдений первого ряда, которые больше максимальной величины второго ряда, и число Т - количество наблюдений второго ряда, которые меньше минимальной величины первого ряда. Величины S и Т образно называют «хвостами» распределений, а критерий Q - «критерием хвостов». Когда сумма Q = S + Т достаточно велика, можно считать различия сравниваемых выборок значимыми. Критическое значение Q для количества наблюдений 11-26 в каждой выборке приводится в таблице ниже. Если число наблюдений меньше 11, критерий Q применять нельзя. Зато при числе наблюдений более 26 в каждой из сравниваемых выборок он не имеет верхнего предела численности наблюдений, причем справочные таблицы в этом случае уже не нужны. При любом числе наблюдений больше 26 минимальная величина Q, когда различия можно считать существенными с P Q = 0,05, равна 8, а с P Q = 0,01 - равна 10. Необходимо оговориться, что эти минимальные значения Q при n 1 ,n 2 >26 справедливы при условиях, когда n 1 приблизительно равно n 2 . Так, когда объем выборок не превышает 50, допустимы различия между n 1 и n 2 на 10, при n 1 , n 2 от 51 до 100 допустимы различия на 15-20, при n 1 , n 2 > 100 допустимы различия между выборками в 1,5- 2 раза.

Таблица критерий Розенбаума

Минимальные значения Q, при которых различия между двумя группами наблюдений можно считать значимыми с P Q = 0,01 и P Q = 0,05