Calcul du test Q de Rosenbaum. Calcul automatique du test U de Mann-Whitney

Calcul du test Q de Rosenbaum.  Calcul automatique du test U de Mann-Whitney
Calcul du test Q de Rosenbaum. Calcul automatique du test U de Mann-Whitney

Test Q de Rosenbaum

Test non paramétrique utilisé pour évaluer les différences entre deux échantillons en termes de niveau de tout trait mesuré quantitativement. Ce critère n'est pas assez puissant, c'est-à-dire que si le critère Q ne révèle pas de différences significatives, cela ne veut pas dire qu'elles n'existent pas réellement. Dans ce cas, il vaut la peine d'utiliser le test U de Mann-Whitney ou le test j* de Fisher.

Le critère est utilisé dans les cas où les données sont présentées sur une échelle ordinale, d'intervalle ou de rapport. Le signe doit varier dans une certaine plage de valeurs.

Limites des critères :

1) n 1 et n 2 ³11 (n 1 et n 2 sont respectivement les volumes des 1er et 2ème échantillons).

2) La taille des échantillons doit être approximativement la même. Donc,

a) si n 1 et n 2 50 £, alors ú n 1 -n 2 10 £ ;

b) si 51 £n 1 et n 2 £100, alors ú n 1 -n 2 ê£20 ;

c) si n 1 et n 2 >100, alors n 1 / n 2 ou n 1 / n 2 £2.

3) La plage de répartition des valeurs dans deux échantillons ne doit pas coïncider l'une avec l'autre, c'est-à-dire soit max 1 ¹max 2 ou min 1 ¹min 2 .

Valeur empirique du critère calculé par la formule :

Valeurs des critères critiques peut être déterminé à partir du tableau 1 de l’annexe 2.

Les différences entre les échantillons sont considérées comme significatives si Q em ³Q 0,01 ; insignifiant si Q em< Q 0,05 ; достоверными на 5% уровне, если Q 0,05 £ Q эмп

Exemple. Huit sous-tests du test de structure d'intelligence de R. Amthauer ont été réalisés auprès d'élèves de sixième année (15 personnes) et de huitième année (17 personnes), et un indicateur généralisé a été obtenu. Les résultats sont présentés dans le tableau 15. Est-il possible de dire que les élèves de huitième année sont supérieurs aux élèves de sixième sur l'indicateur généralisé du test de R. Amthauer ?

Tableau 15

Valeurs individuelles de l'indicateur généralisé du test de R. Amthauer pour les élèves de sixième (n 1 =15) et huitième (n 2 =17) années

6ème année 8e année
Indicateur généralisé Indicateur généralisé Indicateur généralisé Indicateur généralisé

Solution: Les données sont présentées sur une échelle d'intervalle,

n 1 =15 et n 2 =17 sont >11 ; ún 1 - n 2 ï=2< 10;

maximum 1 =94 ¹ maximum 2 =107.

Par conséquent, pour résoudre ce problème, nous avons le droit d’appliquer le critère Q.

Pour calculer, vous devez trier les données par ordre décroissant. Dans ce cas, les valeurs d'échantillon, où les données sont censées être plus élevées, sont enregistrées dans la 1ère ligne, et là où les données sont inférieures, respectivement, dans la 2ème ligne. Donc, dans notre cas, ligne 1 – valeurs des élèves de 8e année, 2e rangée – 6e année (Tableau 16).

Formulons une hypothèse expérimentale : les élèves de 8e sont supérieurs aux élèves de 6e dans l'indicateur généralisé du test de R. Amthauer.

Tableau 16

Triés par ordre décroissant de généralisé

Indicateur de test R. Amthaer individuel

valeurs pour les élèves de 8e et 6e

1er rang – élèves de 8e année 2ème rangée – élèves de 6ème
S1 =4
71 71
69 69
S2 =7
54 54

Déterminons la valeur maximale dans la 2ème ligne et comptons le nombre de valeurs dans la 1ère ligne qui se situent au-dessus de cette valeur : S 1 =4.

Limites du critère

Objectif du critère

Tests non paramétriques pour comparer des échantillons indépendants

Test de Rosenbaum non paramétrique (test de queue)

Le test de Rosenbaum est utilisé pour évaluer les différences entre deux échantillons en termes de niveau de n'importe quel attribut.

Cette méthode compare deux séries de valeurs ordonnées et détermine si elles sont suffisamment différentes ou quelle est l'étendue de la plage de valeurs dans des échantillons qui ne se chevauchent pas. Dans ce cas, la 1ère ligne (échantillon, groupe) est la ligne de valeurs dans laquelle les valeurs, selon les estimations préliminaires, sont plus élevées, et la 2ème ligne est celle où elles sont censées être inférieures.

Plus la zone de valeurs qui ne se chevauchent pas est grande (plus les « queues ») sont grandes, plus il est probable que les différences soient significatives.

La valeur calculée (empirique) du critère Q reflète la taille de la zone de coïncidence entre les lignes. Par conséquent, plus Q em. , plus il est probable que les différences soient significatives.

1. Le trait doit être mesuré sur une échelle ordinale, par intervalles ou proportionnelle.

2. Les échantillons doivent être indépendants.

3. Chaque échantillon doit contenir au moins 11 observations. La taille des échantillons doit être à peu près la même. Les règles suivantes sont précisées :

a) si chaque échantillon contient moins de 50 observations, alors valeur absolue la différence entre N 1 et N 2 doit être supérieure à 10 observations ;

b) si chaque échantillon comporte plus de 51 observations, mais moins de 100, alors la valeur absolue de la différence entre N 1 et N 2 ne doit pas dépasser 20 observations ;

c) si chaque échantillon contient plus de 100 observations, il est alors permis que l'un des échantillons ne soit pas plus de 1,5 à 2 fois plus grand que l'autre.

3. Plages de valeurs ( x maximum –x min) dans deux échantillons ne doivent pas coïncider. L'utilisation du critère n'a aucun sens si les « queues » sont égales à 0. Cependant, il peut y avoir des différences statistiquement significatives entre les moyennes, dues par exemple à une asymétrie multidirectionnelle des distributions.

1. Dans chaque échantillon, classez séparément les valeurs caractéristiques par ordre croissant. Dans ce cas, considérons le 1er échantillon comme la série de valeurs dans laquelle les valeurs selon les estimations préliminaires sont plus élevées, et le 2ème échantillon comme la série dans laquelle les valeurs sont censées être inférieures.

2. Trouvez la valeur la plus élevée de l’échantillon 2.

4. Trouvez la plus petite valeur de l’échantillon 1.

6. Calculez la valeur calculée du critère de Rosenbaum à l'aide de la formule Q em. =S1 +S2

Ces étapes sont illustrées à la figure 17.



Riz. 17. Critère de Rosenbaum

7. Règle de décision (règle d'inférence) :

Si N 1,N 2<26, то по таблице критических значений критерия Розенбаума (см. соответствующее приложение в книге Сидоренко Е. В.) в зависимости от N 1 и N 2 найти критическое значение критерия.

Si N 1,N 2 >26, alors Q em. =8 à p =0,95 et Q em. =10 à p=0,99.

Si Q em.< Q кр. , различия между выборками статистически незначимы, Н 0 принимается, то есть статистически значимых различий по выраженности признака в двух независимых выборках нет.

Si Q em. ≥ Q cr. , les différences entre les échantillons sont statistiquement significatives, H 0 est rejeté et H 1 est accepté, c'est-à-dire que dans l'un des échantillons, des valeurs plus élevées sont statistiquement significativement plus courantes.

En utilisant le critère :évaluer les différences entre deux échantillons ou plus en termes de niveau de toute caractéristique mesurée quantitativement. Taille de l'échantillon au moins 11 matières. Le critère est appliqué lorsque les données sont présentées sur une échelle ordinale (nombre de participants ou degré d'augmentation d'une caractéristique).

H0 Qamp< Qкр: Niveau d'attribut dans l'échantillon S 1 ne dépasse pas le niveau d'attribut S 2. Les différences ne sont pas significatives.

H1 Qamp>/= Qcr: Niveau de la caractéristique dans l'échantillon S 1 dépasse le niveau d'attribut S 2. Les différences sont significatives.

1. Classez les valeurs séparément dans chaque échantillon en fonction du degré d'augmentation de la caractéristique ; prenez comme premier échantillon celui dans lequel les valeurs d'attribut sont vraisemblablement plus élevées, et comme deuxième échantillon – celui dans lequel les valeurs d'attribut sont vraisemblablement inférieures.

2. Déterminez la valeur maximale de l'attribut dans le deuxième échantillon et comptez le nombre de valeurs d'attribut dans le premier échantillon qui lui sont supérieures ( S 1).

3. Déterminez la valeur minimale de l'attribut dans le premier échantillon et comptez le nombre de valeurs d'attribut dans le deuxième échantillon qui lui sont inférieures ( S 2).

5. À l'aide du tableau, déterminez les valeurs critiques du critère pour les données n 1 et n 2.

H 0 , H 1

Test U de Mann-Whitney

Utilisation du test : Le test U détermine si la zone de valeurs qui se chevauchent entre deux séries classées est suffisamment petite. Plus la valeur du critère est faible, plus il est probable que les différences entre les valeurs des paramètres dans les échantillons soient fiables. Taille de l'échantillon : chaque échantillon doit avoir au moins 3 valeurs caractéristiques. Il est permis qu'il y ait deux valeurs dans un échantillon, mais dans le second il y en a au moins cinq. Il ne devrait y avoir aucune ou très peu de valeurs correspondantes dans les exemples de données.

H0 Qem >/= Qcr : Il n’y avait aucune différence significative entre le niveau du trait dans les échantillons.

H1 Qamp < Qкр : Il est reconnu qu'il existe une différence significative entre le niveau de l'attribut dans les échantillons considérés. Les différences sont significatives.

1. Composez une série classée unique à partir des deux échantillons comparés, en organisant leurs éléments en fonction du degré de croissance de la caractéristique et en attribuant un rang inférieur à la valeur la plus petite. Le nombre total de rangs sera égal à : N = n 1 + n 2, où n 1 est le nombre d'unités dans le premier échantillon, et n 2 - nombre d'unités dans le deuxième échantillon. Grande quantité les unités sont notées nx.

2. Déterminez la somme du premier échantillon (ΣR1), la somme du deuxième échantillon (ΣR2), la somme totale des rangs (ΣR). Vérifiez en utilisant la formule ΣR= Nּ(N+1)

3. Divisez la série classée unique en deux, constituées respectivement des unités du premier et du deuxième échantillons. Calculez séparément la somme des rangs qui correspondent à la part des éléments du premier échantillon et séparément - à la part des éléments du deuxième échantillon. Définir grand de deux sommes de rang ( Émission), correspondant à l'échantillon avec nx unités.

4. Déterminez la valeur du test U de Mann-Whitney à l'aide de la formule : .

5. À l'aide du tableau du niveau de signification statistique sélectionné, déterminez la valeur critique du critère pour les données n 1 et n 2.

H 1 , H 0

Critère de signe G

En utilisant le critère : Le critère de signe G vise à établir direction générale déplacement de la caractéristique étudiée. Il vous permet de déterminer dans quelle direction dans l'échantillon dans son ensemble les valeurs des attributs changent lors du passage de la première mesure à la seconde. Le critère des signes s'applique également aux déplacements qui ne peuvent être déterminés que qualitativement. Les changements prédominants sont appelés typique. Les changements dans la direction opposée sont appelés atypique. Si les valeurs caractéristiques ne changent pas, décalez nul, et il peut être exclu de la considération.

H0 Qamp>/= Qcr: dans l'état du bien étudié il n'y a pas de différences significatives dans les mesures primaires et secondaires.

H1 Qamp < Qкр : les états de la propriété étudiée sont significativement différents dans une même population lors des mesures primaires et secondaires de cette propriété.

2. Déterminez la direction prédominante du cisaillement.

3. Déterminer le nombre d'équipes atypiques et désigner leur numéro Gamp

4. À l'aide du tableau, déterminez Gcr

n – total décalages non nuls

n0 – nombre de décalages zéro

ntotal – nombre de sujets

H 1 , H 0

Coefficient de corrélation de rang de Spearman

En utilisant le critère : Taille de l'échantillon: pas moins de 5 et pas plus de 40 observations.

H0 Qem < Qcr :

H1 Qem >/= Qcr

1. Déterminez le rang de chaque fonctionnalité par ordre croissant (attribuez le rang le plus bas à la plus petite valeur).

2. Déterminez les différences de rang de chaque paire de valeurs comparées.

3. Mettez au carré chaque différence et résumez les résultats.

4.Calculez le coefficient de corrélation de rang à l'aide de la formule :

5. Déterminez rcr à partir du tableau

H 0 , H 1

Coefficient de corrélation de rang de Kendall

En utilisant le critère : Il s'agit d'une méthode non paramétrique utilisée dans le but d'étudier statistiquement la relation entre les phénomènes. Dans ce cas, l'étanchéité de la connexion établie est évaluée à l'aide d'un coefficient exprimé quantitativement.

H0 Qem < Qcr : La corrélation entre x et y n’est pas différente de zéro.

H1 Qem >/= Qcr: La corrélation entre x et y est significativement différente de zéro.

1. Triez la première caractéristique x par ordre croissant et réorganisez les valeurs de y en fonction de celle-ci.

3. Vérifiez en utilisant la formule P+Q= N(N-1)

5. Calculez τcr à l’aide du tableau des critères T de Student. τcr (k; α), k=N-2

6. Calculez le coefficient T : Temp = | τtemp |ּ√ N-2

1. Vérifiez si les restrictions sont respectées : n 1 n 2≥11, n 1 n 2 ≈n 2 Triez les valeurs séparément dans chaque échantillon en fonction du degré d'attribut croissant. Considérez l'échantillon 1 comme l'échantillon dans lequel les valeurs sont censées être plus élevées, et l'échantillon 2 comme celui dans lequel les valeurs sont censées être inférieures.

3. Déterminez la valeur la plus élevée (maximale) de l’échantillon 2.

5. Déterminez la valeur la plus basse (minimale) de l’échantillon 1.

8. Selon le tableau. I Annexe I déterminer les valeurs Q critiques pour les données n°1 Et numéro 2. Si Q em est égal ou supérieur à Q 0,05, H 0 est rejeté.

9. Quand n 1 n 2>26comparer la valeur empirique obtenue avec Q à p = 8 (p≤ 0,05) et Q à p = 10(p≤ 0,01). Si Q em est supérieur ou au moins égal à Q à p = 8, H 0 est rejeté.

2.3. U- Test de Mann-Whitney

Objectif du critère

Le critère vise à évaluer les différences entre deux des échantillons par niveau toute caractéristique mesurée quantitativement. Il permet d'identifier les différences entre petit des échantillons quand n 1 n 2 ≥ 3 ou n 1 =2, n 2 ≥5, et est plus puissant que le critère de Rosenbaum.

Description du critère

Il existe plusieurs manières d'utiliser le critère et plusieurs options pour les tableaux de valeurs critiques correspondant à ces méthodes (Gubler E. V., 1978 ; Runion R., 1982 ; Zakharov V. P., 1985 ; McCall R., 1970 ; Krauth J., 1988 ) .

Cette méthode détermine si la zone de croisement des valeurs entre deux séries est suffisamment petite. Nous rappelons que la 1ère ligne (échantillon, groupe) est appelée la ligne de valeurs dans laquelle les valeurs, selon les estimations préliminaires, sont plus élevées, et la 2ème ligne est celle où elles sont censées être inférieures.

Plus la zone de chevauchement des valeurs est petite, plus il est probable que les différences soient significatives. Ces différences sont parfois appelées différences de emplacement deux échantillons (Welkowitz J. et al., 1982).

La valeur empirique du critère U reflète la taille de la zone d'accord entre les lignes. C'est pourquoi le moins U em, en particulier il est probable que les différences fiable.

Hypothèses

H 0 : Le niveau du trait du groupe 2 n'est pas inférieur au niveau du trait du groupe 1.

H 1 : Le niveau du trait du groupe 2 est inférieur au niveau du trait du groupe 1.

Représentation graphique du critère U

En figue. 2.5. trois des nombreuses options possibles pour la relation entre deux séries de valeurs sont présentées.

Dans l'option (a), la deuxième rangée est plus basse que la première et les rangées se croisent à peine. La zone de chevauchement est trop petite pour masquer les différences entre les lignes. Il est possible que les différences entre eux soient fiables. Nous pouvons le déterminer avec précision en utilisant le critère U.

Dans l'option (b), la deuxième ligne est également inférieure à la première, mais la zone de valeurs qui se croisent dans les deux lignes est assez étendue. Il se peut qu’elle n’atteigne pas encore une valeur critique, alors que les différences devront être considérées comme insignifiantes. Mais il n’est possible de déterminer s’il en est ainsi qu’en calculant avec précision le critère U.

Dans l’option (c), la deuxième rangée est plus basse que la première, mais la zone de chevauchement est si vaste que les différences entre les rangées sont masquées.

Limites du critère U

1. Chaque échantillon doit comporter au moins 3 observations : n 1 n 2 ≥3; Il est permis qu'il y ait 2 observations dans un échantillon, mais dans le second il doit y en avoir au moins 5.

2. Chaque échantillon ne doit pas contenir plus de 60 observations ; n 1 n 2 ≤60. Mais déjà avec n 1 n 2 >20 le classement devient assez laborieux.

À notre avis, si n 1 n 2 >20, il est préférable d'utiliser un autre critère, à savoir la transformée angulaire de Fisher en combinaison avec le critère λ, qui permet d'identifier le point critique où les différences maximales s'accumulent entre les deux échantillons comparés (voir section 5.4). La formulation semble compliquée, mais la méthode elle-même est assez simple. Il est préférable que chaque chercheur essaie des voies différentes et choisisse celle qui lui semble la plus adaptée.

Exemple

Revenons aux résultats d'une enquête auprès d'étudiants des facultés de physique et de psychologie de l'Université de Léningrad utilisant la méthodologie de D. Wexler pour mesurer l'intelligence verbale et non verbale. En utilisant le critère Q de Rosenbaum, nous avons pu, dans le paragraphe précédent, haut niveau importance pour déterminer que le niveau d'intelligence verbale dans l'échantillon d'étudiants de la Faculté de physique est plus élevé. Essayons maintenant d'établir si ce résultat se reproduit en comparant des échantillons selon le niveau d'intelligence non verbale. Les données sont données dans le tableau. 2.3.

Est-il possible de dire que l’un des échantillons est supérieur à l’autre en termes d’intelligence non verbale ?

Tableau 2.3

Valeurs individuelles de l'intelligence non verbale dans des échantillons d'élèves en éducation physique (u=\4) et facultés psychologiques (n2 = 12)

Étudiants en physique Étudiants en psychologie
Code du nom du sujet Code du nom du sujet Indice d'intelligence non verbale
1. I.A. 1. NT. DEPUIS
2. K.A. 2. O.V.
3. K.E. 3. E.V.
4. PENNSYLVANIE. 4. F.O.
5. S.A. 5. DANS.
6. Art.A. 6. I.Ch.
7. T.A. 7. I.V.
8. F. 8. K.O.
9. C.I. 9. P.P.
10. TA. 10. R.I.
11. Voir A. 11. D'ACCORD.
12. K.An. 12. N.K.
13. B.L.
14. F.V.

Le critère U nécessite du soin et de l’attention. Tout d’abord, vous devez vous rappeler les règles de classement.

Règles de classement

1. Une valeur inférieure se voit attribuer un rang inférieur. La valeur la plus basse se voit attribuer le rang 1.

La valeur la plus élevée se voit attribuer un rang correspondant au nombre de valeurs classées. Par exemple, si n=7, alors valeur la plus élevée recevra le rang 7, à l'exception éventuelle des cas prévus à la règle 2.

2. Si plusieurs valeurs sont égales, on leur attribue un rang qui est la moyenne des rangs qu'elles obtiendraient si elles n'étaient pas égales.

Par exemple, 3 valeurs les plus basseségal à 10 secondes. Si nous mesurions le temps avec plus de précision, ces valeurs pourraient différer et seraient, disons, de 10,2 secondes ; 10,5 secondes ; 10,7 s. Dans ce cas, ils recevraient respectivement les rangs 1, 2 et 3. Mais comme les valeurs que nous obtenons sont égales, chacun d’eux reçoit un rang moyen :

Disons que les 2 valeurs suivantes durent 12 secondes. Ils auraient dû recevoir les rangs 4 et 5, mais comme ils sont égaux, ils reçoivent un rang moyen :

3. La somme totale des rangs doit coïncider avec celle calculée, qui est déterminée par la formule :

N- nombre total d'observations classées (valeurs). Un écart entre les sommes réelles et calculées des classements indiquera une erreur commise lors du calcul des classements ou de leur résumé. Avant de continuer, vous devez rechercher l'erreur et la corriger.

Lors du calcul du critère U, il est plus simple de s'habituer immédiatement à agir selon un algorithme strict.

ALGORITHME 4


©2015-2019site
Tous les droits appartiennent à leurs auteurs. Ce site ne revendique pas la paternité, mais propose une utilisation gratuite.
Date de création de la page : 2017-03-31

Test Q de Rosenbaum basé sur la comparaison de deux séries ordonnées d’observations. La première ligne est considérée comme celle où les valeurs maximales et minimales sont supérieures à celles de l'autre ligne. Le nombre S est calculé - le nombre d'observations de la première série qui sont supérieures à la valeur maximale de la deuxième série, et le nombre T - le nombre d'observations de la deuxième série qui sont inférieures à la valeur minimale de la première série . Les valeurs S et T sont appelées au sens figuré les « queues » des distributions, et le critère Q est appelé « critère de queue ». Lorsque la somme Q = S + T est suffisamment grande, les différences entre les échantillons comparés peuvent être considérées comme significatives. Valeur critique Q pour le nombre d'observations 11 à 26 dans chaque échantillon est indiqué dans le tableau ci-dessous. Si le nombre d'observations est inférieur à 11, le test Q ne peut pas être appliqué. Mais lorsque le nombre d’observations est supérieur à 26 dans chacun des échantillons comparés, il n’y a pas limite supérieure nombre d'observations, et les tables de référence dans ce cas ne sont plus nécessaires. Pour tout nombre d'observations supérieur à 26, la valeur minimale de Q, lorsque les différences peuvent être considérées comme significatives avec P Q = 0,05, est égale à 8, et avec P Q = 0,01, elle est égale à 10. Il faut noter que ces les valeurs minimales de Q pour n 1,n 2 >26 sont valables dans des conditions où n 1 est approximativement égal à n 2. Ainsi, lorsque la taille de l'échantillon ne dépasse pas 50, les différences entre n 1 et n 2 sur 10 sont acceptables, avec n 1, n 2 de 51 à 100, des différences de 15 à 20 sont acceptables, avec n 1, n 2 > 100 différences. entre les échantillons de 1,5 à 2 fois.

Tableau des critères de Rosenbaum

Valeurs Q minimales auxquelles les différences entre deux groupes d'observations peuvent être considérées comme significatives avec P Q = 0,01 et P Q = 0,05