StatEL : Test de Wilcoxon (séries appariées)
 
Cette commande de StatEL lance le test de comparaison de 2 moyennes d'un paramètre issues d'un même groupe de sujets dont la distribution des écarts entre les 2 mesures ne répond pas aux exigences de normalité des tests paramétriques. Il est le pendant non-paramétrique du test t pour séries dépendantes.

Exemple : on souhaite évaluer l'influence d'un traitement anticholestérolémique. Pour cela, on dispose d'un groupe d'animaux chez qui on mesure une première fois (T0) le taux de cholestérol. Après le traitement, on mesure une seconde fois leur taux de cholestérol (Mesure T1). Puisqu'on mesure 2 fois le paramètre chez les mêmes sujets, les mesures ne sont pas indépendantes, on dit que les mesures sont dépendantes, ou appariées, ou pairées. L'objectif est de comparer les moyennes des 2 séries de mesure afin de savoir si l'écart entre les 2 est significatif ou simplement dû au fait du hasard.

1 - Principes du test de Wilcoxon :

On dispose de 2 échantillons a et b dont les moyennes (ma et mb) et les variances (s²a et s²b) sont des estimateurs des moyennes (µa et µb) et variances (θ²a et θ²b) des 2 populations A et B d'où sont issus les échantillons. La question posée est : si ma et mb sont différents (ce qui est facile à vérifier), en est-il de même pour µa et µb ?

  • Hypothèse nulle : "H0 = µa et µb sont égales"
  • Hypothèse alternative : "H1 = µa et µb sont différentes"

Comme les 2 échantillons dont on dispose sont issus d'un seul et même groupe, le traitement du problème est différent du test de Mann & Whitney où l'on supposait que les tirages des échantillons étaient indépendants. Or, dans ce nouveau cas, chaque mesure issue de l'échantillon a est liée à son homologue de l'échantillon b. Le principe du test consiste à calculer, pour chaque paire de mesures issues de l'échantillon a et de l'échantillon b, la différence des valeurs. Puis, l'ensemble des calculs va porter sur cette nouvelle liste de valeurs.

Comme dans chaque test non-paramétrique, le calcul ne porte pas sur les valeurs numériques des mesures , mais sur leurs rangs attribués suite au classement des valeurs par ordre croissant. On s'affranchit ainsi des conditions de normalité des distributions et d'homogénéité des variances indispensables à la fiabilité des tests paramétriques.


  • On commence donc par calculer, pour chaque paire, la différence entre les 2 valeurs. Ensuite, on classe les différences calculées par valeur absolue croissante, mais en conservant pour chacune la nature de son signe.

  • On calcule les indices M = somme des rangs des différences de signe "moins", et P = somme des rangs des différences de signe "plus" ; on travaillera ensuite avec l'indice le plus faible des 2.

  • Dans l'hypothèse nulle où les 2 échantillons proviennent d'une même population, il doit y avoir autant de différences de signe "-" que de différences de signe "+" et leurs valeurs absolues doivent être, en moyenne, les mêmes. Dans le cas contraire, l'un des 2 indices aura tendance à être plus grand que l'autre, et les valeurs absolues de ses différences seront en moyenne plus grandes.

  • On teste la significativité de ce plus petit indice (P ou M) en utilisant la formule suivante qui suit la loi de probabilité de l'écart-réduit, à condition que le nombre de paires soit au moins égal à 20 (en deça, il faut recourir à la table de Wilcoxon qui fournit la limite inférieure) :

formule wilcoxon


  • Pas de conditions d'utilisation du test (hormis l'échantillonnage aléatoire)



2 - Lancement du test de Wilcoxon :

StatEL vous demande d'abord de sélectionner la plage de cellules correspondant aux mesures relatives au premier groupe de données, puis il vous est demandé de recommencer pour sélectionner les mesures relatives au second groupe de données. Pour procéder à la sélection, il vous suffit de cliquer sur la première cellule de votre série de données et de faire glisser la souris jusqu'à la dernière valeur.

Nota bene : afin d'identifier au mieux les différents groupes de mesures, la première cellule de chaque sélection doit impérativement contenir le nom du groupe. Ce nom servira d'entête au groupe étudié sur la feuille des résultats.

wilcoxon

Nota bene : les 2 groupes sont supposés contenir exactement le même nombre de mesures puisque celles-ci sont dépendantes l'une de l'autre. Toutefois, StatEL saura gérer les données manquantes à condition que les 2 sélections portent exactement sur le même nombre de cellules (vides ou non). En d'autres termes, si par exemple la mesure à T1 du sujet N°3 est manquante, il faut laisser la cellule vide en regard de la mesure à T0 du sujet N°3.


3 - Résultats du test de Wilcoxon :

Le résultat du test de comparaison 2 moyennes pour 2 séries dépendantes apparaît sur une nouvelle feuille de votre classeur Excel :

  • Sur la partie gauche de la feuille sont affichés, sous forme de tableau, les données sélectionnées.

  • Sur la partie droite de la feuille sont affichés les tableaux des moyennes, écart-types et les résultats des calculs intermédiaires, ainsi que les conclusions du test. En cas de résultat permettant de rejeter significativement l'hypothèse H0, c'est à dire si le test démontre que les moyennes des 2 groupes sont significativement différentes, les conclusions ainsi que la probabilité d'erreur sont écrites en rouge.


wilcoxon


Dans l'exemple présenté, le logiciel StatEL explique clairement que les moyennes des 2 groupes sont significativement différentes, et que le risque de se tromper est inférieur à 0,05.


Un graphique en "Boîte à Moustaches" vient automatiquement illustrer ces résultats :

wilcoxon boite moustache


 

Société ad Science - 55, Boulevard Péreire, 75017 Paris