StatEL : Test de Friedman
 
Cette commande de StatEL lance le test de comparaison des moyennes (d'un paramètre) issues d'un même groupe de sujets et dont la distribution des mesures ne répond pas aux exigences de normalité des tests paramétriques. Il est le pendant non-paramétrique du test d'ANOVA pour séries dépendantes.

Exemple : on souhaite évaluer la progression d'un groupe d'élèves dans une même matière. Pour cela, on leur présente 3 questionnaires à 1 mois d'intervalle et on compare les moyennes des notes obtenues au cours des 3 interrogations. Toutefois, l'analyse préliminaire a révélé que les distributions des mesures ne suivent pas toutes la loi Normale. Le recours au test paramétrique de l'ANOVA est donc prohibé. On est donc contraint de se retourner vers un test non-paramétrique.


1 - Principes du test de Friedman :

On dispose de plusieurs échantillons (K>2) dont les moyennes (mi, mj, ...) et les variances (s²i, s²j, ...) sont des estimateurs des moyennes (µi, µj, ...) et variances (θ²i, θ²j, ...) des populations d'où sont issus les échantillons. La question posée est : si mi, mj, ... sont différents (ce qui est facile à vérifier), en est-il de même pour µi, µj, ... ?

  • Hypothèse nulle : "H0 : µi = µj = ..."
  • Hypothèse alternative : "H1 : il existe au moins une moyenne différente des autres"


Comme dans chaque test non-paramétrique, et à la différence des tests paramétriques, le calcul ne porte pas sur les valeurs numériques des mesures issues des échantillons représentatifs des populations, mais sur leurs rangs attribués suite au classement des valeurs par ordre croissant. On s'affranchit ainsi des conditions de normalité des distributions et d'homogénéité des variances indispensables à la fiabilité des tests paramétriques.

  • Le classement des données ne se fait pas par colonne (i.e. par série de mesure) mais par ligne (i.e. par individu). Exemple : on étudie un groupe de 10 sujets soumis à 3 molécules différentes, on dispose en conséquence de 10 triplets de mesures (1 par individu) ; le calcul des rangs va se faire au sein de chaque triplet.

  • On calcule les sommes des rangs (Rk) pour chacun des k groupes.

  • On peut ensuite calculer le coefficient F de Friedman :

formule test friedman

  • Si k est inférieur à 6 ou N est inférieur à 14, on compare F à la valeur critique issue de la Table de Friedman.

  • Si k est supérieur à 5 ou N est supérieur à 13, F suit la loi de probabilité du Chi², à (k-1) degrés de liberté.

  • Pas de conditions d'utilisation du test (hormis l'échantillonnage aléatoire bien évidemment).


La fin du test de Friedman de l'utilitaire StatEL fournit en supplément un test a posteriori afin de préciser les conclusions si celles-ci révèlent que l'un au moins des groupes se distingue des autres. En effet, dans un tel cas, le test de Friedmans ne permet pas de détecter quelle(s) moyenne(s) est (sont) différente(s) des autres.

Pour pallier cette lacune, on procède au test dit de "la méthode des moyennes classées". Ce test consiste tout d'abord à classer par ordre croissant les moyennes des différents groupes étudiés. Puis, on compare chaque couple de moyennes successives en recourant au test de Wilcoxon. Ainsi, on procède seulement à (k-1) comparaisons au lieu des k(k-1)/2 comparaisons possibles.

Au final, on obtient un résultat du type : m5 = m1 < m4 < m3 = m2.

Remarque : il peut arriver que ce test a posteriori conclue sans information supplémentaire (m1 = m3 = m2) ; ce résultat cache le fait que la différence se situe entre m1 et m2 et non pas entre m1 et m3 ou entre m3 et m2.


2 - Lancement du test de Friedman :

StatEL vous demande d'abord de préciser le nombre de groupes que vous souhaitez comparer. Puis, vous devez sélectionner successivement les plages de cellules correspondant aux mesures relatives à chacun des groupes de données. Cette boîte de sélection sera affichée autant de fois que le nombre de groupes de données à étudier. Pour procéder à la sélection, il vous suffit de cliquer sur la première cellule de la série de données et de faire glisser la souris jusqu'à la dernière valeur.

Nota bene : afin d'identifier au mieux les différents groupes de mesures, la première cellule de chaque série doit impérativement contenir le nom du groupe. Ce nom servira d'entête aux groupes étudiés sur la feuille des résultats.

test friedman


Nota bene : dans le test de Friedman, le nombre de mesures est censé être le même pour chaque série. Toutefois, le test saura gérer les données manquantes à condition que pour chaque série, la sélection porte exactement sur le même nombre de cellules (vides ou non). La procédure de sélection tournera en boucle tant que vous n'aurez pas sélectionné autant de cellules qu'à la sélection précédente.



3 - Résultats du test de Friedman :

Le résultat du test de Friedman apparaît sur une nouvelle feuille de votre classeur Excel :

  • Sur la partie gauche de la feuille sont affichés, sous forme de tableau, les données sélectionnées.

  • Sur la partie droite de la feuille sont affichés les tableaux des moyennes, écart-types et les résultats des calculs intermédiaires, ainsi que les conclusions du test. En cas de résultat permettant de rejeter significativement l'hypothèse H0, c'est à dire si le test conclue qu'une moyenne au moins se distingue significativement des autres, les conclusions ainsi que la probabilité d'erreur sont écrites en rouge.

test friedman


Dans l'exemple présenté, le logiciel StatEL explique clairement qu'il existe au moins une moyenne qui diffère significativement des autres, et que le risque de se tromper est inférieur à 0,01.

Des graphiques en "Boîte à Moustaches" viennent automatiquement illustrer ces résultats :

test friedman boite moustache

 

Société ad Science - 55, Boulevard Péreire, 75017 Paris