Calcul des petites valeurs-p dans un test statistique
Les amis,
Continuons à regarder Patty aider Mark à déterminer les petites valeurs-p dans un test statistique. La première partie de cette histoire est ici.
Patty et Mark ont discuté pendant un moment et ont passé en revue les données que Mark était en train d'analyser.
"Mark, pour simplifier, supposons que vous compariez une efficacité de transfert (ET) avec une autre ; disons que vous avez effectué 100 mesures de l'ET et que vous voulez voir si elles sont statistiquement supérieures à une certaine valeur. Donc, nous aurions une hypothèse nulle de 94 % et une hypothèse alternative supérieure à 94 %," dit Patty.
Patty alla à son tableau blanc et écrivit :
Ho : Moyenne = 94 %
H1 : Moyenne > 94 %
"Supposons que la moyenne des cent mesures soit égale à 100 % et que l'écart type soit 10 %", poursuivit-elle.
"C'est à peu près exactement ce qu’étaient les données", répondit Mark.
Patty entra ces données dans Minitab et obtint le résultat suivant :
"Nous rejetons donc l'hypothèse nulle et concluons que la moyenne (c'est-à-dire 100) est statistiquement supérieure à 94 %", dit Patty.
“Mais, ça dit que la valeur-p est 0,000”, lança Mark. "C'est pour ça que Mike m'a incendié", soupira-t-il.
"Utilisons Minitab pour tracer un graphique de la distribution normale, avec une moyenne de 0 et un écart-type de 1 et voyons où se trouve le 6 sur le graphique. Le 6 équivaut à une valeur T égale à 6 (ou une valeur Z si l'échantillon est grand, disons supérieur à 400)", dit Patty. Voir Figure 1.
Figure 1. Sortie graphique Minitab
"Ouaouh, voilà la valeur-p, 9,8659x10-10 ", s'exclama Mark.
"Il s'avère que même cette fonction graphique calcule une valeur-p de 0 pour T, ou Z, valeurs supérieures à environ 8", confirma Patty.
"Aïe, alors Mike pourrait encore m’incendier si la valeur T est 8 ou plus", se lamenta Mark.
"Rassure-toi," dit Patty, "j'ai calculé l'intégrale de Gauss et j'ai découvert que c'est une fonction d’erreur complémentaire. Excel® calculera des fonctions d'erreur complémentaires jusqu'à une valeur T ou Z égale à 37,5. Dans ce cas, la valeur-p correspondante est 4,61E-308." Voir Figure 2.
Figure 2. Tableur Excel de Patty pour calculer les valeurs-p
Mark envisagea, "et si elle était supérieure à 37,5 ?"
"Si on considère qu'il n'y a que 1080 atomes dans l'univers, ne nous inquiétons pas de ce 4,61E-308, car cela représente une chance sur 2,16E307", plaisanta Patty. "Cependant, si vous avez vraiment besoin d'aller au-delà de T = 37,5, j'ai développé des techniques pour aller à un T bien au-delà de 1000, probablement jusqu'à n'importe quel nombre, mais c’est impossible de le faire avec Excel®".
Mark demanda avec espoir, "Donc je peux avoir la feuille de calcul Excel® et si jamais je dois aller au-delà de T = 37,5, vous m'aiderez, n'est-ce pas ?
"Bien sûr !", dit Patty. "Oh, et ne sois pas si intimidé par Mike Madigan... c'est simplement un gros nounours", se moqua-elle.
À cela, ils rirent tous les deux, bien que Mark ne fût pas aussi convaincu.
Merci,
Docteur Ron
L'intégration par Patty de la fonction de distribution normale de Gauss à la fonction d'erreur complémentaire figure ci-dessous. Les lecteurs qui souhaitent obtenir une copie de la feuille de calcul Excel® calculant les valeurs-p peuvent envoyer un courriel à rlasky@indium.com.
Connect with Indium.
Read our latest posts!