- 1. Idées de base
- 2. Tests déterministes et stochastiques
- 3. Cas de deux hypothèses simples : test de Neyman-Pearson
- 4. Cas de deux hypothèses simples : test séquentiel du rapport de vraisemblance
- 5. Tests uniformément les plus puissants
- 6. Tests d'hypothèses sur les paramètres des lois normales
- 7. Tests asymptotiques
- 8. Tests d'ajustement
- 9. Bibliographie
STATISTIQUES TESTS D'HYPOTHÈSES
Cas de deux hypothèses simples : test de Neyman-Pearson
Dans le cas de deux hypothèses simples, H0 : θ = θ0 contre H1 : θ = θ1, le problème résumé par les conditions 1 et 2 admet une solution précise.
Considérons le cas de lois P0 = Pθ0 et P1 = Pθ1 discrètes. Si on se contente des tests déterministes, c'est-à-dire des tests ϕ de la forme ϕ(ω) = IRc(ω), où IA(ω) est l'indicatrice de l'ensemble A et Rc est une région critique, alors il faut rechercher une région critique Rc telle que pour un niveau α fixe on ait (4)
et qui maximise la puissance (5) . Au vu de l'échantillon ω, il est clair qu'il faut rejeter H0 si la valeur de P1(ω) est importante et celle de P0(ω) est faible. Cela implique que les valeurs du rapport de vraisemblance r(ω) = P1(ω)/P0(ω) jouent le rôle clé : si ce rapport est important au point ω, il faut inclure ce point dans la région critique. Donc, pour construire Rc, il faut ranger les valeurs r(ω) lorsque ω parcourt l'espace Ω. Ensuite, il faut inclure dans Rc le plus grand nombre de points ω dont les valeurs du rapport r(ω) sont les plus élevées (pour maximiser la formule 5), de sorte que la condition 4 ne soit pas violée. Si dans la formule 4 on obtient l'égalité, la région critique optimale au sens des conditions 4 et 5 est trouvée. Mais il peut arriver que dans la formule 4 on ait l'inégalité stricte « < » et que, si l'on ajoute dans Rc le point suivant ω [dans l'ordre de décroissance de r(ω)], on obtienne l'inégalité stricte « > » (c'est-à-dire que l'on dépasse le niveau α). Cette difficulté peut être contournée par le passage au test stochastique (randomisé). Cela signifie que ce dernier point ω doit être « désagrégé » et une partie incluse dans Rc pour obtenir l'égalité dans la formule 4. Ces raisonnements se formalisent dans le théorème suivant dit lemme fondamental de Neyman-Pearson.Théorème 1. Soient P0 et P1 deux lois de probabilités admettant les densités p0 et p1 respectivement, par rapport à une mesure σ-finie μ (sans perdre de généralité, on peut prendre μ = P0 + P1). Alors : – (existence) Pour tester H0 : p0 contre H1 : p1, il existe un test ϕ et une constante k tels que (6) E0[ϕ] = α et, pour μ-presque tout ω, (7)
. – (condition suffisante pour un test UPP) Si un test satisfait les conditions 6 et 7 pour un k, alors il est UPP pour tester p0 contre p1 au niveau α. Un tel test est appelé test de Neyman-Pearson. – (condition nécessaire pour un test UPP) Si ϕ est un test UPP au niveau α pour tester p0 contre p1, alors pour un k il satisfait la condition 6. Il satisfait aussi la condition 7 μ-presque sûrement s'il n'existe aucun test de puissance 1 et de niveau inférieur à α.D'après le lemme fondamental de Neyman-Pearson, un test uniformément le plus puissant ϕ est déterminé par la région critique (ω : p1(ω) > kp0(ω)), où k est un nombre réel. Pour préciser ce test, considérons la fonction F0 de la variable t définie par
[Notons que P0(ω : p0(ω) = 0) = 0.]. C'est la fonction de répartition de la variable aléatoire p1/p0, qui est croissante et continue à droite.Un niveau α du test ϕ étant donné, il existe un nombre réel k tel qu'on ait (8) F0(k – 0) ≤ 1 – α ≤ F0(k). Alors on pose (9)
, où k est défini par la condition 8 et γ se déduit de la condition 6, qui entraîne (10) .Pour donner un exemple numérique, revenons à celui du diagnostic de tuberculose. Évaluons le rapport de vraisemblance
et la loi de probabilité P0(r(x)), où x ∈ {0, 1, 2, 3, 4, 5}. On a r(0) = 92,8701 ; r(1) = 0,6254 ; r(2) = 0,0042 ; P0(r(0)) = 0,01024 ; P0(r(1)) = 0,0768 ; P0(r(2)) = 0,2304. Pour x = 3 ou 4 ou 5, les valeurs de r([...]La suite de cet article est accessible aux abonnés
- Des contenus variés, complets et fiables
- Accessible sur tous les écrans
- Pas de publicité
Déjà abonné ? Se connecter
Écrit par
- Leonid I. GALTCHOUK : professeur de l'université de Strasbourg-I
Classification
Autres références
-
STATISTIQUE
- Écrit par Georges MORLAT
- 13 897 mots
- 1 média
...pas faire œuvre scientifique en adoptant à chaque instant les hypothèses qui expliquent le mieux les données observées, et donc excluent les miracles. En fait, on a constaté, vers les années trente, qu'une théorie cohérente des tests contraignait à prendre en compte non seulement l'hypothèse testée, mais...