- 1. Idées de base
- 2. Tests déterministes et stochastiques
- 3. Cas de deux hypothèses simples : test de Neyman-Pearson
- 4. Cas de deux hypothèses simples : test séquentiel du rapport de vraisemblance
- 5. Tests uniformément les plus puissants
- 6. Tests d'hypothèses sur les paramètres des lois normales
- 7. Tests asymptotiques
- 8. Tests d'ajustement
- 9. Bibliographie
STATISTIQUES TESTS D'HYPOTHÈSES
Cas de deux hypothèses simples : test séquentiel du rapport de vraisemblance
Soit (X1,...,Xn) un échantillon de n observations indépendantes. Supposons que l'on veuille tester deux hypothèses simples concernant la loi de cet échantillon, l'hypothèse nulle H0 (la densité de cet échantillon est p0,n), contre l'hypothèse alternative H1 (la densité est p1,n). D'après le test de Neyman-Pearson, l'hypothèse H0 sera rejetée (resp. acceptée) si la valeur du rapport de vraisemblance
est supérieure (resp. inférieure) à une constante convenablement choisie. Ce test est le plus puissant parmi tous les tests de même niveau ; en ce sens, il est donc « le meilleur ».Si l'on ne fixe pas à l'avance la taille n de l'échantillon, on peut construire un test meilleur en un certain sens que celui de Neyman-Pearson. Il s'agit du test séquentiel du rapport de vraisemblance, qui fonctionne de la façon suivante. Soient A0 et A1 deux constantes positives. On continue les observations tant que les inégalités A0 < rn < A1 sont satisfaites, et on arrête les observations dès que l'on a atteint la plus petite valeur N de n, telle que l'une de ces inégalités soit fausse. À ce moment-là, on rejette l'hypothèse H0 (et accepte H1) si rN ≥ A1 et on accepte H0 (et rejette H1) si rN ≤ A0. La qualité de ce test est mesurée par les erreurs de première et de seconde espèces α0 et α1 respectivement, et par les durées moyennes d'observations, exprimées par les nombres moyens d'observations E0N et E1N. Les avantages de ce test sont les suivants.
Théorème 2. Parmi tous les tests (séquentiels ou non séquentiels) pour lesquels E0N et E1N sont finis, P0 (rejet de H0) ≤ α0, P1 (acceptation de H0) ≤ α1, avec N = inf {n ; n ≥ 0 et rn ∉ ]A0, A1[, r0 = 1}, le test séquentiel du rapport de vraisemblance d'erreurs α0 et α1 rend simultanément minimaux les nombres moyens d'observations E0N et E1N.
Pour utiliser ce test, il est indispensable de savoir comment choisir les frontières A0 et A1 pour des erreurs α0 et α1 fixées à l'avance. Il est difficile de donner leurs valeurs précises à cause des sursauts du processus (rn)n ≥ 0 à travers les frontières, mais on peut montrer les inégalités A0 ≥ α1/(1 – α0) et A1 ≤ (1 – α1)/α0. En pratique, on utilise les valeurs approximatives A0 ≈ α1/(1 – α0) et A1 ≈ (1 – α1)/α0, qui sont bien satisfaisantes pour les erreurs α0 et α1 d'ordre de 0,01 à 0,1. Le test séquentiel avec ces frontières approximatives A0 et A1 demande un peu plus d'observations que celui avec les frontières précises.
Pour tester deux hypothèses simples, le test séquentiel du rapport de vraisemblance possède les mêmes propriétés d'optimalité pour certaines classes de processus stochastiques à temps continu, par exemple la dérive d'un mouvement brownien. Pour les processus à trajectoires continues, les relations entre les frontières et les erreurs sont précises : A0 = α1/(1 – α0) et A1 = (1 – α1)/α0.
La suite de cet article est accessible aux abonnés
- Des contenus variés, complets et fiables
- Accessible sur tous les écrans
- Pas de publicité
Déjà abonné ? Se connecter
Écrit par
- Leonid I. GALTCHOUK : professeur de l'université de Strasbourg-I
Classification
Autres références
-
STATISTIQUE
- Écrit par Georges MORLAT
- 13 897 mots
- 1 média
...pas faire œuvre scientifique en adoptant à chaque instant les hypothèses qui expliquent le mieux les données observées, et donc excluent les miracles. En fait, on a constaté, vers les années trente, qu'une théorie cohérente des tests contraignait à prendre en compte non seulement l'hypothèse testée, mais...