STATISTIQUE
Fondements logiques
Dans sa théorie des fonctions de décision statistique, Wald avait introduit des solutions bayésiennes : ce sont les stratégies qui minimisent la valeur moyenne de la fonction de risque, au sens d'espérance par rapport à une distribution de probabilité a priori sur Θ. L'avantage technique est évident : cela permet, si l'on a choisi une distribution a priori particulière, d'obtenir un préordre complet sur Θ et donc de donner sans ambiguïté une solution à tout problème de décision statistique. Mais Wald, imprégné des idées de la statistique classique, n'adoptait pas cette interprétation et considérait qu'il n'est pas permis en général de choisir une distribution a priori sur Θ ; pour lui, les stratégies bayésiennes n'étaient qu'un outil intermédiaire, intéressant parce que l'ensemble de toutes les stratégies de cette nature (pour toutes les distributions a priori concevables) forme, sous des conditions assez larges, une classe complète de stratégies non dominées (dans le préordre induit par la fonction de risque) ; il suffit donc de rechercher une stratégie optimale dans cette classe, quelle que soit au reste la définition de l'optimum.
Depuis 1950 environ, d'autres statisticiens ont adopté un point de vue différent et proposent l'idée que, dans tel problème statistique concret, il convient de choisir une distribution a priori des paramètres inconnus des lois de probabilité qui traduise au mieux la connaissance imparfaite des phénomènes ; ce point de vue a trouvé un écho particulièrement large auprès des économistes. Nous allons donner quelques indications sur les racines et le développement de cette tendance, dite néo-bayésienne, de la statistique moderne.
Méthodes néo-bayésiennes
Si l'on veut bien accorder un sens à la notion de distribution de probabilité des paramètres, les problèmes d'inférence statistique se présentent sous un aspect bien différent de celui auquel s'attachent les statistiques classiques. Si f(x, θ) est la loi de probabilité des observations pour θ fixé, et si ϕ(θ) est la densité a priori du paramètre θ, l'estimation du paramètre θ, lorsqu'on connaît les observations, conduit à rechercher la loi a posteriori de θ conditionné par x. On sait que le résultat est fourni par la formule de Bayes, soit :
Sur le plan des principes, il n'y a pas grand-chose à ajouter, puisque cette formule exprime complètement, dans l'optique bayésienne, ce qu'on doit penser de θ, au vu des observations x. Mais en pratique, avec les expressions des lois d'observation habituellement utilisées (qui appartiennent souvent à ce qu'on appelle des familles exponentielles), une expression du type donné ci-dessus n'a pas nécessairement une forme analytique simple, selon l'expression choisie pour ϕ(θ). Deux possibilités s'offrent et sont effectivement en usage.
D'une part, on peut se borner à utiliser des expressions analytiques pour ϕ(θ) qui conduisent à des expressions simples : c'est la théorie des familles de lois de probabilité conjuguées. Il s'agit de prendre pour ϕ(θ) une expression telle que la distribution a posteriori conserve la même forme analytique, ses paramètres étant seuls modifiés. Ainsi, lorsque la loi des observations est une loi binomiale et si θ est le paramètre de fréquence de cette loi, on montre que la distribution conjuguée est la loi eulérienne β-incomplète. Il peut paraître un peu gênant, sur le plan des principes, de choisir les distributions a priori en fonction de la commodité analytique. Sur le plan pratique, cette objection est de portée limitée, car la loi β-incomplète choisie au départ dépend de deux paramètres et peut avoir une grande diversité de forme. Une autre objection tient à ce qu'on ne connaît pas de méthode générale pour trouver des familles de distributions conjuguées.[...]
La suite de cet article est accessible aux abonnés
- Des contenus variés, complets et fiables
- Accessible sur tous les écrans
- Pas de publicité
Déjà abonné ? Se connecter
Écrit par
- Georges MORLAT : professeur à l'université de Paris-VI
Classification
Média
Autres références
-
APPROCHES TRANSVERSALE ET LONGITUDINALE EN PSYCHOLOGIE DU DÉVELOPPEMENT
- Écrit par Henri LEHALLE
- 1 044 mots
S’informer sur le développement des enfants et des adolescents impose de pouvoir comparer leurs comportements aux différents âges. Pour cela, diverses approches méthodologiques sont possibles.
Selon une première approche « transversale », les groupes d’âge à comparer sont constitués par des...
-
ASSURANCE - Histoire et droit de l'assurance
- Écrit par Jean-Pierre AUDINOT , Encyclopædia Universalis et Jacques GARNIER
- 7 490 mots
- 1 média
Pour que cet aléa disparaisse, il fallut attendre que la découverte du calcul des probabilités et le progrès de l'observation statistique permettent une prévision rationnelle du risque. Mais ce n'est qu'au xviie siècle que Pascal, à la demande d'un joueur de cartes passionné, le chevalier... -
BAYES THOMAS (1702-1761)
- Écrit par Bernard PIRE
- 311 mots
Mathématicien britannique, pionnier de la statistique. Né en 1702 à Londres, Thomas Bayes est le fils d'un des six premiers pasteurs non conformistes à être ordonnés après le refus en 1664 d'une partie de l'Église anglicane d'adhérer à l'Act of Uniformity. Après avoir reçu une solide éducation privée,...
-
BERNSTEIN FELIX (1878-1956)
- Écrit par Bernard PIRE
- 337 mots
Mathématicien allemand naturalisé américain, spécialiste de la théorie des ensembles puis des statistiques appliquées. Né le 24 février 1878 à Halle (Allemagne), Felix Bernstein est le fils d'un spécialiste de l'électrobiologie. Élève de Georg Cantor (1845-1918) à Halle, Bernstein...
- Afficher les 80 références