Applications des statistiques Tests, résultats d'expérience, sondages pharmacologie, médecine, agronomie, gestion de production, sociologie, économie, politique, Banque : gestion de portefeuille, scoring de clientèle Marketing Informatique (reconnaissance de forme, de codes barres, reconnaissance d'image, reconnaissance de la parole, imagerie médicale) Assurances (actuariat) Télécommunications, codage et filtrage d'erreur ………
La loi forte des grands nombres X1, X2, …, Xn, … Une suite de variables aléatoires indépendantes et de même loi, de moyenne (espérance): E(Xi)=m Alors pour (presque) toute expérience (réalisation) chaque expérience, poussée suffisamment longtemps, permet de s'approcher de la vraie moyenne, ou de la vraie fréquence (c'est la justification des sondages, estimations de moyennes, et tracés d'histogrammes, entre autres). Bernoulli (loi faible des grands nombres, 1630) Kolmogorov (loi forte des grands nombres, 1930)
À quelle vitesse ? Théorème central-limite X1, X2, …, Xn, … une suite de variables aléatoires indépendantes et de même loi, de moyenne (espérance): E(Xi)=m et de variance Var(Xi)=s2 avec, pour tout a et b De Moivre (1660, cas binomial) Laplace (1780, cas général) Gauss (1805, application aux statistiques)
Intervalle de confiance (sondage) Le nombre de réponses “oui” suit la loi binomiale de parametre n et p :
Intervalles de confiance à 95% et 99% pour p=0,5
Résultats de 756 sondages chacun sur des échantillons de 400 personnes pris au hasard dans une population où la proportion de « oui » est 42%
Intervalle de confiance (moyenne) Cas particulier du sondage Durée de vie exponentielle Xk durée de vie du kème composant Cas général
Intervalle de confiance (durée de vie 1/l = 1000)
Théorème central-limite E(Xi)=m et Var(Xi)=s2 avec, pour n assez grand, Xk: résultat du kème lancer d’un dé
Somme de 2 lancers: 2520=70*36 expériences
Courbe de Gauss
Somme de 12 lancers de dés, centrée et réduite Histogramme basé sur 2500 expériences
Théorème central-limite E(Xi)=m et Var(Xi)=s2 Xk: nombre uniforme entre 0 et 1
Somme de 12 uniformes
Y a-t-il bonne adéquation entre l ’histogramme et Test du chi(2) (c2) Y a-t-il bonne adéquation entre l ’histogramme et la loi de probabilité attendue ??
Petits calculs sur sondage 42%, 400 personnes La proportion estimée est comprise entre et avec une probabilité de Fréquence observée: