UED SIM – Département OLCI Année Arts & Métiers ParisTech CER ANGERS Probabilités et statistiques Cours n° 2
CER ENSAM D'ANGERS PLAN Convergence d’une suite de V.A. Lois limites Définition d’un estimateur Estimateurs ponctuels Estimation par intervalle de confiance Tests statistiques
CER ENSAM D'ANGERS Convergence d’une suite de variables aléatoires Définitions Convergence en probabilité : (X n ) CV en probabilités vers X ssi ∀ ε > 0, P ( | X n − X | ≥ ε) → 0 quand n → + ∞ Convergence en loi : (X n ) CV en loi vers X ssi E ( | X n − X | ) → 0 quand n → + ∞ Convergence presque sure : une suite de v.a. (X n ) CV presque surement vers une variable X ssi P (X n → X) = 1 Ex de suite de v.a. : évaluations X i de X au cours de n tirages.
CER ENSAM D'ANGERS Convergence d’une suite de variables aléatoires Lois de convergence Inégalité de Bienaymé-Tchebychev Si V(X) existe, alors ∀ a > 0, P(|X-E(X)| ≥ a) ≤ V(X)/a² Loi faible des grands nombres : Lorsque n → + ∞, (X j ) j [1,n] suite de var aléatoires i.i.d. La moyenne des X j CV en loi vers l’espér. des X j. Loi forte des grands nombres : Lorsque n → + ∞, (X j ) j [1,n] suite de var aléatoires i.i.d. La suite des CV presque sûrement vers l’espér. des X j.
CER ENSAM D'ANGERS Convergence d’une suite de variables aléatoires (cas de ) Illustration n 00 Comportement asymptotique en 1/√n oscille de moins en moins autour de 0 (sauf en quelques points)
CER ENSAM D'ANGERS Convergence d’une suite de variables aléatoires Loi limite d’une moyenne Théorème (de la limite centrale) : Soit (X j ) j ≥ 1 une suite de v.a. réelles (d’espér et d’écart-type σ). Quand n → + ∞, la moyenne empirique CV en loi vers N (,σ/n). Remarques : Cela est vrai même si la v.a. X ne suit pas une loi normale (applicable dès que n ≥ 50). C’est vrai pour tout n si les X j suivent une loi normale.
CER ENSAM D'ANGERS Th de la limite centrale : illustration Convergence d’une suite de variables aléatoires
CER ENSAM D'ANGERS Définition d’un estimateur Déf. 1 : Statistique S n = Expression fonction de X 1 …, X n Objectif : Trouver un estimateur sans biais, pour tout n. (Dans certains cas, le biais s’annule seulement en +) Déf. 2 : Loi statistique donnée L et un de ses paramètres ( S n ) estimateur convergent du paramètre ssi ( S n ) converge en loi vers le nombre Estimation de paramètres Remarque : Un estimateur convergent peut être biaisé. Pour tout n, le biais est : E( S n )-
CER ENSAM D'ANGERS Estimation ponctuelle Estimation de l’espérance : Moyenne empirique Estimateur de l’écart-type : Notations : X = v.a. évaluée sur les tirages successifs d’individus. X 1, X 2, …, X n = v.a. qui à tout tirage d’échantillon associe respectiv t les n valeurs prises par X, x 1, x 2, …, x n = Valeurs prises par ces v.a. sur un échantillon donné. Prop : La statistique est un estimateur sans biais de Prop : S n est un estimateur biaisé de L’estimateur sans biais est : Notations : les valeurs prises par, S n et S’ n sur un échantillon sont notées, s n, s n ’
Estimation par intervalle de confiance HSM Année CER ENSAM D'ANGERS Définition : Intervalle de confiance de au risque (où [0;1]) [ S n inf ; S n sup ] encadrant avec une probabilité 1- . Remarque : Les statistiques S n inf et S n sup sont des v.a. Elles prendront des valeurs différentes à chaque tirage d’échantillon. [ S n inf ; S n sup ] est dit centré en probabilité ssi : P ( S n sup )= /2 On choisit en général = 5 % de sorte que seul 5 % des échantillons ne conduisent pas à encadrer le paramètre avec les bornes s n inf et s n sup. On évalue au cours de n tirages une variable X suivant une loi normale N ( ,σ). Comment obtenir une estimation par intervalle de confiance centré, au risque 5 %, de puis de σ ? Qu’en serait-il si on ne savait pas que la loi de X est normale ? Exercice :
Tests statistiques CER ENSAM D'ANGERS H 0 : Hypothèse sur une loi (nature ou param caractéristique) Eval sur 1 échantillon (de taille n) Ecart avec val théo (sous H 0 ) L’écart est-il alarmant ? Chercher un seuil que l’on risque peu de dépasser (sous l’hyp H 0 )
Tests de moyennes CER ENSAM D'ANGERS Cas où n > 50 et est connu On teste l’hyp nulle H 0 : = valeur donnée 0 On cherche s max tel que P ( S n > s max ) = , où suit N ( 0, n) L’écart est < s max H 0 OK L’écart est > s max H 0 rejetée Tirage prend la valeur 0 Test sur S n =
Tests de moyennes CER ENSAM D'ANGERS Cas où n < 50 et inconnu On teste l’hyp nulle H 0 : = valeur donnée 0 Tirage prend la valeur 0 S n ’ prend une val s’ n On cherche t max tq P (T > t max ) = , où T suit une loi S n-1 Val de T< t max H 0 OK Val de T> t max H 0 rejetée Test sur T =
Test d’écart-type CER ENSAM D'ANGERS H 0 : = valeur donnée 0 Tirage S’ n prend la valeur s n ’ 0 On cherche les bornes et dont on sort avec les probabilités et. On en sort H 0 rejetée On n’en sort pas H 0 acceptée Test sur T n ² = (n-1)
Tests de lois CER ENSAM D'ANGERS H 0 : La v.a. X suit une loi donnée Tirages n valeurs de X, effectifs réels Effectifs théo cal ² caractéristique de la somme de ces écarts (suit une loi du KHI2 Seuil connu au risque ) H 0 OK < Seuil cal ² H 0 rejetée > Seuil cal ²
Test de lois CER ENSAM D'ANGERS n = nb de tirages k = nb de résultats distincts, de probas p 1, p 2, …, p k. N 1,…, N k : var aléatoires donnant les nbres de réalisations des k résultats. Th applicable dès que tous les n.p i dépassent la valeur 5. Th : La statistique CV en loi vers une loi du Khi2 à k-1-r degrés de liberté. (r étant le nombre de paramètres de loi fixés pour calculer les probas p i )
Tests de loi : exercice CER ENSAM D'ANGERS Résultat i Effectif n i On jette 600 fois un dé à 6 faces. Résultats obtenus : Tester au risque 5 % l’hypothèse (H 0 ) de distribution uniforme des résultats sur [[1 ; 6]] (hyp de dé équilibré).
Test d’indépendance CER ENSAM D'ANGERS Vérification avec les écarts Effect théor – Effect réels n. P(X= x i ). P(Y= y j ) – n ij Hyp. H 0 : 2 var aléat X et Y (discrètes) sont indépendantes H 0 P(X= x i, Y = y j ) = P(X= x i ). P(Y= y j ) pour tout (i,j) Th : écarts²/eff théo CV en loi vers une loi du Khi2 à (I-1)(J-1) degrés de liberté. (I et J étant les nombres de valeurs de X et de Y)
Test d’indépendance : exercice CER ENSAM D'ANGERS Nb erreurs Age 1234TOTAL TOTAL On a soumis un échantillon de personnes à 1 test de code de la route. RESULTATS OBTENUS : Tester l’indépendance entre l’âge et le nombre d’erreurs.
Tests de comparaisons CER ENSAM D'ANGERS Tests d’égalité de moyennes 1 et 2 pour 2 populations Hyp. H 0 : V 1 = V 2 Hyp. H 0 : 1 et 2 (= DONNEES Moyennes sur 2 échant. (1) de la population (1) et (2) de la population (2) Test sur la différence D (sous l’hyp H 0 ) - Var normale en g al Tests d’égalité de variances V 1 et V 2 pour 2 populations Test sur F = S’ n1 ²/S’ n2 ² - Suit la loi F(n 1 -1,n 2 -1)
Analyse de la variance : Exemple CER ENSAM D'ANGERS La rugosité Y d’un cylindre usiné par tournage dépend a priori de 3 paramètres : - La profondeur de coupe X 1 - La vitesse d’avance X 2 - La vitesse de rotation du tour X 3 On réalise plusieurs tournages avec plusieurs valeurs du triplets (X 1, X 2, X 3 ) et on mesure à chaque fois Y. =Var corr de Y liée aux seules variations de X 1 (n 1 val de Y) =Var corr de Y, tous triplets confondus (n 2 val de Y) X 1 a un effet sur Y au risque 5 % ssi S’ 1 ²/S’² dépasse le seuil tabulé pour F(n 1 -1,n 2 -1)
CER ENSAM D'ANGERS Questions