UED SIM – Département OLCI Année 2013-2014 Arts & Métiers ParisTech CER ANGERS Probabilités et statistiques Cours n° 2.

Slides:



Advertisements
Présentations similaires
Intervalles de confiance
Advertisements

Intervalles de confiance
Introduction aux statistiques Intervalles de confiance
Chapitre I : Rappels Chapitre II: Eléments d’échantillonnage (Tassi, Chap. 2, Kauffmann, Chap. 5 et 6) Chapitre III: L’information au sens de Fisher (Kauffmann,
Comparaison d’une moyenne observée à une moyenne théorique
Corrélation Position du problème Définition covariance (X,Y) r =
STATISTIQUE INFERENTIELLE L ’ESTIMATION
Thomas G. Dietterich Approximate Statistical Tests for Comparing
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Inférence statistique
Comparaison de deux moyennes observées
Inférence statistique
Comparaison d'une distribution observée à une distribution théorique
Comparaison de deux pourcentages observés
Variable aléatoire, estimation ponctuelle et par intervalle
Les TESTS STATISTIQUES
Tests de comparaison de pourcentages
Les TESTS STATISTIQUES
Les Tests dhypothèses. 1)Définition Un test cest une méthode qui permet de prendre une décision à partir des résultats dun échantillon.
Échantillonnage-Estimation
4 Les Lois discrètes.
Les tests d’hypothèses
Probabilités et statistique en TS
Programmes du cycle terminal
Tests de comparaison de moyennes
Autres LOIS de PROBABILITES
Les liens entre les variables et les tests d’hypothèse
Méthodes de Biostatistique
« 90% de nos trains arrivent à lheure! ». énoncé exercice : « Le retard sur un trajet train de 6h15 Marseille-Paris est en moyenne: 10mn avec écart type.
Probabilités et Statistiques
Comprendre la variation dans les données: Notions de base
La corrélation et la régression
Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte.
Le test t.
La corrélation et la régression
Théorie… Inférence statistique: étude du comportement d’une population ou d’un caractère X des membres d’une population à partir d’un échantillon aléatoire.
Algorithmes probabilistes
Régression linéaire (STT-2400)
Méthodes de Biostatistique
ESTIMATION 1. Principe 2. Estimateur 3. Distribution d’échantillonnage
Cédric LAOUENAN 20/11/2008 Tests statistiques Cédric LAOUENAN 20/11/2008
Probabilités et Statistiques Année 2009/2010
TD4 : « Lois usuelles de statistiques »
STATISTIQUES – PROBABILITÉS
Échantillonnage (STT-2000)
Probabilités et Statistiques Année 2010/2011
Probabilités et Statistiques Année 2009/2010
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
Chapitre 4 Variables aléatoires discrètes
Rappel de statistiques
Intervalles de fluctuation et de confiance. Dans une population, la proportion d’individus ayant un caractère donné est notée p Population.
Remise à niveau en statistique Eric Marcon – Module FTH 2006.
LOI NORMALE LOI STUDENT ECHANTILLONS ET TESTS DE MOYENNE
1 L2 STE. Test du χ2 d’adéquation/conformité: Il s'agit de juger de l'adéquation entre une série de données statistiques et une loi de probabilité définie.
Probabilités et statistique MQT-1102
Lectures Volume du cours: Sections 12.1 à 12.6 inclusivement.
ECHANTILLONAGE ET ESTIMATION
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Introduction aux statistiques Intervalles de confiance
Probabilités et statistiques. SOMMAIRE CER ENSAM D'ANGERS  Notion de probabilité  Cas d’un espace fini  Cas d’un espace infini non dénombrable  Variable.
1 M2 Biomatériaux- Cours n°4 1 - Rappels du cours n°1 et 2 et Introduction au principe des test statistiques.
Chapitre 6 Les tests d ’ hypoth è se 1 – Comparer des moyennes ou des proportions.
Chapitre 6 Les tests d ’ hypoth è se 2 – Les tests du  2 (chi 2)
Biostatistique pour le troisième cycle P. Leroy, F. Farnir 2013.
Processus ponctuels Caractéristiques et Modèles de répartitions spatiales.
Transcription de la présentation:

UED SIM – Département OLCI Année Arts & Métiers ParisTech CER ANGERS Probabilités et statistiques Cours n° 2

CER ENSAM D'ANGERS PLAN  Convergence d’une suite de V.A.  Lois limites  Définition d’un estimateur  Estimateurs ponctuels  Estimation par intervalle de confiance  Tests statistiques

CER ENSAM D'ANGERS Convergence d’une suite de variables aléatoires Définitions Convergence en probabilité : (X n ) CV en probabilités vers X ssi ∀ ε > 0, P ( | X n − X | ≥ ε) → 0 quand n → + ∞ Convergence en loi : (X n ) CV en loi vers X ssi E ( | X n − X | ) → 0 quand n → + ∞ Convergence presque sure : une suite de v.a. (X n ) CV presque surement vers une variable X ssi P (X n → X) = 1 Ex de suite de v.a. : évaluations X i de X au cours de n tirages.

CER ENSAM D'ANGERS Convergence d’une suite de variables aléatoires Lois de convergence Inégalité de Bienaymé-Tchebychev Si V(X) existe, alors ∀ a > 0, P(|X-E(X)| ≥ a) ≤ V(X)/a² Loi faible des grands nombres : Lorsque n → + ∞, (X j ) j  [1,n] suite de var aléatoires i.i.d. La moyenne des X j CV en loi vers l’espér. des X j. Loi forte des grands nombres : Lorsque n → + ∞, (X j ) j  [1,n] suite de var aléatoires i.i.d. La suite des CV presque sûrement vers l’espér. des X j.

CER ENSAM D'ANGERS Convergence d’une suite de variables aléatoires (cas de ) Illustration n 00 Comportement asymptotique en 1/√n oscille de moins en moins autour de  0 (sauf en quelques points)

CER ENSAM D'ANGERS Convergence d’une suite de variables aléatoires Loi limite d’une moyenne Théorème (de la limite centrale) : Soit (X j ) j ≥ 1 une suite de v.a. réelles (d’espér  et d’écart-type σ). Quand n → + ∞, la moyenne empirique CV en loi vers N (,σ/n). Remarques : Cela est vrai même si la v.a. X ne suit pas une loi normale (applicable dès que n ≥ 50). C’est vrai pour tout n si les X j suivent une loi normale.

CER ENSAM D'ANGERS Th de la limite centrale : illustration Convergence d’une suite de variables aléatoires

CER ENSAM D'ANGERS Définition d’un estimateur Déf. 1 : Statistique S n = Expression fonction de X 1 …, X n Objectif : Trouver un estimateur sans biais, pour tout n. (Dans certains cas, le biais s’annule seulement en +) Déf. 2 : Loi statistique donnée L et  un de ses paramètres ( S n ) estimateur convergent du paramètre  ssi ( S n ) converge en loi vers le nombre  Estimation de paramètres Remarque : Un estimateur convergent peut être biaisé. Pour tout n, le biais est : E( S n )- 

CER ENSAM D'ANGERS Estimation ponctuelle Estimation de l’espérance  : Moyenne empirique Estimateur de l’écart-type  : Notations : X = v.a. évaluée sur les tirages successifs d’individus. X 1, X 2, …, X n = v.a. qui à tout tirage d’échantillon associe respectiv t les n valeurs prises par X, x 1, x 2, …, x n = Valeurs prises par ces v.a. sur un échantillon donné. Prop : La statistique est un estimateur sans biais de  Prop : S n est un estimateur biaisé de  L’estimateur sans biais est : Notations : les valeurs prises par, S n et S’ n sur un échantillon sont notées, s n, s n ’

Estimation par intervalle de confiance HSM Année CER ENSAM D'ANGERS Définition : Intervalle de confiance de  au risque  (où  [0;1]) [ S n inf ; S n sup ] encadrant  avec une probabilité 1- . Remarque : Les statistiques S n inf et S n sup sont des v.a. Elles prendront des valeurs différentes à chaque tirage d’échantillon. [ S n inf ; S n sup ] est dit centré en probabilité ssi : P ( S n sup )= /2 On choisit en général  = 5 % de sorte que seul 5 % des échantillons ne conduisent pas à encadrer le paramètre  avec les bornes s n inf et s n sup. On évalue au cours de n tirages une variable X suivant une loi normale N ( ,σ). Comment obtenir une estimation par intervalle de confiance centré, au risque 5 %, de  puis de σ ? Qu’en serait-il si on ne savait pas que la loi de X est normale ? Exercice :

Tests statistiques CER ENSAM D'ANGERS H 0 : Hypothèse sur une loi (nature ou param caractéristique) Eval sur 1 échantillon (de taille n) Ecart avec val théo (sous H 0 ) L’écart est-il alarmant ? Chercher un seuil que l’on risque peu de dépasser (sous l’hyp H 0 )

Tests de moyennes CER ENSAM D'ANGERS Cas où n > 50 et  est connu On teste l’hyp nulle H 0 :  = valeur donnée  0 On cherche s max tel que P ( S n > s max ) = , où suit N ( 0,  n) L’écart est < s max H 0 OK L’écart est > s max H 0 rejetée Tirage  prend la valeur   0 Test sur S n =

Tests de moyennes CER ENSAM D'ANGERS Cas où n < 50 et  inconnu On teste l’hyp nulle H 0 :  = valeur donnée  0 Tirage  prend la valeur   0 S n ’ prend une val s’ n On cherche t max tq P (T > t max ) = , où T suit une loi S n-1 Val de T< t max H 0 OK Val de T> t max H 0 rejetée Test sur T =

Test d’écart-type CER ENSAM D'ANGERS H 0 :  = valeur donnée  0 Tirage  S’ n prend la valeur s n ’   0 On cherche les bornes et dont on sort avec les probabilités et. On en sort H 0 rejetée On n’en sort pas H 0 acceptée Test sur T n ² = (n-1)

Tests de lois CER ENSAM D'ANGERS H 0 : La v.a. X suit une loi donnée Tirages  n valeurs de X, effectifs réels  Effectifs théo  cal ² caractéristique de la somme de ces écarts (suit une loi du KHI2  Seuil connu au risque ) H 0 OK < Seuil  cal ² H 0 rejetée > Seuil  cal ²

Test de lois CER ENSAM D'ANGERS n = nb de tirages k = nb de résultats distincts, de probas p 1, p 2, …, p k. N 1,…, N k : var aléatoires donnant les nbres de réalisations des k résultats. Th applicable dès que tous les n.p i dépassent la valeur 5. Th : La statistique CV en loi vers une loi du Khi2 à k-1-r degrés de liberté. (r étant le nombre de paramètres de loi fixés pour calculer les probas p i )

Tests de loi : exercice CER ENSAM D'ANGERS Résultat i Effectif n i On jette 600 fois un dé à 6 faces. Résultats obtenus : Tester au risque 5 % l’hypothèse (H 0 ) de distribution uniforme des résultats sur [[1 ; 6]] (hyp de dé équilibré).

Test d’indépendance CER ENSAM D'ANGERS Vérification avec les écarts Effect théor – Effect réels n. P(X= x i ). P(Y= y j ) – n ij Hyp. H 0 : 2 var aléat X et Y (discrètes) sont indépendantes H 0 P(X= x i, Y = y j ) = P(X= x i ). P(Y= y j ) pour tout (i,j) Th :  écarts²/eff théo CV en loi vers une loi du Khi2 à (I-1)(J-1) degrés de liberté. (I et J étant les nombres de valeurs de X et de Y)

Test d’indépendance : exercice CER ENSAM D'ANGERS Nb erreurs Age 1234TOTAL TOTAL On a soumis un échantillon de personnes à 1 test de code de la route. RESULTATS OBTENUS : Tester l’indépendance entre l’âge et le nombre d’erreurs.

Tests de comparaisons CER ENSAM D'ANGERS Tests d’égalité de moyennes  1 et  2 pour 2 populations Hyp. H 0 : V 1 = V 2 Hyp. H 0 :  1 et  2 (= DONNEES Moyennes sur 2 échant. (1) de la population (1) et (2) de la population (2) Test sur la différence D (sous l’hyp H 0 ) - Var normale en g al Tests d’égalité de variances V 1 et V 2 pour 2 populations Test sur F = S’ n1 ²/S’ n2 ² - Suit la loi F(n 1 -1,n 2 -1)

Analyse de la variance : Exemple CER ENSAM D'ANGERS La rugosité Y d’un cylindre usiné par tournage dépend a priori de 3 paramètres : - La profondeur de coupe X 1 - La vitesse d’avance X 2 - La vitesse de rotation du tour X 3 On réalise plusieurs tournages avec plusieurs valeurs du triplets (X 1, X 2, X 3 ) et on mesure à chaque fois Y. =Var corr de Y liée aux seules variations de X 1 (n 1 val de Y) =Var corr de Y, tous triplets confondus (n 2 val de Y) X 1 a un effet sur Y au risque 5 % ssi S’ 1 ²/S’² dépasse le seuil tabulé pour F(n 1 -1,n 2 -1)

CER ENSAM D'ANGERS Questions