Probabilités et Statistiques Année 2009/2010

Slides:



Advertisements
Présentations similaires
Introduction aux statistiques Intervalles de confiance
Advertisements

Comparaison d’une moyenne observée à une moyenne théorique
RECONNAISSANCE DE FORMES
Test statistique : principe
Les tests d’hypothèses (I)
Inférence statistique
Comparaison de deux moyennes observées
Comparaison d'une distribution observée à une distribution théorique
Comparaison de deux pourcentages observés
Comparaison de plusieurs moyennes observées
Tests non paramétriques
Les TESTS STATISTIQUES
1. Les caractéristiques de dispersion. 11. Utilité.
Les TESTS STATISTIQUES
Les Tests dhypothèses. 1)Définition Un test cest une méthode qui permet de prendre une décision à partir des résultats dun échantillon.
Les tests d’hypothèses
1 Analyse de la variance multivariée Michel Tenenhaus.
Tests de comparaison de moyennes
Probabilités et Statistiques
1.3 COORDONNÉES DES POINTS
La puissance statistique
La puissance statistique
Notre calendrier français MARS 2014
L’OFFRE ET LA DEMANDE.
1 La détection de gènes impliqués dans les maladies multifactorielles Marie-Pierre Etienne ENGREF Laboratoire GRESE Statistique et Génome.
3ème partie: les filtres
TEST d’ADEQUATION A UNE LOI EQUIREPARTIE
Veuillez trouver ci-joint
Résoudre une équation du 1er degré à une inconnue
Questions des 4 carrés Prêts ? B A Regardez bien ce diagramme
2.2 PRODUIT SCALAIRE ET CALCUL D’ANGLES
Lien entre alpha et bêta
Atelier de formation : MAT optimisation II (les graphes).
La régression multiple
28/02/2013 JOURNEE DE FORMATION ACADEMIQUE - Un nouveau regard sur légalité des chances à lécole 1 Comparaison filles/garçons Après la 6ème.
Tests d’hypothèses.
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
07/22/09 1.
07/21/09 1.
ÉTHIQUE et DÉONTOLOGIE origine, importance et conséquences
ECOLE DES HAUTES ETUDES COMMERCIALES
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
1 Modèle pédagogique d’un système d’apprentissage (SA)
1 - Programme de Seconde (juin 2009) Statistique et probabilités
On cherche des renseignements sur p.
10 paires -. 9 séries de 3 étuis ( n° 1 à 27 ) 9 positions à jouer 5 tables Réalisé par M..Chardon.
Probabilités et Statistiques
CALENDRIER-PLAYBOY 2020.
Seconde partie - cours n°3 Théorie des tests
1 Introduction à la théorie des tests. 2 Plan I- choix entre 2 paramètres de tendance centrale Choix entre 2 proportions pour un caractère qualitatif.
Suites numériques Définitions.
Quel est l’intérêt d’utiliser le diagramme de Gantt dans la démarche de projet A partir d’un exemple concret, nous allons pouvoir exploiter plusieurs parties.
Probabilités et Statistiques
Probabilités et Statistiques Année 2010/2011
1 Une méthode itérative pour l'unfolding des données expérimentales, stabilisée dynamiquement(*) Bogdan MALAESCU LAL LLR 28/09/2009 (*arxiv: )
Joseph CHONG, Mauduit Pergent
ESTIMATION 1. Principe 2. Estimateur 3. Distribution d’échantillonnage
Rappels de statistiques descriptives
PRINCIPE DES TESTS D’HYPOTHÈSE
Probabilités et Statistiques
Probabilités et Statistiques Année 2009/2010
Probas-Stats 1A novembre 10 1 Probabilités et Statistiques Année 2010/2011
Probabilités et Statistiques Année 2010/2011
Probabilités et Statistiques
Probabilités et Statistiques Année 2009/2010
Probabilités et Statistiques
Probabilités et statistique MQT-1102
Introduction aux statistiques Intervalles de confiance
Transcription de la présentation:

Probabilités et Statistiques Année 2009/2010

Cours n°12 Théorie des tests statistiques

3 Test ? Problème de décision … en contexte incertain Exemples :  Le médicament MEDOC est-il efficace ?  La machine PROD est-elle bien réglée ?  Les OGM sont-ils dangereux ?  L’augmentation de 2% de nos ventes ce dernier mois est-elle significative ?

4 Points communs aux exemples  La décision ne peut être certaine ;  elle sera prise sur la base d’observations ;  tous les facteurs influents ne sont pas connus, et encore moins mesurés. Utilisation du formalisme probabiliste

5 Vous avez dit hypothèse ?  On oppose deux hypothèses :  MEDOC : efficace vs non efficace  PROD : bien réglée vs déréglée  OGM : dangereux vs inoffensifs  Notations :  H 0 : hypothèse nulle  H 1 : hypothèse alternative

6 Qui est H 0 ?  Les deux hypothèses n’ont pas le même rôle  MEDOC : le fabricant pense que le médicament est efficace H 0 : efficace les autorités de santé veulent des preuves H 0 : inefficace  OGM ?  PROD ?

7 Démarche 1.On fixe H 0 et H 1. 2.On évalue une quantité, appelée score ou statistique de test. 3.Si cette quantité dépasse un certain seuil, on rejette H 0. 4.On probabilise notre décision…

8 Un exemple simpl(ist)e  Exemple de type PROD  Usine de fabrication de tubes pour cosmétiques  Procédé par extrusion de polymère, puis coupure  Paramètre sensible : épaisseur du tube en  m

9 Problème et hypothèses  En fonctionnement normal, l’épaisseur mesurée d’un tube suit une loi normale N(m old,s old 2 ), où : m old = 208  m s old = 10,8  m  Un changement de fournisseur fait suspecter une diminution de la moyenne : m new = 202  m.  On observe 20 épaisseurs de tubes, réalisations indépendantes d’une v.a. de loi normale N(m,s old 2 ).  A-t-on m = m old ou m = m new ?

10

11

12 Démarche  H 0 : m = m new  Score = épaisseur moyenne  Décision : si > seuil, on rejette H 0  On probabilise : Sous H 0, est de loi normale N(m new,s old 2 /20) P( > seuil / H 0 ) = 1 - 

13

14 Le risque   On fixe un niveau de risque  :  = 5%  On évalue seuil pour que : P( > seuil / H 0 ) =  Ici, seuil = m new s old /√20 = 205,97  La région { > seuil} est la région critique.  Signification ? Toujours la loi des grands nombres (simulation)

15  seuil = 205,97

16 Décisions selon les cas  Supposons : 1. = 206,4 2. = 207,9 3. = 205,2  Décisions : 1.rejet de H 0 2.rejet de H 0 3.on conserve H 0

17 Le risque   Si on décide de rejeter H 0, on a peu de chances de faire erreur (cf. risque  ).  Et si on conserve H 0, a-t-on raison ??  Risque de seconde espèce  :  = P( ≤ seuil / H 1 ) Ici,  = P(N(202, /20) ≤ 205,97) = 20%   est appelé risque de première espèce.

18 seuil = 205,97  

19 Récapitulons H0H0 H1H1 H0H0  H1H1  Réalité Décision

20 Déroulement d’un test 1.On fixe H 0. 2.On définit une région critique (rejet de H 0 ) à partir d’un score S : rejet de H 0 si S ≥ seuil 3.On fixe  qui détermine seuil tel que : P(S ≥ seuil / H 0 ) =  4.On décide, et si on conserve H 0, on regarde 

21 Retour sur le choix de H 0  Seul  est maîtrisé.  Exemple PROD :  Situation 1 : grosses séries de moyenne qualité : Risque majeur : arrêter la production à tort.  = P(arrêt / bien réglé) : H 0 = « bien réglé »  Situation 2 : CDC client très strict : Risque majeur : produire de mauvais composants.  = P(production / mal réglé) : H 0 = « mal réglé »

22 Dernières remarques   et  varient en sens contraire.  Diminution simultanée de  et  possible en augmentant la taille de l’échantillon.  Critiques :  Il se peut qu’aucune des deux hypothèses ne soit correcte (risques de 3ème espèce !!)  Si on rejette H 0 avec  = 5%, que donnent 4% ? 1% ? …

23 Notion de p-valeur  Test de région critique de la forme : rejet de H 0 si S ≥ seuil  On observe s obs  On évalue la probabilité : p = P(S ≥ s obs / H 0 )  p est appelée p-valeur (p-value)

24 Retour sur l’exemple 1.Cas où = 206,4 : p-valeur = P(N(202, /20)>206,4) = Cas où = 207,9 : p-valeur = P(N(202, /20)>207,9) = Cas où = 205,2 : p-valeur = P(N(202, /20)>205,2) = 0.093

25 = 205,2 p-value = 0.093