Seconde partie - cours n°3 Théorie des tests

Slides:



Advertisements
Présentations similaires
Introduction aux statistiques Intervalles de confiance
Advertisements

Comparaison d’une moyenne observée à une moyenne théorique
RECONNAISSANCE DE FORMES
Test statistique : principe
Les tests d’hypothèses (I)
Inférence statistique
Comparaison de deux moyennes observées
Comparaison d'une distribution observée à une distribution théorique
Comparaison de deux pourcentages observés
Comparaison de plusieurs moyennes observées
Tests non paramétriques
Les TESTS STATISTIQUES
1. Les caractéristiques de dispersion. 11. Utilité.
Les TESTS STATISTIQUES
Les Tests dhypothèses. 1)Définition Un test cest une méthode qui permet de prendre une décision à partir des résultats dun échantillon.
UN JEU DANGEREUX Le collège Justin CATAYEE et
Les tests d’hypothèses
1 Analyse de la variance multivariée Michel Tenenhaus.
Recherche heuristique de similitudes dans les séquences dADN École Jeunes Chercheurs en Algorithmique et Calcul Formel Laurent Noé
Tests de comparaison de moyennes
Méthodes de Biostatistique
Cours Corporate finance Eléments de théorie du portefeuille Le Medaf
1.3 COORDONNÉES DES POINTS
Modeles Lineaires.
La puissance statistique
La puissance statistique
Notre calendrier français MARS 2014
L’OFFRE ET LA DEMANDE.
1 La détection de gènes impliqués dans les maladies multifactorielles Marie-Pierre Etienne ENGREF Laboratoire GRESE Statistique et Génome.
3ème partie: les filtres
TEST d’ADEQUATION A UNE LOI EQUIREPARTIE
Veuillez trouver ci-joint
Résoudre une équation du 1er degré à une inconnue
Questions des 4 carrés Prêts ? B A Regardez bien ce diagramme
2.2 PRODUIT SCALAIRE ET CALCUL D’ANGLES
Lien entre alpha et bêta
Atelier de formation : MAT optimisation II (les graphes).
La régression multiple
28/02/2013 JOURNEE DE FORMATION ACADEMIQUE - Un nouveau regard sur légalité des chances à lécole 1 Comparaison filles/garçons Après la 6ème.
Tests d’hypothèses.
Échantillonnage (STT-2000) Section 2 Tirage de Bernoulli (plan BE). Version: 4 septembre 2003.
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
07/22/09 1.
07/21/09 1.
ÉTHIQUE et DÉONTOLOGIE origine, importance et conséquences
ECOLE DES HAUTES ETUDES COMMERCIALES
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
1 Modèle pédagogique d’un système d’apprentissage (SA)
1 - Programme de Seconde (juin 2009) Statistique et probabilités
On cherche des renseignements sur p.
10 paires -. 9 séries de 3 étuis ( n° 1 à 27 ) 9 positions à jouer 5 tables Réalisé par M..Chardon.
CALENDRIER-PLAYBOY 2020.
Probabilités et Statistiques Année 2009/2010
1 Introduction à la théorie des tests. 2 Plan I- choix entre 2 paramètres de tendance centrale Choix entre 2 proportions pour un caractère qualitatif.
Suites numériques Définitions.
Quel est l’intérêt d’utiliser le diagramme de Gantt dans la démarche de projet A partir d’un exemple concret, nous allons pouvoir exploiter plusieurs parties.
1 Une méthode itérative pour l'unfolding des données expérimentales, stabilisée dynamiquement(*) Bogdan MALAESCU LAL LLR 28/09/2009 (*arxiv: )
Joseph CHONG, Mauduit Pergent
Chimiometrie (Chemometrics)
ESTIMATION 1. Principe 2. Estimateur 3. Distribution d’échantillonnage
Rappels de statistiques descriptives
Prédiction de Jeu dans un Assemblage - Application au Calage
PRINCIPE DES TESTS D’HYPOTHÈSE
Réalisé par : Mr IRZIM Hédi Mr JRAD Firas
Probabilités et Statistiques Année 2010/2011
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
Probabilités et statistique MQT-1102
Introduction aux statistiques Intervalles de confiance
Transcription de la présentation:

Seconde partie - cours n°3 Théorie des tests Laurent CARRARO

Test ? Problème de décision … en contexte incertain Exemples : Le médicament MEDOC est-il efficace ? La machine PROD est-elle bien réglée ? Les OGM sont-ils dangereux ? L’augmentation de 2% de nos ventes ce dernier mois est-elle significative ?

Points communs aux exemples La décision ne peut être certaine ; elle sera prise sur la base d’observations ; tous les facteurs influents ne sont pas connus, et encore moins mesurés. Utilisation du formalisme probabiliste

Vous avez dit hypothèse ? On oppose deux hypothèses : MEDOC : efficace vs non efficace PROD : bien réglée vs déréglée OGM : dangereux vs inoffensifs Notations : H0 : hypothèse nulle H1 : hypothèse alternative

Qui est H0 ? Les deux hypothèses n’ont pas le même rôle MEDOC : OGM ? le fabricant pense que le médicament est efficace H0 : efficace les autorités de santé veulent des preuves H0 : inefficace OGM ? PROD ?

Démarche On fixe H0 et H1. On évalue une quantité, appelée score ou statistique de test. Si cette quantité dépasse un certain seuil, on rejette H0. On probabilise notre décision…

Un exemple simpl(ist)e Exemple de type PROD Usine de fabrication de tubes pour cosmétiques Procédé par extrusion de polymère, puis coupure Paramètre sensible : épaisseur du tube en m

Problème et hypothèses En fonctionnement normal, l’épaisseur mesurée d’un tube suit une loi normale N(mold,sold2), où : mold = 208 m sold = 10,8 m Un changement de fournisseur fait suspecter une diminution de la moyenne : mnew = 202 m. On observe 20 épaisseurs de tubes, réalisations indépendantes d’une v.a. de loi normale N(m,sold2). A-t-on m = mold ou m = mnew ?

Démarche H0 : m = mnew Score = épaisseur moyenne Décision : si > seuil, on rejette H0 On probabilise : Sous H0, est de loi normale N(mnew,sold2/20) P( > seuil / H0) = 1 - 

Le risque  On fixe un niveau de risque  :  = 5% On évalue seuil pour que : P( > seuil / H0) =  Ici, seuil = mnew + 1.64 sold/√20 = 205,97 La région { > seuil} est la région critique. Signification ? Toujours la loi des grands nombres (simulation)

 seuil = 205,97

Décisions selon les cas Supposons : = 206,4 = 207,9 = 205,2 Décisions : rejet de H0 on conserve H0

Le risque  Si on décide de rejeter H0, on a peu de chances de faire erreur (cf. risque ). Et si on conserve H0, a-t-on raison ?? Risque de seconde espèce  : = P( ≤ seuil / H1) Ici,  = P(N(202,10.82/20) ≤ 205,97) = 20%  est appelé risque de première espèce.

  seuil = 205,97

Finalement, quelle probabilité d’erreur ? Réalité Décision H0 H1    

Déroulement d’un test On fixe H0. On définit une région critique (rejet de H0) à partir d’un score S : rejet de H0 si S ≥ seuil On fixe  qui détermine seuil tel que : P(S ≥ seuil / H0) =  On décide, et si on conserve H0, on regarde 

Retour sur le choix de H0 Seul  est maîtrisé. Exemple PROD : Situation 1 : grosses séries de moyenne qualité : Risque majeur : arrêter la production à tort.  = P(arrêt / bien réglé) : H0 = « bien réglé » Situation 2 : CDC client très strict : Risque majeur : produire de mauvais composants.  = P(production / mal réglé) : H0 = « mal réglé »

Dernières remarques et  varient en sens contraire. Diminution simultanée de et  possible en augmentant la taille de l’échantillon. Critiques : Il se peut qu’aucune des deux hypothèses ne soit correcte (risques de 3ème espèce !!) Si on rejette H0 avec = 5%, que donnent 4% ? 1% ? …

Notion de p-valeur Test de région critique de la forme : rejet de H0 si S ≥ seuil On observe sobs On évalue la probabilité : p = P(S ≥ sobs / H0) p est appelée p-valeur (p-value)

Retour sur l’exemple Cas où = 206,4 : Cas où = 207,9 : p-valeur = P(N(202,10.82/20)>206,4) = 0.034 Cas où = 207,9 : p-valeur = P(N(202,10.82/20)>207,9) = 0.0073 Cas où = 205,2 : p-valeur = P(N(202,10.82/20)>205,2) = 0.093

p-value = 0.093 = 205,2

H : les données proviennent de la loi normale Perspectives Lemme de Neyman et Pearson (construction systématique de la région critique). Tests avec des hypothèses dites composites, par exemple : H : m > 208 Tests non paramétriques, par exemple : H : les données proviennent de la loi normale etc…