Statistiques et informatique

Slides:



Advertisements
Présentations similaires
Introduction aux statistiques Intervalles de confiance
Advertisements

Comparaison d’une moyenne observée à une moyenne théorique
Probabilités et statistiques au lycée
D.Gile statscrit1 LUTILISATION DES STATISTIQUES INFERENTIELLES DANS LA RECHERCHE : REFLEXIONS CRITIQUES
STATISTIQUE INFERENTIELLE L ’ESTIMATION
Risques d’erreur statistique et test statistique
Test statistique : principe
Statistique et probabilité Série n° 1
Les tests d’hypothèses (I)
Inférence statistique
Comparaison de deux moyennes observées
Faculté de médecine de Nancy - SPI-EAO - Pr. F. KOHLER
Comparaison d'une distribution observée à une distribution théorique
Comparaison de deux pourcentages observés
Comparaison de plusieurs moyennes observées
Tests non paramétriques
Les TESTS STATISTIQUES
Tests de comparaison de pourcentages
Les TESTS STATISTIQUES
Les Tests dhypothèses. 1)Définition Un test cest une méthode qui permet de prendre une décision à partir des résultats dun échantillon.
Les tests d’hypothèses
Tests de comparaison de moyennes
Probabilités.
Probabilités et statistiques
Méthodes de Biostatistique
L’inférence statistique
Nombre de sujets nécessaires en recherche clinique
Pourquoi les statistiques ?
Problème Autre formulation :
Paul-Marie Bernard Université Laval
Stat-infoCM4a : 1 Changement de groupe TD Lebossé Olivier  8h00 : M105 Charbonnier Guillaume ?  8h00 : M105.
Faculté de Médecine Lyon-Sud Module Optionnel de préparation à la lecture critique d ’articles Interprétation des tests statistiques.
Le test t.
Corrélation Principe fondamental d’une analyse de corrélation
Tests d’hypothèses.
Méthodes de prévision (STT-3220)
Inéquations du premier degré à une inconnue
Les groupes.
Régression linéaire.
Calcul de probabilités
Présentation de la méthode des Eléments Finis
Le combat intérieur Romains
1 - Programme de Seconde (juin 2009) Statistique et probabilités
On cherche des renseignements sur p.
Probabilités et Statistiques
Probabilités et Statistiques Année 2009/2010
Seconde partie - cours n°3 Théorie des tests
ANOVA : introduction.
Introduction à l’analyse statistique
Joseph CHONG, Mauduit Pergent
Master 1 – Sciences du Langage –
Inéquations du premier degré à une inconnue
ESTIMATION 1. Principe 2. Estimateur 3. Distribution d’échantillonnage
Rappels de statistiques descriptives
Biostatistiques Quand on souhaite étudier une (ou des) caractéristique(s) sur un ensemble d’individus ou d’objets, il est difficile, voir impossible, d’observer.
1 Licence Stat-info CM4 b 2004 V1Christophe Genolini Groupes appareillés : problème On veut comparer deux correcteurs On dispose de 3 copies –Le premier.
1 1 Licence Stat-info CM7 a 2004 V1Christophe Genolini Récapitulatif : Variables qualitatives Variables qualitatives : –on se demande si elles sont liées.
Rappels Variables nominales :
Problème Autre formulation :
Stat-infoCM1b : 1 Stat : pour quoi faire ? La licence commence ici…
1.  On souhaite comparer deux traitements dans le cadre d’un essai randomisé sur les lombosciatiques :  corticoïdes par infiltrations  placebo  Critère.
1 Licence Stat-info CM5a 2004 V1Christophe Genolini Problème Détection d’un phénomène particulier : –Flûtiste exceptionnelle ou moyenne –Groupe de TD super.
Groupes appareillés.
Probabilités et statistique MQT-1102
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Famille A La famille A a cinq enfants – Patricia – Mary – Susan – Helen – Kathleen – Quelle est la probabilité que le prochain enfant soit un garçon ?
Introduction aux statistiques Intervalles de confiance
Chapitre 6 Les tests d ’ hypoth è se 1 – Comparer des moyennes ou des proportions.
Transcription de la présentation:

Statistiques et informatique 7 CM + 12 TD en salle machine Enseignants Pol Leborgne (responsable de l’EC) Christophe Genolini Tarak Driss Annabelle Couillandre Evaluation Contrôle continu (mini QCM + partiel long) Examen Final Absences INTERDITES en TD

Que fait-on en stats ? Variabilité biologique Les règles absolues sont rares (Archimède, Newton, Einstein) D’ou des règles probables Exemples de ce que nous allons étudier : Étudiant en retard : la faute aux trains ? Comparaison entre groupes : quel prof est nul ? Répartition des « black & beurre » dans les classes : racisme à l’école ? Prêt-à-porter : quelles sont les tailles gagnantes ? Construction d’une solution : hypothèse H0

1. Variabilité biologique Règles absolues Principe d’Archimède Newton et sa pomme Règles variables : Une verre qui tombe se casse-t-il ? Souvent mais pas toujours En combien de temps Marc descend-il un super-G ? En moyenne, 3’15’’ Le train est-il en retard ? Dans 5% des cas

La variabilité n'est pas l'exception, 1.1. Exemples Performances du skieur Nourriture ? Conditions météo ? Activité physique ? Repos ? Le stress ? Relation affectives ? L’enjeu ? Efficacité d’un médicament Taille d’un adulte La variabilité n'est pas l'exception, c'est la règle.

Comment avoir des certitudes ? Impossible ! On parlera de probabilités : Skieur Marc descend en moyenne en 3’13’’ 95% de ses essais, il descend entre 3’05’’ et 3’21’’ Ce médicament fonctionne sur 60% des patients Taille : 68% des françaises mesurent entre 1m57 et 1m67 95% des française mesurent entre 1m52 et 1m72

2.1. Exemple des trains Problème des retards : 5% des trains sont en retards Un étudiant assiste à 26 TD Il est en retard 6 fois Question : les retards sont-ils dus au hasard (c’est à dire à la variabilité biologique) ? Réponses évidentes Un étudiant est en retard 1 fois : c’est normal (variabilité biologique) Un étudiant est en retard 22 fois : c’est anormal Un étudiant est en retard 6 fois : réponse au chapitre 2 (Khi-Deux)

2.2. Racisme à l’école Dans les deux classes de CP, on compte le nombre d’émigrés Dans la première classe, il y a en a X. Dans le deuxième, il y en a Y. Question : la différence entre X et Y est-elle due à la variabilité biologique (au hasard) ? Réponses évidentes : Si X=0 et Y=10, il est évident que la méthode de répartition des élèves est un peu louche. Si X=5 et Y=5, à priori, pas de problème. Entre les deux : 2 (Khi-Deux)

2.3. Exemple des tailles Problème des tailles : Les françaises mesurent en moyenne 1,62m, écart type 0,05m Le prêt-à-porter veut habiller 68% de la population Question : quel intervalle contient 68% des françaises ? Question : quel est le pourcentage des françaises dont la taille est comprise dans l’intervalle [1,60m ; 1,64m] ?

2.4. Comparaison de groupes Deux enseignants utilisent deux méthodes d’enseignement différentes. Les 150 élèves du premier obtiennent une moyenne générale A. Les 150 élèves du second obtiennent une moyenne générale B. Question : la différence entre A et B est-elle due à la variabilité biologique (au hasard) ? Réponses évidentes : Si A=10 et B=3, il est évident que la méthode du premier est plus efficace Si A=9 et B=9, aucune différence notable ne permet de trancher. Entre les deux : T de Student

3.1. Statistiques et probabilités Statistiques descriptives : Elles décrivent : on a des mesures, elles résument les mesures ou donnent des indications sur les mesures. Exemple : la moyenne d’une classe, les scores des matchs de foot Statistiques inférentielles : Elles prédisent : à l’aide des outils de la statistique descriptive, on peut évaluer la probabilité que certaines choses soient vraies (ou fausses), ou encore estimer une valeur inconnue. Exemple : audimat, pronostics sportifs

Exemple Problème : J’ai une pièce, je veux savoir si elle est équilibrée. Hypothèse H0 : elle est équilibrée Mesure statistique : Je joue dix fois à pile ou face, j’obtiens 9 piles Calcul de probabilité : les outils mathématiques me disent que j’ai une chance sur mille d’obtenir 9 piles avec une pièce équilibrée

3.2. Méthode de travail Données : on a des données provenant de deux groupes A et B Problème : on se demande s’il existe une « vraie » différence entre les groupes ou pas Pour le savoir : On fait une hypothèse, appelée hypothèse H0 : on suppose que seule la variabilité biologique est en jeu, A n’est pas différent de B. On cherche la probabilité que H0 soit vraie. Si H0 est très faiblement probable, alors on rejette H0. Si H0 n’est pas faiblement probable, alors on ne dit rien

3.3. Hypothèse H0 (hypothèse nulle) Problème des train en retards : H0 : les retards de l’étudiant (6 retards sur 26) sont dus à « pas de chance », à la variabilité biologique, au hasard. Problème des moyennes : H0 : la différence observée entre la moyenne A et la moyenne B est due au hasard de la répartition des étudiants entre les groupes, à la variabilité biologique.

3.3. Résultat de l’étude : H0 faiblement probable Quand H0 est faiblement probable, on rejette H0 : Problème des train en retards : Si la probabilité que H0 soit vraie est de 0,2% : il est fortement probable que H0 soit fausse, c’est à dire que les retards de l’étudiant ne soient pas liés au hasard. Ils sont donc liés à une autre cause… Problème des moyennes : Si la probabilité que H0 soit vraie est de 3% : il est fortement probable que la différence des moyennes ne soit pas liée au hasard. Elle est donc due à autre chose, probablement la méthode d’enseignement.

3.3. Résultat de l’étude : H0 fortement probable Quand H0 est fortement probable (ou moyennement probable), on ne rejette pas H0… mais on ne l’accepte pas non plus Problème des train en retards : Si la probabilité que H0 soit vraie est de 20% : il y a 80% de chances pour que H0 soit fausse. Si on rejette H0, on se trompe dans 20% des cas (ce qui est énorme). Donc on ne conclut pas. Problème des moyennes : Si la probabilité que H0 soit vraie est de 30% : hasard ou autre cause, on ne peut pas vraiment trancher.

3.4. Ne pas rejeter H0 Quand on ne rejette pas H0, on ne l’accepte pas pour autant… Exemple : on prend trois garçons mesurant 1m63, 1m64 et 1m66, on compare à trois filles 1m60, 1m64 et 1m65 H0 : la moyenne de taille des garçons et celle des filles sont (à peu prêt) identiques. H0 n’est pas rejetée Et pourtant : Cela ne veux pas dire pour autant que les moyennes sont les mêmes. Un échantillon plus grand permettra de conclure.

3.4.1. Erreur de première espèce Erreur de la première espèce : dans l’absolue, H0 est fausse, mais notre expérience ne nous permet pas de nous en rendre compte : on ne rejette pas H0 alors que H0 est fausse Exemple : on compte les bébés à la naissance, on trouve 26 garçons et 24 filles. La différence est-elle significative ? Non. Notre expérience ne nous permet pas de conclure Et pourtant, sur un plus grand nombre d’essais, on aurait trouvé une différence hautement significative

3.4.2. Erreur de deuxième espèce Erreur de la deuxième espèce : dans l’absolue, H0 est vraie, mais notre expérience ne nous permet pas de nous en rendre compte : on rejette H0 alors que H0 est vraie Exemple : un médicaments a soigné 200 malades de plus qu’un placebo. Peut-on conclure ? Oui. Notre expérience nous le permet Et pourtant, sur un plus grand nombre d’essai, on n’aurait pas trouvé de différence

Récapitulatif