Problème Autre formulation :

Slides:



Advertisements
Présentations similaires
Comparaison d’une moyenne observée à une moyenne théorique
Advertisements

Les matrices.
Analyse de 2 variables qualitatives
Introduction aux statistiques
Les tests d’hypothèses (I)
Inférence statistique
Comparaison de deux moyennes observées
Inférence statistique
Situation du problème :
Comparaison de pourcentages : séries appariées
Faculté de médecine de Nancy - SPI-EAO - Pr. F. KOHLER
Comparaison d'une distribution observée à une distribution théorique
Comparaison de deux pourcentages observés
Comparaison de plusieurs moyennes observées
Tests de comparaison de pourcentages
ASSOCIATION entre caractères qualitatifs
ASSOCIATION entre caractères qualitatifs
Indépendance & Khi-deux ²
COURS 5 Les tableaux croisés, le chi-carré et la corrélation
Tests de comparaison de moyennes
Les liens entre les variables et les tests d’hypothèse
ou comment savoir si les différences observées sont significatives
Pourquoi les statistiques ?
Test 2.
Problème Autre formulation :
L’Analyse de Variance 1 Généralités Le modèle Calculs pratiques
La corrélation et la régression multiple
Analyse factorielle de variance: Principes d’expérimentation
TEST d’ADEQUATION A UNE LOI EQUIREPARTIE
Les groupes.
Régression linéaire.
Statistiques Séance 10 N. Yamaguchi.
Méthodes de Biostatistique
ANOVA : introduction.
Statistiques et informatique
ANALYSE DE DONNEES TESTS D’ASSOCIATION
1 Licence Stat-info CM4 b 2004 V1Christophe Genolini Groupes appareillés : problème On veut comparer deux correcteurs On dispose de 3 copies –Le premier.
Micro-intro aux stats.
M2 Sciences des Procédés - Sciences des Aliments
ANOVA à 1 facteur en groupes de mesure indépendants
1 1 Licence Stat-info CM7 a 2004 V1Christophe Genolini Récapitulatif : Variables qualitatives Variables qualitatives : –on se demande si elles sont liées.
Terminale STG 2006 Statistiques à deux variables
Rappels Variables nominales :
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
1 Licence Stat-info CM1 b 2004Christophe Genolini 2.1. Vocabulaire Individu : objet étudié Population : Ensemble des individus Variable : nom donné à ce.
Stat-infoCM1b : 1 Stat : pour quoi faire ? La licence commence ici…
Stat-infoCM6a : 1 Rappels.
1.  On souhaite comparer deux traitements dans le cadre d’un essai randomisé sur les lombosciatiques :  corticoïdes par infiltrations  placebo  Critère.
1 Licence Stat-info CM5a 2004 V1Christophe Genolini Problème Détection d’un phénomène particulier : –Flûtiste exceptionnelle ou moyenne –Groupe de TD super.
Test 2.
1 1 Licence Stat-info CM6 a 2004 V1Christophe Genolini Rappels 1.Variables nominales : –Oui / Non –Bleu / Brun / Roux / Noir Pour déterminer s’il y a un.
1 Licence Stat-info CM4 c 2004 V1Christophe Genolini Estimateur fiable.
ou comment savoir si les différences observées sont significatives
1 Licence Stat-info CM3 a 2004 V1.2Christophe Genolini Problème des groupes Un amphi de 200 élèves : loi normale moyenne X et écart type s –Un élève :
MODULE FTH 2007 Diversité génétique
CONSTRUCTION DE TABLEAUX CROISES SUR LE LOGICIEL MODALISA MET4 – Avril 2005.
1 Licence Stat-info CM4a 2004 V2Christophe Genolini Égalité des variances Une des conditions pour utiliser T est l’égalité des variances s APA  s MS On.
1 1 Licence Stat-info CM6 b 2004 V1Christophe Genolini Régression linéaire : problème On a les notes math et français suivantes : Un élève a 10 en math,
1 L2 STE. Test du χ2 d’adéquation/conformité: Il s'agit de juger de l'adéquation entre une série de données statistiques et une loi de probabilité définie.
Comparaison de plusieurs moyennes observées
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Scénario Quatre hipsters entrent en collision un dans l'autre dans un ascenseur plein de personnes. En conséquence ils laissent tomber leurs téléphones.
Introduction aux statistiques Intervalles de confiance
 Champ des mathématiques  Ensemble de méthodes et de techniques  Permet une analyse objective  Facilitées aujourd’hui par les tableurs.
Chapitre 6 Les tests d ’ hypoth è se 1 – Comparer des moyennes ou des proportions.
Notions de statistiques et d’analyse de données Master 1 MGS – Sarah MISCHLER –
 Comparaison des résultats sur 20 dans 2 classes de 4 élèves  Moyennes identiques  Situation identique dans les 2 classes ?  Pourquoi ?   paramètres.
Test 2.
Transcription de la présentation:

Problème Autre formulation : Garçons ou filles : qui réussi le mieux au bac ? Cigarette et cancer : y a t il un lien ? Prévention routière : moins d’accident chez les verbalisés ? Autre formulation : Y a t il un lien entre sexe et réussite au bac ? Y a t il un lien entre cancer et cigarette ? Y a t il un lien entre accident et verbalisation ?

Mesures Données brutes Tableau des effectifs Tableau croisé

Théorie… Définition : Hypothèse nulle (=H0) : il n’y a pas de lien entre la variable sexe et la variable résultat. Si H0 est vrai : le pourcentage des Admis est le même chez les garçons que chez les filles

Variabilité biologique ou H0 est-elle rejetable ? … et pratique Dans d’autres lycées : Pas de différence H0 n’est pas rejetable Différence énorme On rejette H0 Dans notre lycée : Variabilité biologique ou H0 est-elle rejetable ?

Problème Une différence significative cache probablement une cause Quand peut-on considérer qu’une différence est significative ? Quand est-elle du à la variabilité biologique ? Pas de différence H0 n’est pas rejetable Différence énorme On rejette H0 Variabilité biologique ? Différence significative ? Dans notre lycée :

Solution Test du 2 (prononcez khi2) permet de trancher : Le 2 est un indice que l’on calcule à partir d’un tableau croisé. Quand on l’a trouvé, il permet de décider si oui ou non les variations du tableau soit du au hasard : 2=0,062 2=0,062  Incertitude On ne sait pas si la différence est due au hasard des mesures ou a un lien entre les deux variables 2=8,68 2=8,68  Pas de hasard On en est sûr, une telle différence ne peut pas être due au hasard : il y a un lien entre les deux variables.

Calcul du 2 On utilise des tableaux : Tableau des effectifs observés (tableau croisé) Tableau des effectifs théoriques Tableau des écarts bruts Tableau des écarts au carré et pondérés Formule du 2 Lecture de la table

1 : Effectifs observés

2 : Effectifs théoriques total colonne x total ligne total général Pour chaque case : effectif théorique = Totaux Calcul par case Résultats

Tableau des écarts bruts Pour chaque case : écart brut = effectifs observés – effectifs théoriques – Effectifs observés Effectifs théoriques = Tableau des écarts bruts

4 : Écarts au carré et pondérés Pour chaque case : Écart au carré pondéré = (écart brut)2 effectif théorique

 5 : Formule du 2 Le 2 est la somme des écarts au carré pondérés 2 =  (écart brut)2 effectif théorique 2 =0,035+0,015+0,009+0,004=0,63

Généralisation 1 : Effectifs observés Y a t il un lien entre couleur des yeux et des cheveux ? 1 : Effectifs observés

2 : Effectifs théoriques total colonne x total ligne total général Pour chaque case : effectif théorique =

Tableau des écarts bruts Pour chaque case : écart brut = effectifs observés – effectifs théoriques – Effectifs observés Effectifs théoriques = Tableau des écarts bruts

4 : Écarts au carré et pondérés Pour chaque case : Écart au carré pondéré = (écart brut)2 effectif théorique

 5 : 2 2 = (écart brut)2 effectif théorique 2 =5,11+0,96+2,07+1,69+0,33+0,66+2,66+0,52+1,04+0,01+0,00+0,00=15,05

(effectifs observés – effectifs théoriques)2 2 en bref 2 = Le 2 que l’on calcule est également appelé 2 observé. On le note : 2Obs  (effectifs observés – effectifs théoriques)2 effectif théorique

Problème Quand un 2 est-il grand ? 2=2,6 2=5,3

DDL=(Nombre de colonnes-1)x(Nombre de lignes-1) DDL=Degré de liberté DDL=(Nombre de colonnes-1)x(Nombre de lignes-1) DDL = (2-1)x(2-1) = 1 DDL=(4-1)x(3-1)=6

Lecture de la table Cette table permet de lire le 2 théorique (qu’on note 2Th) Au risque 10%, DDL 1, 2Th =2,706 Au risque 5% DDL 3, 2Th =7,815

Conclusion RAPPEL : Si le 2 observé est grand, on peut rejeter H0 Formellement : si le 2 observé est plus grand que le 2 théorique, cela signifie qu’il est grand et qu’on peut rejeter H0 si 2Obs <2Th, cela signifie que le 2 observé est petit et qu’on ne peut pas rejeter H0 2Obs >2Th => On rejette H0 2Obs <2Th => On ne rejette pas H0

On peut rejeter H0, il y a un lien entre C. Cheveux et C. Yeux Conclusion Exemple sexe / réussite : 2Obs=0,63 DDL=1 Au risque 5% : 2Th=3,841 On ne peut pas conclure car le 2 observé est plus petit que le 2 théorique : On ne peut pas rejeter H0 Exemple C. Cheveux / C. Yeux : 2Obs=15,05 DDL=6 Au risque 5% : 2Th=12,592 On peut conclure car le 2 observé est plus grand que le 2 théorique : On peut rejeter H0, il y a un lien entre C. Cheveux et C. Yeux

Écarts au carré pondérés Interprétation 2Obs=15,05 : le 2Obs, est grand. Pourquoi ? Écarts au carré pondérés Parce que Blond / Bleus = 5,11 et que Noir / Bleus = 2,66 Ces deux cases « apportent » beaucoup au 2

Écarts au carré pondérés Interprétation Cases sur et sous représentées : Écarts au carré pondérés Sur le tableau des écarts, Blonds / Bleus = 9 : il y en a beaucoup. On dit qu’ils sont sur-représentés Sur le tableau des écarts, Noirs / Bleus = -4,5 : il en manque beaucoup. On dit qu’ils sont sous-représentés