Statistiques Séance 10 N. Yamaguchi.

Slides:



Advertisements
Présentations similaires
Comparaison d’une moyenne observée à une moyenne théorique
Advertisements

ANOVA à un facteur (Rehailia)
Association entre variables
Introduction aux statistiques
Inférence statistique
C1 Bio-statistiques F. KOHLER
Situation du problème :
Comparaison de pourcentages : séries appariées
Faculté de médecine de Nancy - SPI-EAO - Pr. F. KOHLER
Comparaison d'une distribution observée à une distribution théorique
Comparaison de deux pourcentages observés
Comparaison de plusieurs moyennes observées
Tests non paramétriques
Tests de comparaison de pourcentages
Comparaison de plusieurs moyennes Analyse de variance
Régression -corrélation
1 Statistiques Séance 5 – 9 Nov Résumé séance précédente Lécart-type σ ou s. Comment le calculer? Les propriétés numériques de la courbe normale.
Indépendance & Khi-deux ²
COURS 5 Les tableaux croisés, le chi-carré et la corrélation
Tests de comparaison de moyennes
Tests de comparaison de moyennes
Les liens entre les variables et les tests d’hypothèse
Statistiques Séance 9 – 6 décembre 2005 N. Yamaguchi.
Objectifs du chapitre 12: Interprétation des résultats
Test 2.
Howell, Chap. 1 Position générale
Corrélation et régression linéaire simple
L’Analyse de Variance 1 Généralités Le modèle Calculs pratiques
1.Un rang de données multicolores 2. Deux permutations des n premiers entiers 3. b permutations des k premiers entiers 4. Choix de n points dans [0,1]
Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte.
Le test t.
Corrélation Principe fondamental d’une analyse de corrélation
Comparaison de deux échantillons
Expériences contrôlées Rappel du cours d’IHM
Objectifs du chap. 5: Plans de recherche classiques
Objectifs du chapitre sur le khi-carré (χ2)
Analyse factorielle de variance: Principes d’expérimentation
ORGANIGRAMME-MÉTHODES STATISTIQUES-COMPARAISONS DE MOYENNES
Méthodes de Biostatistique
Méthodes de Biostatistique
Statistique Descriptive Analyse des données
Méthodologie expérimentale : l’analyse des données
Master 1 – Sciences du Langage –
Biostatistiques Quand on souhaite étudier une (ou des) caractéristique(s) sur un ensemble d’individus ou d’objets, il est difficile, voir impossible, d’observer.
PRINCIPE DES TESTS D’HYPOTHÈSE
ANALYSE DE DONNEES TESTS D’ASSOCIATION
Lien entre deux variables
N. Yamaguchi1 Statistiques Séance 6 – 16 Nov 2005.
STATISTIQUES DESCRIPTIVES
Séance 8 30 novembre 2005 N. Yamaguchi
ANOVA à 1 facteur en groupes de mesure indépendants
TESTS NON PARAMETRIQUES
Statistiques Séance 7 – 23 nov 2005 Master SDL N. Yamaguchi.
Statistiques analytiques sous STATA
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
Problème Autre formulation :
Méthodes de Biostatistique Chapitre 9 Tests Nonparamétriques.
ATELIERS STATISTIQUES
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :36 1 Tableaux de contingence et modèles log-
La statistique ?? Non ! C’est facile.
1 L2 STE. Test du χ2 d’adéquation/conformité: Il s'agit de juger de l'adéquation entre une série de données statistiques et une loi de probabilité définie.
Comparaison de plusieurs moyennes observées
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
 Champ des mathématiques  Ensemble de méthodes et de techniques  Permet une analyse objective  Facilitées aujourd’hui par les tableurs.
Biostatistique pour le troisième cycle P. Leroy, F. Farnir 2013.
Notions de statistiques et d’analyse de données Master 1 MGS – Sarah MISCHLER –
Chap. III Statistiques inférentielles
Transcription de la présentation:

Statistiques Séance 10 N. Yamaguchi

Résumé de la séance précédente Les ANOVA À 1 facteur à n niveaux À 1 facteur à mesures répétées À 2 facteurs (+ notion d’interaction) Les corrélations Test paramétrique: Pearson Test non paramétrique: Spearman

Rappel : corrélation de Spearman Prend en compte les rangs Exercice sur Spearman

Exercice Sujet Note de maths Note de français 1 15 18 2 5 10 3 4 11 12 16 6 8 7 14

Le Khi (Chi) 2 Ou χ2

Pourquoi faire? Comparer des distributions ou des formes de distributions Etude des fréquences ou des effectifs impliquant des variables nominales. Pas de variables continues! Exemple du début : la BU.

Comparaison d’une distr observée et d’une distr théorique Une seule variable nominale On analyse une seule distribution. Question : est-elle homogène (= semblable à la distribution théorique) H0: oui. Répartition homogène des effectifs.

Exemple (1) cf I. Lehiste Perception du contexte d’une phrase par 30 auditeurs. Tableau pour la phrase lue isolément Comparaison avec la distrib théorique: répartition homogène des effectifs. Note: variable nominale à 4 modalités (les rentrer comme une variable continue ds Statview) H0?

Procédure Données: comme une variable continue Analyse: Pas d’étiquettes! Pas besoin de rentrer la distribution théorique Analyse: Analyse univariée > Khi 2 (désselectionner test-t) > rentrer la distrib théorique!!! Menu Analyse > test-t > Editer analyse > Khi 2

Résultats Valeur du Khi 2 à comparer avec p. Hypothèse nulle non rejetée Conclusion? Mais…

Exemple (2ème partie) Même phrase lue à l’initiale. Distribution aléatoire? Données: on rajoute une colonne Procédure : même chose. On peut assigner une autre variable! Résultats Conclusion

Un autre cas du Chi 2 Comparaison de 2 distributions indépendantes Voir si les 2 distributions sont homogènes. (répartition de fréquences) Hypothèse nulle: il n’y a pas de relation entre les fréquences des lignes et les fréquences des colonnes

Tableau de contingence Exemple Étude sur l’efficacité d’une méthode d’enseignement des langues: labo vs méthode traditionnelle Tableau de contingence

Calcul du Chi 2 Tableau de contingence: la colonne ds laquelle un sujet se trouve (= réussite vs échec) est contingente (= dépend de) la ligne ds laquelle le sujet se trouve (= exp vs méthode trad) H0: il n’y a pas de relation entre ligne et colonne

Calcul du Chi 2 (suite) Calcul de la fréquence attendue si H0 est vraie, pour chaque cellule du tableau:

Calcul du Chi 2 (suite) Résultat global par rapport à toutes les cellules. Procédure: Données Tableau de contigence > tableau résumé et Chi 2 des cellules

Résultats Tableau résumé Chi 2 des cellules DDL : (C-1)(R-1) Valeur Chi 2 et p Résultats? H0? Chi 2 des cellules Décomposition du Chi 2 global selon les cellules (contribution des cellules)

Exercice Étude de Butler sur la poésie de Sylvia Plath: distribution des longueurs de mots dans 2 de ses recueils Lgr mots 1 – 3 4 – 6 7 – 9 10 -12 >12 « The Colossus » 3473 3743 1272 285 54 « Winter trees » 3000 2674 753 165 18

Exercice Quelle est H0? Quels sont les résultats?

Rappel! Quel test utiliser? Il faut connaître: Le type de distribution: test paramétrique ou non paramétrique? Le nombre de variables et le nombre de leurs modalités Le type de données: fréquences, mesures? Ce qu’on veut étudier!

1. Tester les différences entre groupes Groupes indépendants : ce ne sont pas les mêmes sujets! Paramétrique 1 variable nominale à 2 modalités; mesures : test-t indépendant (test-t univarié: moyenne théorique) 1 variable nominale à 3 ou + modalités, mesures: ANOVA à 1 facteur à n niveaux

1. Tester les différences entre groupes Paramétriques (suite): 2 variables nominales: ANOVA à 2 facteurs Non paramétriques: 1 variable nominale à 2 modalités; mesures: test U de Mann-Whitney 1 variable nominale à 3 ou + modalités, mesures: test des rangs de Kruskal-Wallis

2. Tester les différences entre variables Mêmes sujets, mais conditions différentes Paramétriques: 1 variable continue (mesures), 1 variable indépendante (à 2 modalités = 2 conditions): test-t apparié 1 variable continue (mesures), 1 variable indépendante (à 3 ou + modalités = 3 ou + conditions): ANOVA à mesures répétées

2. Tester les différences entre variables Non paramétriques: Mesures, 1 variable indépendante (à 2 modalités = 2 conditions): test des rangs de Wilcoxon Fréquences / effectifs, 1 variable indépendante aux modalités dichotomiques: Chi 2

2. Tester les différences entre variables Non paramétriques (suite) 1 variable continue (mesures), 1 variable indépendante (à 3 ou + modalités = 3 ou + conditions): test de Friedman

3. Tester les relations entre variables Paramétriques: corrélation de Pearson Non paramétriques: corrélation des rangs de Spearman ou Chi 2 (fréquences / effectifs et variable à modalités catégorielles)