Analyse factorielle de variance: Principes d’expérimentation

Slides:



Advertisements
Présentations similaires
Test statistique : principe
Advertisements

Les tests d’hypothèses (II)
Les tests d’hypothèses (I)
C1 Bio-statistiques F. KOHLER
Comparaison de deux pourcentages observés
Comparaison de plusieurs moyennes observées
Tests non paramétriques
Tests de comparaison de pourcentages
Analyse de la variance à un facteur
Vérification des données
1 Statistiques Séance 5 – 9 Nov Résumé séance précédente Lécart-type σ ou s. Comment le calculer? Les propriétés numériques de la courbe normale.
Tests de comparaison de moyennes
Autres LOIS de PROBABILITES
Les liens entre les variables et les tests d’hypothèse
Plans à groupes indépendants: organisation
Statistiques Séance 9 – 6 décembre 2005 N. Yamaguchi.
L’inférence statistique
Analyse de la variance : ANOVA à un facteur
Régression linéaire simple
Objectifs du chapitre 12: Interprétation des résultats
Problème Autre formulation :
L’Analyse de Variance 1 Généralités Le modèle Calculs pratiques
Une observation par cellule facteurs fixes versus facteurs aléatoires.
Analyse de variance multifactorielle
L’analyse de variance factorielle
La corrélation et la régression multiple
Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte.
Le test t.
L’analyse de variance.
La puissance statistique
La puissance statistique
La corrélation et la régression
Les modèles linéaires (Generalized Linear Models, GLM)
Analyse de variance à un critère de classification (ANOVA)
Corrélation Principe fondamental d’une analyse de corrélation
Comparaison de deux échantillons
Test de signification d’une ANOVA à deux critères de classification: sans réplication, modèle I, plan factoriel Tester CMeffet sur CMerreur... … mais,
ANOVA à critères multiples
Expériences contrôlées Rappel du cours d’IHM
Comparaisons multiples
Objectifs du chap. 5: Plans de recherche classiques Savoir identifier et distinguer les modes de comparaison des mesures Savoir identifier et distinguer.
Les analyses multivariées
Objectifs du chap. 5: Plans de recherche classiques
Objectifs du chap. 5: Plans de recherche classiques Savoir identifier et distinguer les modes de comparaison des mesures Savoir identifier et distinguer.
Comparaisons multiples
La régression multiple
Méthodes de Biostatistique
ANALYSE DE DONNEES TESTS D’ASSOCIATION
Cédric LAOUENAN 20/11/2008 Tests statistiques Cédric LAOUENAN 20/11/2008
Lien entre deux variables
Howell Chap. 11: ANOVA. Du monde connu au monde inconnu Du test t à l’analyse de varianceDu test t à l’analyse de variance Trouvez des nouveaux noms pour.
N. Yamaguchi1 Statistiques Séance 6 – 16 Nov 2005.
M2 Sciences des Procédés - Sciences des Aliments
Séance 8 30 novembre 2005 N. Yamaguchi
ANOVA à 1 facteur en groupes de mesure indépendants
BIO 4518: Biostatistiques appliquées Les 11 et 18 octobre 2005 Laboratoire 4 et 5 ANOVA à critères multiples.
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
L’erreur standard et les principes fondamentaux du test de t
ATELIERS STATISTIQUES
Test de signification d’une ANOVA à deux critères de classification: sans réplication, modèle I, plan factoriel Tester CMeffet sur CMerreur... … mais,
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :36 1 Tableaux de contingence et modèles log-
Chapitre 4 Concepts fondamentaux Les composantes d’un test statistique Les hypothèses nulles en statistiques Le sens de p Inférence: comment traduire p.
Comparaison de plusieurs moyennes observées
Introduction aux statistiques Intervalles de confiance
Corrélation et régression linéaire Mars Modèles de régression  Réponses aux questions du type: ‘Quelle est la nature de la relation entre les variables?’
Notions de statistiques et d’analyse de données Master 1 MGS – Sarah MISCHLER –
Chap. III Statistiques inférentielles
Rappel (3): les étapes des tests statistiques
Transcription de la présentation:

Analyse factorielle de variance: Principes d’expérimentation

Plans à groupes indépendants: organisation Organisation factorielle: 2 variables et plus produit cartésien des niveaux Quand dans une étude, on veut manipuler 2 variables indépendantes ou plus, il faut faire le produit cartésien de leurs niveaux. Le produit cartésien consiste à faire le croisement de deux ensembles de telles sorte que chaque élément d’un ensemble est représenté en combinaison avec chacun des éléments de l’autre ensemble. Ce croisement se représente soit par un arbre, soit par un tableau (en voici un exemple). Les schèmes vont porter le nom de leur niveaux ainsi multipliés: 2 x 2.

liste Dro- gue mot con. 10 abs. 100 20 Voici un produit cartésien représenté en arborescence L’expérience représentée ici est plus complexe que la précédente: trois facteurs (variables indépendantes) sont mis en jeu. Quel est le nom de ce type de schème? (2 x 2 x 2).

Plans factoriels à groupes indépendants: notion particulière Effet principal effet spécifique de la variable indépendante différence globale entre ses niveaux Effet d’interaction dépendance de l’effet d’une variable indépendante par rapport à une autre l’effet d’une variable indépendante n’est pas le même à tous les niveaux de l’autre variable indépendante Or, les produits cartésiens ont une conséquence très particulière: assure l’indépendance des facteurs par le truchement de la multiplication exhaustive des niveaux (probabilité égale d’appariation dans la situation) Statistiquement ceci permet de dégager deux types d’effet

Graphique d’un effet principal v.d. v.i. 1 v.i. 2 TRIANGLES > RONDS 2 > 1 pour var. indép. 1

Graphique d’un effet d’interaction v.d. Ici, la situation est différente. Les triangles de la V.I. 2 ne sont pas toujours supérieurs aux ronds. Ce qui se passe pour les niveaux de la v.i. 1 n’est pas clair aussi. v.i. 1 v.i. 2

Rappel (1) Laquelle des 2? Permutations: assemblement d’objets quand la séquence d’assemblage fait une différence Combinaisons: assemblement d’objets quand la séquence d’assemblage ne fait pas de différence Il nous faudra prévoir le nombre d’interactions lors de la conception d’une expérience. Pour ce faire, la statistique nous donne un outil, lequel? COMBINAISONS On peut aussi très bien s’en tirer en dessinant méthodiquement notre tableau

Limite des plans factoriels: multiplication des facteurs Si pour 2 facteurs, il y a 1 interaction; pour 3 facteurs, il y a 4 interactions; pour 4 facteurs, il y a 11 interactions; pour 5 facteurs, il y a 26 interactions. pour X …, … EXEMPLE de la diapo précédente

Rappel (2) Au début de tout se trouve la variance, COMMENT RETROUVE-T-ON LES EFFETS (PRINCIPAUX ET D’INTERACTION) DANS UNE SITUATION EXPÉRIMENTALE (OÙ IL Y A UN PRODUIT CARTÉSIEN DES NIVEAUX DES FACTEURS)? PAR L’ANALYSE DE VARIANCE!!! Ce qui nous force à faire un petit retour en arrière côté statistique: La variance est l’éloignement d’une mesure (Xi) par rapport à sa tendance centrale (M) soit l’éloignement d’une mesure (Xi) par rapport à sa tendance centrale ( )

Rappel (3) Cette variance sera décomposée en deux sources de variance, chacune décomposable. Quand nous ferons une analyse de variance, nous disséquerons la variance de la variable dépendante selon les dimensions représentées dans le tableau du produit cartésien des niveaux des facteurs. Nous chercherons donc des effets principaux et des effets d’interaction. En premier, la première dissection nous donnera deux morceaux là où il y en avait un seul Une cote totale (brute) = effet + erreur Variance totale = variance associée aux traitements + variance d’erreur Dont les noms sont changés pour Somme des Carrés Qréflexion: lequel des deux morceaux aimerions-nous avoir plus gros? Une nouvelle notation sera utilisée

Analyse factorielle de variance: Principes statistiques (1) Après avoir décomposer la Somme de Carrés Totale Nous allons décomposer la somme de carrés du traitement selon les éléments du produit cartésien de notre expérience Changement de terminologie cellules N.B.: traitement s’appelle maintenant cellules dans Howell

Analyse factorielle de variance: Principes statistiques (2) 2 soustractions De plus, étant donné ces décompositions, certaines SC s’obtiennent par soustraction, ce qui peut faciliter nos calculs Il en va ainsi de l’erreur et de l’interaction.

Calcul de l’analyse de variance: les sommes de carré (1)  

Calcul de l’analyse de variance: les sommes de carré (2)  

Calcul de l’analyse de variance: effet de l’interaction Rappel Interprétation d’une interaction significative graphique comparaisons multiples calculs d’effet simple d’une variable indépendante aux niveaux de l’autre variable indépendante

Comparaison des variances: le rapport F ON FAIT TOUS CES CALCULS POUR ARRIVER À UN RAPPORT F qui compare une variance d’effet à une variance d’erreur l’erreur est attribuée aux différences entre les personnes (sujets, individus) composant l’échantillon (revoir la question de réflexion) Qréflexion: quelle sera la valeur de F si CMt = CMe où k-1 et N-k sont les dl du rapport F

Calcul de l’analyse de variance: des sommes de carré aux carrés moyens    

Analyse factorielle de variance: Principes statistiques (3) les degrés de liberté (dl)

Analyse factorielle de variance: Principes statistiques (4) les carrés moyens (CM) chaque carré moyen s’obtient par la division de sa SC par son dl Le test F est un rapport de variance, soit le carré moyen d’un traitement divisé par le carré moyen d’erreur

Rappel (4): les étapes des tests statistiques Formulation de l’hypothèse nulle et de l’hypothèse alternative Sélection d’un test et du seuil alpha Détermination des dl et de la valeur critère Calcul Décision eu égard à l’hypothèse nulle Formulation d’une conclusion

Un exemple de calcul I. Lettré, une chercheure de réputation internationale, présente des mots simples de type CVC (ex.: bol) en lettrage conventionnel ou en italique en des temps d’exposition courts et très courts. Elle enregistre le nombre d’erreurs d’identification de mots faites par 20 participants et participantes

Le Tableau d’analyse de variance

Trois hypothèses (1) Hypothèse nulle # 1: Il n’y aura pas plus d’erreurs dans un type de lettrage que dans l’autre Hypothèse alternative # 1: Il y aura plus d’erreurs avec le lettrage en italique qu’avec le lettrage normal Fcritère (1, 16)= Hypothèse nulle # 2: Il y aura autant d’erreurs au temps d’exposition court qu’au temps d’exposition très court Hypothèse alternative # 2: Il y aura plus d’erreurs au temps d’exposition très court qu’au temps d’exposition court Fcritère (1, 16)=

Trois hypothèses (2) Hypothèse nulle # 3: Il y aura autant d’erreurs dans chacune des quatre conditions du plan factoriel composé par le type de lettrage et la durée du temps d’exposition Hypothèse alternative # 3: Il y aura plus d’erreurs dans une des quatre conditions du plan factoriel composé par le type de lettrage et la durée du temps d’exposition Fcritère (1, 16)=

Les sommes de carré dans le calcul de l’analyse de variance: rappel  

Calcul de l’analyse de variance: les sommes de carré (1)

Nous n e pouvons pas nous satisfaire de SCtraitement pour les fins de notre analyse. Pourquoi? Constituons un tableau représentant toutes nos conditions, Ici nous avons 2 effets principaux et une interaction. Pour la décomposition de SCtraitement nous aurons donc besoin d’un seul tableau. Pour tout autre schème, le nombre de tableaux est fonction du nombre d’interactions et d’autant de calculs.

Calcul de l’analyse de variance: les sommes de carré (2)  

Le tableau d’analyse de variance Les dl aussi Les SC s’additionnent La colonne Source de variation identifie les facteurs du schème de recherche Les CM s’obtiennent par division des SC et dl appropriés Plus petit que .05 signifie rejet de l’hypothèse nulle, plus grand son acceptation L’APA exige maintenant une nouvelle colonne pour 2 ou 2 SPSS identifie d’autres sources de variation qu’il faut omettre du tableau dans le rapport Le total représente la variance totale de la variable dépendante Le rapport F compare un effet (CM) de traitement avec le CM de l’erreur

Deux indices de la taille de l’effet

Présentation des résultats de l’analyse de variance en style APA Tableau, voir manuel p. 129 Texte, voir p. 117 exemple: Les participants font plus d’erreurs (M=10,0) quand ils voient les lettres pour un court laps de temps que pour une durée de présentation plus longue (M=7,0), F (1, 16) = 18.00, p < .05, h2 = 0.21. 6e éd.

Un autre exemple de calcul Un schème à groupes indépendants (intersujets) 2 x 2 x 3.

Les données A1 A2 B1 B2 C1 C2 C3 4 23 16 21 25 32 6 2 20 11 17 18 15 27 14 33 42 7 8 19 30 46 13 10 26 40 12 72 80 108 160 28 60 62 70

Les carrés des valeurs Grand total 19080

Calculs des totaux des effets principaux de A, B, et C Grand total 830 A1 = 540 A2 = 290 B1 = 310 B2 = 520 C1 = 40 + 80 + 30 + 40 = 190 C2 = 72 + 108 + 28 + 62 = 270 C3 = 80 + 160 + 60 + 70 = 370

Trouvez comment le tableau a été construit

Le tableau de l’interaction triple est la retranscription des totaux du tableau de départ   SCAxBxC = SCtraitement - SCA – SCB - SCc - SCAxB – SCBxC - SCAxC = 3766.9 – 1302.08 – 918.75 – 1016.67 –216.75 – 50 – 116.67 = 146

Cette interaction est significative parce que la différence entre les niveaux de A (540 à 290) n’est pas la même à chaque niveau de B (192 à 118 pour B1 versus 348 à 172 pour B2) ou la différence entre les niveaux de B (310 à 520) n’est pas la même à chaque niveau de A (192 à 348 pour A1 versus 118 à 172 pour A2)

Cette interaction n’est pas significative parce que la différence entre les niveaux de B (310 à 520) est semblable à chaque niveau de C (70 à 120 pour C1 vs 100 à 170 pour C2 vs 140 à 230 pour C3) ou la différence entre les niveaux de C (190 à 270 à 370) est semblable à chaque niveau de B (70 à 100 à 140 pour B1 versus 120 à 170 à 230 pour B2)

Source de variation SC dl CM F p

Au-delà de l’analyse factorielle de variance Comparaisons multiples: du test t aux autres Schèmes à mesures répétées - considérer l’erreur comme juchée dans les facteurs intersujets - dl = (n-1)x(ab…)