La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

1 Dominique Muller Laboratoire Inter-universitaire de Psychologie Bureau : 238 Tel : 04 76 82 58 90

Présentations similaires


Présentation au sujet: "1 Dominique Muller Laboratoire Inter-universitaire de Psychologie Bureau : 238 Tel : 04 76 82 58 90"— Transcription de la présentation:

1 1 Dominique Muller Laboratoire Inter-universitaire de Psychologie Bureau : 238 Tel :

2 2 Modèle contraint (MC) Modèle augmenté (MA) Comparaison de modèles : test de b 1 pour un modèle à un facteur continu

3 3 Modèles à un facteur continu : régression simple b 1 = 1.83, laugmentation de 1.83 du pourcentage de bonnes réponses pour chaque augmentation dun point de BEPC est significative Connaître la note au BEPC permet de prédire le pourcentage de bonnes rép.

4 4 Formalisation (1) Y : le critère, la mesure ou VD Y i : valeur observée pour lobservation i sur la variable Y X 1 et X 2 : premier et second prédicteurs ou VIs (peuvent être manipulés ou mesurés) X i1 et X i2 : valeurs de X 1 et X 2 pour lobservation i : paramètres DANS LA POPULATION permettant de réduire les erreurs de prédiction lorsque les prédicteurs X 1 et X 2 sont utilisés (sous une forme donnée) : erreur de prédiction pour lobservation i lorsque X 1 et X 2 sont utilisées comme prédicteurs et si les VRAIS paramètres étaient connus VARIABLES : PARAMETRES et ERREUR (ne pourront être questimés) :

5 5 e i : erreur de prédiction pour lobservation i lorsque X1 et X2 sont utilisés comme prédicteurs et que b 0, b 1 et b 2 sont utilisés comme estimateurs Formalisation (2) Y i, X i1 et X i2 : leurs sens restent inchangés b 0, b 1 et b 2 : estimations respectives de sur la base de ces données : prédiction pour lobservation i sur la base de b 0, b 1 et b 2 et des valeurs de X1 et X2 B 0 : valeur fixée A PRIORI (ni valeur dans la population, ni estimée sur la base des données)

6 6 Formalisation (3) : résumé Lettres grecques : valeurs dans la population (à moins de pouvoir mesurer lensemble de la population, nous ne pourrons que les estimer) Lettres minuscules : estimations des valeurs que lon observerait dans la population Lettres majuscules : variables (ex : Y, X 1 ) ou valeurs fixées a priori (ex : B 0 )

7 7 Mesure (Y ou VD) : pourcentage de bonnes réponses à un test de connaissance (50 questions de math en vrai/faux) Prédicteur (X ou VI) : Présence dAutrui (1) vs Seul (2) ; participants assignés aléatoirement au sein des deux conditions Variables catégorielles (k = 2) : test t échantillons indépendants / ANOVA à un facteur Commençons par le modèle simple (même prédiction pour toutes les observations) Là encore la valeur b 0 correspondra à la moyenne de Prc (Y)

8 8 Faire mieux avec un modèle plus complexe ? M PA M Seul Peut-on améliorer notre modèle en ajustant nos prédictions selon les valeurs de X (Présence dAutrui) ? Ajouter PA dans la partie modèle de léquation nous permet dajuster la prédiction en fonction des conditions (i.e., permettre à la pente dêtre différente de 0) Pour le savoir, ajout de PA dans notre modèle :

9 9 Interprétation des coefficients de régression Interprétation du b 0 : ordonné à lorigine, cest-à-dire la prédiction pour une valeur de PA = 0 Dans notre exemple, b 0 = 30 donc pour les gens ayant un score de 0 sur la variable PA le modèle prédit un pourcentage derreurs de 30 Interprétation du b 1 : il sagit de la pente => de combien change la prédiction sur Prc lorsque lon change dune unité sur PA ici : Prédiction pour PA = 1 => Prédiction pour PA = 2 => Ainsi, avec une seule unité de différence entre les deux conditions (PA=1 et Seul=2), b 1 = différence de moyennes Or, 36 et 42 sont en effet les moyennes des deux conditions

10 10 Comparaison de modèles : test dun modèle à un facteur catégoriel Modèle contraint (MC) Modèle augmenté (MA) Tester cette comp. de modèles revient donc à tester

11 11 ANOVA un facteur : calcul des SCE

12 12 Modèles ANOVA à un facteur (k =2) Lorsque lon passe de la condition de présence dautrui (1) à la condition seul (2) le taux de bonnes réponses augmente de 6 points : Nous observons donc un effet dinhibition sociale mais il est non-significatif

13 13 PAc Code de contrastes Code de contrastes, règle 1 : Avecle code attribué à chaque groupe Et k, les k groupes -1 / 1 est donc un code de contraste (mais aussi / 0.5…)

14 14 PAc Code de contrastes Divise simplement la pente par deux, car il y a maintenant deux unités de différence entre PA (-1) et Seul (1) Afin dobtenir directement la différence de moyennes, on préférera un codage -0.5 / 0.5

15 15 Dummy coding PAd b 0 est toujours la prédiction pour PA = 0 Or, avec ce nouveau codage, cette prédiction correspond à la condition PA Le test de b 0 sera donc le test de la moyenne de PA contre 0 MC : MA : vs.

16 16 Afin dutiliser la méthode des moindres carrés (test t, ANOVA, ANCOVA…) plusieurs règles doivent être respectées Ces règles portent sur la distribution des résidus (aucune règle concernant la distribution des prédicteurs), cest-à-dire les Ces résidus doivent être : distribués normalement avoir une variance constante être indépendants les uns des autres * * *** Règles dapplication de la méthode des moindres carrés

17 17 Afin dutiliser la méthode des moindres carrés (test t, ANOVA, ANCOVA…) plusieurs règles doivent être respectées Ces règles portent sur la distribution des résidus (aucune règle concernant la distribution des prédicteurs), cest-à-dire les Ces résidus doivent être : distribués normalement avoir une variance constante être indépendants les uns des autres * * *** Règles dapplication de la méthode des moindres carrés

18 18 Distribution des résidus Performance en fonction de la taille

19 19 Distribution des résidus « Histogramme » des résidus

20 20 Distribution des résidus « Histogramme » des résidus Bonne nouvelle : => Toutes les violations de la normalité ne sont pas graves

21 21 Ce qui est important par rapport à la normalité La distribution uniforme, un problème ? Moins un problème ?

22 22 Tous les votes ne naissent pas égaux

23 23 Ce qui est important par rapport à la normalité La distribution uniforme, un problème ? Moins un problème ? Les violations par rapport à la normalité ne sont problématiques que pour les extrémités Comment savoir si cest le cas ?

24 24 Diagramme des quantiles - quantiles Les observations sur la droite suivent la loi normale Problème (ici) si les observations extrêmes aplatissent la droite : En dessous de la droite en haut En dessus de la droite en bas

25 25 Afin dutiliser la méthode des moindres carrés (test t, ANOVA, ANCOVA…) plusieurs règles doivent être respectées Ces règles portent sur la distribution des résidus (aucune règle concernant la distribution des prédicteurs), cest-à-dire les Ces résidus doivent être : distribués normalement avoir une variance constante être indépendants les uns des autres * * *** Règles dapplication de la méthode des moindres carrés

26 26 Performance en fonction de la taille Variance constante des résidus

27 27 Variance constante des résidus

28 28 Variance constante des résidus Distribution problématique : en entonnoir

29 29 Variance constante des résidus : autre représentation Il nous suffit maintenant de regarder sil existe une relation entre les deux variables

30 30 Règles dapplication de la méthode des moindres carrés Afin dutiliser la méthode des moindres carrés (test t, ANOVA, ANCOVA…) plusieurs règles doivent être respectées Ces règles portent sur la distribution des résidus (aucune règle concernant la distribution des prédicteurs), cest-à-dire les Ces résidus doivent être : distribués normalement avoir une variance constante être indépendants les uns des autres * * ***

31 31 Effet de lhabitat sur la satisfaction dans le couple : présentation des résidus (e i ) On voit clairement ici que les résidus ne sont pas indépendants à lintérieur des couples

32 32 Remèdes Si les résidus ne sont pas (ou nont pas) : distribués normalement une variance constante indépendants les uns des autres => Transformations => Tests non-paramètriques (dernier recours) => Tests non-paramètriques => Jouer sur le nombre dobservations => Tests paramètriques type Welch

33 33 Type derreurs Erreur de Type I : rejeter H 0 à tord (nous disons quun effet existe alors quil nexiste pas) Erreur de Type II : ne pas rejeter H 0 à tord (un effet existe mais nous ne le voyons pas)

34 34 Hétérogénéité des variances et nombre de sujets par condition (Tomarken & Serlin, 1986) Nombre de sujets par condition et variance sont liés positivement => augmentation des erreurs de Type II Nombre de sujets par condition et variance sont liés négativement => augmentation des erreurs de Type I Nombre de sujets par condition et variance sont indépendants (même nombre de sujets par condition) => très faible augmentation des erreurs de Type I Se ramener au même nombre de sujets par condition permet de diminuer les risques

35 35 Remèdes Si les résidus ne sont pas (ou nont pas) : distribués normalement une variance constante indépendants les uns des autres => Transformations => Tests non-paramètriques (dernier recours) => Tests non-paramètriques => Jouer sur le nombre dobservations => Autres types de tests => Tests paramètriques type Welch

36 36 Types de problèmes et types de transformations Transformer les données pour atteindre la normalité –Pour les distributions « plates » : inverse (1/Y) –Pour les distributions « asymétriques + » : log ou inverse –Pour les distributions « asymétriques - » : racine carré Transformer les données pour atteindre une variance constante des résidus (homoscédasticité) –Cône des résidus ouvert à droite : inverse –Cône des résidus ouvert à gauche : racine carré


Télécharger ppt "1 Dominique Muller Laboratoire Inter-universitaire de Psychologie Bureau : 238 Tel : 04 76 82 58 90"

Présentations similaires


Annonces Google