La modélisation en psychologie: à quoi bon? Robert M. French L.E.A.D. – CNRS U. de Bourgogne
Qu’entendons-nous par un “modèle”? Une réponse possible : La réduction à l’essentiel d’un phénomène en vue de l’expliquer
Un bon modèle doit Reproduire, au moins qualitativement, les données empiriques qu’il modélise Expliquer les données. Faire des prédictions au delà des ces données Indiquer clairement son contexte d’utilisation. Être capable d’être sondé pour comprendre comment les mécanismes mis en oeuvre donnent lieu aux phénomènes modélisés et pour rendre compte des limites du modèle Etre falsifiable (c.-à-d., Peut être infirmer) .
Commençons par quelques exemples où nos théories/modèles nous induisent en erreur Théorie/Modèle du Monde Supposons que l’expérience montre qu’un événement A est aussi fréquent qu’un événement B. Mais depuis un moment on ne voit que l’événement A, ce qui fait que l’événement B doit « rattraper » A. Donc, la probabilité de voir B est plus élevée que A jusqu’à ce que l’équilibre soit retrouvé. Par exemple, nous jetons une pièce de monnaie (non biaisée). Nous voyons la suite suivante: ? P F P P F P P F F F P P F P P F P P F F F P P P F P P F P P F F F P P F P F P P F P P F F P F P P F P P F F F P P F P F F F F F P F P P F P P F F F P P F P P F P P P F P P F P P F P F P P F P P F F F P P F P F P F P P F P P F P P F P P P F P P F P F P P F P P F P P F P P F F F P P F P F F F F F F F P F P P F P P F F F P F P P F P P F F F P P F P F F P F P P F P P F F F P P F P F F F P F P P F P P F F F P P F P F F F F F F P F P P F P P F F F P P F P F F F F Réponse: P = ½, F = ½
Un peu plus compliqué… chèvre chèvre voiture
Le présentateur d’une émission à la télé met les deux chèvres et la voiture derrière trois portes. 1 2 3 Il choisit un spectateur et lui explique qu’il y une chèvre derrière deux des trois portes et une voiture derrière la troisième. Il l’invite à choisir une porte.
Le spectateur choisit au hasard la troisième porte. 1 2 3
1 3 2 Le spectateur choisit au hasard la troisième porte. Le présentateur ouvre alors l’une des deux autres portes, derrière laquelle il y a une chèvre
? 1 3 2 Il demande au spectateur s’il veut changer de porte ou rester avec son premier choix. Que doit-il faire?
? 1 3 2 Il demande au spectateur s’il veut changer de porte ou rester avec son premier choix. Que doit-il faire?
Notre théorie/modèle du monde: Lorsqu’on est confronté aux options dont on ignore l’issu, on choisit au hasard Est en conflit avec la réalité empirique, car ON DOIT CHANGER DE PORTE!
Modèle probabiliste du basket: le « hot hand » est une illusion. Thomas Gilovich, Robert Vallone, et Amos Tversky ont suivi de près durant la saison 1980-1981 les pourcentages de réussite aux tirs au panier des joueurs d’une équipe de basket professionnels (Philadelphia 76ers)*. *Gilovich et al. (1985). The Hot Hand in Basketball. On the Misinterpretation of Random Sequences. Cognitive Psychology, 17, 295-314.
Le modèle de Gilovich, Vallone et Tversky: Statistiquement, il s’est avéré que chaque tir est un événement indépendant et donc la performance d’un joueur peut donc être modélisé par une pièce de monnaie biaisée de façon à ce que le pourcentage de « piles » corresponde au pourcentage global de réussite au tir au panier du joueur en question. Selon leur modèle le « hot hand » est, purement et simplement, une illusion.
1 = réussi; 0 = raté Bof! L’échauffement, quoi… 0 1 1 0 1 1 1 0 1 1 0 1 0 0 0 0 0 1 1 0 0 0 1 1 1 1 0 0 1 1 1 1 0 0 1 0 0 0 1 0 0 1 0 0 1 1 0 0 0 0 1 0 0 0 1 1 1 1 1 1 0 1 1 1 1 1 1 1 0 0 1 0 0 0 1 0 0 0 1 0 1 1 0 0 1 1 1 1 1 0 0 0… PASSE-MOI LA BALLE!! Pourcentage de tirs réussis: 55% Simulé parfaitement par une pièce de monnaie légèrement biaisée (0.55/0.45) et la voix d’un joueur….
Quelques réactions “Il y a tellement de variables qui entrent en jeu dans un tir au panier qu’une étude comme celle-ci n’a pas de sens.” (entraineur des Hoosiers d’Indiana University) “C’est qui ce type? Il a fait une étude, et alors? Je m’en fous complètement.” (propriétaire des Boston Celtics) “On a fait du sport, toi et moi, et tu sais aussi bien que moi que ce modèle est idiot. C’est à toi de me dire pourquoi c’est faux, et non pas à moi de l’accepter.” (mon frère)
Considérons nos critères d’un bon modèle Reproduire, au moins qualitativement, les données empiriques qu’il modélise Expliquer les données. Faire des prédictions au delà des ces données Indiquer clairement son contexte d’utilisation. Être capable d’être sondé pour comprendre comment les mécanismes mis en oeuvre donnent lieu aux phénomènes modélisés et pour rendre compte des limites du modèle NON Peut être infirmer.
Les modèles et la prédiction La Pythie, oracle de Delphi Un tremblement de terre rasera Athènes dans 8 jours. Les oiseaux migrateurs partiront en Afrique un mois plus tard cette année Les taches solaires commenceront dès le mois de juillet 2007.
La prédiction ne suffit pas! Boîte noire: les outils statistiques La NASDAQ prendra 230 points demain.. Les oiseaux migrateurs partiront en Afrique un mois plus tard cette année Les taches solaires commenceront dès le mois de juillet 2007. La Boîte Noire n’a aucun pouvoir explicatif et donc ne peut pas être considérée comme un modèle.
Le chant du coq Reproduire, au moins qualitativement, les données empiriques qu’il modélise Expliquer ces données. Faire des prédictions au delà des ces données Indiquer clairement son contexte d’utilisation. Être capable d’être sondé pour comprendre comment les mécanismes mis en oeuvre donnent lieu à des phénomènes modélisés et pour rendre compte des limites du modèle Peut être infirmer.
Indiquer clairement son contexte d’utilisation. Prêtons un peu plus d’attention aux trois points suivants Indiquer clairement son contexte d’utilisation. Être capable d’être sondé pour comprendre comment les mécanismes mis en oeuvre donnent lieu à des phénomènes modélisés et pour rendre compte des limites du modèle Etre capable d’être infirmer.
Indiquer clairement son contexte d’utilisation. Sans cela, tout modèle est faux. On peut toujours trouver un niveau où le modèle ne marchera plus. Les critiques des modèles en neurosciences sont souvent de cet ordre. Un exemple: pour un certain niveau d’explication l’Intelligence Artificielle « symbolique » où on découpe le monde en objets reliés par une grammaire est parfaitement suffisant, mais il faut que ce niveau d’application soit précisé dès le départ
Sans cela, on ne peut pas avoir cette interaction permanente avec les données empiriques qui nous permet d’améliorer notre modèle. Être capable d’être sondé pour comprendre comment les mécanismes mis en oeuvre donnent lieu aux phénomènes modélisés et pour rendre compte des limites du modèle
Peut être infirmer L’astrologie La « psychologie » freudienne La mythologie grecque/hindoue/etc. Toutes impossible à infirmer ! Peut être infirmer
(l’ impossibilité d’infirmer) L’infalsifiabilité (l’ impossibilité d’infirmer) L’interaction entre modèle et données empiriques est nécessaire MAIS Il peut mener – et mène trop souvent -- à l’infalsifiabilité
Le fléau de la modélisation en psychologie La Boxologie: Le fléau de la modélisation en psychologie
Données Modèle de empiriques départ contradictoires Module phonologique Données empiriques contradictoires
Données Modèle de empiriques départ contradictoires Module phonologique Données empiriques contradictoires
Nouvelles données empiriques contradictoires Modèle de départ Module phonologique
Nouvelles données empiriques contradictoires Modèle de départ Module phonologique Module pré-linguistique
Nouvelles données empiriques contradictoires Modèle de départ Module phonologique Module pré-linguistique Nouvelles données empiriques contradictoires
Nouvelles données empiriques contradictoires Module visuo-gustatif Modèle de départ Module phonologique pré-linguistique Nouvelles données empiriques contradictoires
Mais le problème est que cela peut mener à la maladie qu’on pourrait appeler « la boxologie rampante »…
Modèle de départ
…. et de nouveau, on n’y comprend rien ….et de nouveau, on n’y comprend rien. Le modèle a perdu son pouvoir explicatif.
Nos critères d’évaluation Reproduire, au moins qualitativement, les données empiriques qu’il modélise « Expliquer » ces données. ??? Faire des prédictions au delà des ces données NON Indiquer clairement son contexte d’utilisation. NON Être capable d’être sondé pour comprendre comment les mécanismes mis en oeuvre donnent lieu aux phénomènes modélisés et pour rendre compte des limites du modèle Peut être infirmer NON
La psychologie évolutionnaire Infirmable ou pas?? A l’état actuel de cette discipline, la réponse est plutôt Non….
Les modèles connexionnistes
Que boivent les vaches? Le connexionnisme (“bottom-up”) LAIT BOIRE Ces neurones sont activés même si le mot “lait” n’a pas été prononcé.
Que boivent les vaches? IA symbolique (“top-down”) Conclusion: ISA(vache, mammifère) ISA(mammifère, animal) Règle 1: SI animal(X) ET soif(X) ALORS manque_eau(X) Règle 2: SI manque_eau(X) ALORS boire_eau(X) Conclusion: Les vaches boivent de l’eau.
Un bon modèle de l’intelligence humaine doit pouvoir donner les deux réponses, selon le contexte dans lequel il se trouve.
Un modèle connexionniste de la catégorisation chez les enfants en bas âge
Phase de Familiarisation Infant
Infant
Infant
Infant
Infant
Infant
Phase de test Comparaison du temps de regard Infant
Une asymétrie surprenante Familiarisés avec des chats, les enfants regardent plus longtemps le chien en phase de test. Familiarisés avec des chiens, ils NE REGARDENT PAS plus longtemps le chat en phase de test.
Modèle de Sokolov, Charlesworth, Cohen, etc. Encoder Stimulus de l’environnement
Decoder et Comparer Encoder égal? Stimulus de l’environnement
Decoder et Compare Adjuster Encoder Stimulus de l’environnement
Decoder et Comparer Adjuster Encoder Stimulus de l’environnement
Decoder et Comparer Adjuster Encoder equal? Stimulus de l’environnement
Decoder et Comparer Adjuster Encoder Stimulus de l’environnement
Decoder et Comparer Adjuster Encoder Stimulus de l’environnement
Decoder et Comparer Adjuster Encoder equal? Stimulus de l’environnement
Decoder et Comparer Adjuster Encoder Stimulus de l’environnement
Decoder et Comparer Adjuster Encoder Stimulus de l’environnement
On continue la boucle… …jusqu’à ce que la représentation interne corresponde suffisamment bien au stimulus externe.
Un modèle connexionniste basé sur le modèle de Sokolov Stimulus de l’environnement
encoder Stimulus de l’environnement
decoder encode Stimulus de l’environnement
decode comparer encode Stimulus de l’environnement
decode adjuster poids encode Stimulus de l’environnement
decoder encoder Stimulus de l’environnement
decoder encoder Stimulus de l’environnement
decoder encoder Stimulus de l’environnement
decoder comparer encoder Stimulus de l’environnement
decode adjuster poids encode Stimulus de l’environnement
decode encode Stimulus de l’environnement
decoder encoder Stimulus de l’environnement
decoder encoder Stimulus de l’environnement
decode comparer encode Stimulus from the environment
decode adjuster poids encode Stimulus from the environment
On continue la boucle… …jusqu’à ce que la représentation interne corresponde suffisamment bien au stimulus externe.
Résultats, prédictions, explications
1 2
Nos critères d’évaluation Reproduire, au moins qualitativement, les données empiriques qu’il modélise
Nos critères d’évaluation Expliquer ces données : réseau de neurones du modèle de Sokolov.
Prédictions et résultats: l’inversion de l’asymétrie Prédiction du modèle Données empiriques chez l’enfant
Prédictions et résultats: le retour à la symétrie Prédiction du modèle Données empiriques chez l’enfant
Nos critères d’évaluation Faire des prédictions au delà des ces données
Nos critères d’évaluation Indiquer clairement son contexte d’utilisation. Être capable d’être sondé pour comprendre comment les mécanismes mis en oeuvre donnent lieu à des phénomènes modélisés et pour rendre compte des limites du modèle Peut être infirmer.
Elman’s solution (1990) The Simple Recurrent Network Output units Hidden units copy Input units Context units
SRN Bilingual language learning (French, 1998; French & Jacquet, 2004) Input to the SRN: - Two “micro” languages, Alpha & Beta, 12 words each An SVO grammar for each language - Unpredictable language switching Attempted Prediction BOY LIFTS TOY MAN SEES PEN GIRL PUSHES BALL BOY PUSHES BOOK FEMME SOULEVE STYLO FILLE PREND STYLO GARÇON TOUCHE LIVRE FEMME POUSSE BALLON FILLE SOULEVE JOUET WOMAN PUSHES TOY.... (Note: absence of markers between sentences and between languages.) The network tries each time to predict the next element. We do a cluster analysis of its internal (hidden-unit) representations after having seen 20,000 sentences.
Clustering of the internal representations formed by the SRN N.B. It also works for micro languages with 768 words each
Conclusions Les modèles sont la réduction à l’essentiel d’un phénomène en vue de l’expliquer. Ils constituent notre manière la plus importante de comprendre le monde. Reproduire, au moins qualitativement, les données empiriques qu’il modélise Expliquer ces données. Faire des prédictions au delà des ces données Indiquer clairement son contexte d’utilisation. Être capable d’être sondé pour comprendre comment les mécanismes mis en oeuvre donnent lieu à des phénomènes modélisés et pour rendre compte des limites du modèle, Peut être infirmer.