Les modèles de la reconnaissance des mots
Modèles de reconnaissance de la parole On distingue différents types de modèles : - Actifs / passifs - Autonomes / interactifs - Computationnels / non computationnels - Connexionnistes / non connexionnistes - Hybrides (mixtes) / purs
Actif / passif (selon la conception du lexique mental) Les modèles actifs reposent sur une conception particulière du lexique mental selon laquelle ce dernier serait conçu comme un « fichier » dont les entrées seraient structurées sur la base de critère bien définis. Les représentations lexicales seraient de nature statique et la reconnaissance d ’un mot supposerait la mise en œuvre d ’une procédure de recherche analogue à celle que l ’on doit effectuer pour trouver une entrée particulière dans un dictionnaire. Ces modèles sont dits actifs car la procédure de recherche est active.
Actif / passif (selon la conception du lexique mental) Les modèles passifs reposent quant à eux sur la conception du lexique mental selon laquelle les mots seraient représentés par des unités internes, ou détecteurs, susceptibles d ’être activées par l ’information sensorielle provenant du stimulus-mot. Dans ce cadre, la reconnaissance du mot prend place quand l ’unité correspondante atteint un niveau d ’activité donné ou « seuil ». Il n ’y a aucune procédure de recherche active postulée dans ces modèles.
Autonome / Interactif (selon le type d ’information susceptible d ’intervenir dans la procédure d ’accès au lexique) Les modèles autonomes proposent que seules les informations de niveaux inférieurs de traitement interviennent dans la détermination de l ’accès (bottom up ou dirigé par données). Les modèles interactifs reposent quant à eux sur l ’idée que des informations provenant des niveaux supérieurs d ’analyse (informations contextuelles) puissent participer à la procédure d ’accès au lexique (traitement bottom up + top down ; traitement dirigé par données + traitement dirigé par concepts)
Computationnels / Non computationnels (selon le type de modélisation) Les modèles computationnels présentent une description à la fois statique (le modèle proprement dit) et dynamique du processus (simulation informatique). Les modèles non computationnels ne fournissent que la description statique du processus.
Connexionnistes / Non connexionnistes (selon le type type de métaphore utilisée) Les modèles non connexionnistes reposent sur la métaphore informatique (utilisation des mots : fichiers, recherche, etc.). Les modèles connexionnistes reposent quant à eux sur la métaphore neuronale (le modèle est assimilable à un réseau de neurones formels comportant des nœuds structurés en couches entretenant des relations excitatrices (facilitatrices) et inhibitrices).
Principaux effets à l’oral Capacité d’analyser la parole : flux sonore continu, rapide, variable et et lacunaire Effet de perception catégorielle Effet de fréquence - Caractère automatique du processus - Effet de restauration phonémique - Effet de reconnaissance incrémentielle Effets de contexte Etc.
Principaux effets à l’écrit - Effet Stroop (Stroop, processus automatique) - Effet de fréquence - Effet de supériorité du mot (Reicher) - Effet de voisinage orthographique - Effet de cécité à la répétition en présentation visuelle sérielle rapide (RSVP, Kanwisher) - Effets de contexte (amorçage sémantique, Meyer & Schwaneveldt) - Etc.
Les modèles de la reconnaissance des mots parlés (parole)
Modèles de reconnaissance de la parole 1) Les modèles de recherche sérielle Le modèle de Forster (actif, autonome et non computationnel) 2) Les modèles d’activation (interactifs et passifs) Modèles non computationnels - Le modèle des logogènes de Morton (1969 - …) - Le modèle de la cohorte de Marslen-Wilson Modèles computationnels - Le modèle TRACE de McClelland & Elman (1986 - … , passif, interactif et computationnel) 3) Les modèles de recherche-activation (hybrides) - Les modèles de Becker et de Paap (cf. expérience de Besner & McCann)
Le modèle de recherche sérielle de Forster (1976 - …) Originalité : ce modèle est un modèle autonome (non interactif) qui pousse très loin la métaphore informatique Autonome : Ce modèle est qualifié d’autonome car suppose que l’accès à un mot s’effectue uniquement sur la base des propriétés sensorielles de ce mot (bottom-up), l’information contextuelle et le traitement du reste de la phrase n’influençant pas sur la reconnaissance du mot. /a/
Le modèle de recherche sérielle de Forster (1976 - …) Architecture : Le lexique interne est représenté sous forme d’un système de fichiers : Un fichier central (le lexique central) et trois fichiers périphériques munis de pointeurs renvoyant au fichier central. Le fichier central qui comporte l’ensemble des informations (syntaxiques, sémantiques et morphologogiques). /a/
Le modèle de recherche sérielle de Forster (1976 - …) Le fichier orthographique (ou voie d’accès orthographique) : comporte les entrées correspondant à la forme graphique des mots. Il intervient dans la reconnaissance des mots écrits. Le fichier phonologique : comporte des entrées correspondant aux phonèmes des mots (il intervient dans la perception de la parole). Le fichier sémantique et syntaxique comporte des informations syntaxiques et sémantiques et intervient dans la production de la parole. /a/
Le modèle de recherche sérielle de Forster (1976 - …) Recherche séquentielle active : Ce modèle suppose que la reconnaissance des mots durant la lecture repose sur une recherche séquentielle active : lorsqu’un mot-stimulus est présenté, le lexique mental serait parcouru activement et séquentiellement jusqu’à ce qu’un appariement soit trouvé entre l’information sensorielle entrante et une représentation lexicale particulière. /a/
Le modèle de recherche sérielle de Forster (1976 - …) Les « bins » : Selon ce modèle, il est improbable que la liste entière de tous les mots connus par le lecteur soit recherchée pour reconnaître le mot-stimulus, mais plus pertinent de considérer que chaque recherche soit limitée à un secteur lexical particulier appelé « bin » (casier). Les bins sont supposés être structurés en fonction des propriétés orthographiques, phonétiques et de fréquence des mots et regrouper les mots possédant les mêmes premières lettres. Par exemple pour reconnaître le mot-stimulus TABLEAU le bin comportant par ordre décroissant de fréquence les mots TABLE, TABLEAU, TABAC, TABLIER, TABOURET, etc. serait sélectionné. Char Chapeau Chateau Chacal Charpie Etc. /a/ Informations relatives au mot « chat »
Le modèle de recherche sérielle de Forster (1976 - …) L’effet de fréquence : Selon ce modèle, l’effet de fréquence s’explique par le fait que les mots fréquents étant localisés en « début de bin » serait du fait de la recherche séquentielle contactés en premier. Les non-mots : la recherche s’effectue jusqu’à ce qu’un mot soit trouvé. La recherche se termine lorsque parvenue en fin de fichier, la recherche n’a abouti à aucune reconnaissance de mot. Char Chapeau Chateau Chacal Charpie Etc. /a/ Informations relatives au mot « chat »
Tâche de « shadowing » Répéter un texte entendu le plus rapidement possible Texte entendu : Les deux éléphants sont dans la … Les deux éléphants sont dans la … Le modèle de la cohorte de Marslen-Wilson (1980 - ) Originalité : ce modèle est un modèle d’activation qui tient compte des spécificités du signal acoustique et de la rapidité du processus Expliquer trois effets : 1) le fait que la reconnaissance d’un mot soit si rapide et le fait qu’à l’oral un mot soit reconnu avant d’avoir été complètement entendu ; 2) le fait que l’identification d’un mot dépende du contexte syntaxique et sémantique dans lequel il est présenté ; 3) le fait que les temps de reconnaissance varient en fonction de la composition du lexique : le temps de réponse est le même si on le mesure à partir du moment où il n’existe plus de mots dans le lexique correspondant aux informations disponibles 370 à 400 ms 250 ms Mot dans un texte : 250 à 275 ms Mot dans un texte dénué de sens mais syntaxiquement correct : 336 ms Mot dans une séquence de mots en désordre : 360 ms XOMENE REVOLQUE « non » TR Temps
Temps Le modèle de la cohorte de Marslen-Wilson (1980 - ) Etapes du processus de reconnaissance : 1) Représentations acoustico-phonétiques générées par le signal d’entrée 2) Activation de plusieurs représentations lexicales stockées en mémoire : candidats formant la cohorte initiale 3) Sélection d’une représentation lexicale (candidat) et désactivation des autres candidats. Le mot est reconnu très rapidement, avant que la totalité du signal acoustique n ’ait été perçue (au point d’unicité) 4) Intégration du candidat sélectionné dans la suite discursive syntaxique et sémantique.
Le modèle de Morton (ce modèle est décrit dans la partie consacrée à la reconnaissance des mots écrits)
Les modèles de la reconnaissance des mots écrits (lecture)
Modèles de reconnaissance des mots écrits 1) Les modèles de recherche sérielle Le modèle de Forster (actif, autonome et non computationnel) 2) Les modèles d’activation (interactifs et passifs) Modèles non computationnels - Le modèle des logogènes de Morton (1970 - …) Modèles computationnels - Le modèle de McClelland & Rumelhart (1981 passif, interactif, computationnel et connexionniste) - Le modèle DRC (Dual Route Cascade) de Coltheart et coll. (2001 passif, interactif, computationnel et connexionniste) 3) Les modèles de recherche-activation (hybrides) - Les modèles de Becker et de Paap (cf. expérience de Besner & McCann)
Le modèle de lecture de Goodman Originalité : ce modèle tente d ’expliquer essentiellement l ’effet des attentes sur la lecture (la lecture est assimilable à un processus de devinette)
Le modèle de Gough (1972) Originalité : ce modèle est un modèle de sérialité
Les modèles d’activation
Les modèles d’activation Les modèles d’activation se distinguent généralement des autres modèles par la précision avec laquelle les processus et sous-processus sont décrits. Qu’ils soient computationnels ou non, ils reposent tous sur l’idée selon laquelle les représentations lexicales et infra-lexicales (lettres, syllabes, etc.) sont directement activées par les mots (pas de recherche).
Le modèle des logogènes de Morton (1970 - …) Premier modèle d’activation qui a servi de référence aux autres modèles. Selon ce modèle, chaque mot connu d’un lecteur / auditeur est représenté dans la mémoire par une unité interne, un détecteur d’indices caractérisant le mot. Ce détecteur est appelé un logogène (logogen)
Le modèle des logogènes de Morton (1970 - …) Les logogènes contiennent toutes les informations relatives à un mot : - orthographiques - phonologiques - syntaxiques - sémantiques Caractéristiques : - ils ont un niveau d’activité de base qui peut augmenter en fonction des stimuli visuels ou auditifs présents dans l’environnement. Au fur et à mesure que l’information parvient au lecteur - auditeur, leur niveau d’activation augmente ; - ils ont un seuil d’activation qui lorsqu’il est atteint provoque l’activation et l’accès des informations contenues dans le logogène ; - une fois le seuil atteint, le retour au niveau d’activation de bas s’effectue graduellement et non brutalement.
Niveau d’activité Seuil de réponse Probabilité Logogène à l’état de repos Augmentation du niveau d’activité du logogène en fonction des stimuli de l’environnement Logogène reconnus (réponse = mot reconnu et informations disponibles) Mot reconnu
Le modèle de McClelland & Rumelhart (1981)
Le modèle IA de McClelland & Rumelhart (1981) Objectif : Le modèle IA (interactive activation model) est un modèle de perception de lettres en contexte. Il vise notamment à expliquer et reproduire l’effet de supériorité du mot (sur les lettres isolées et les non-mots). Modèle IA / modèle des logogènes de Morton : - Points communs : Il s’inspire du modèle de logogènes de Morton dans le sens où il utilise la métaphore neuronale (idée de détecteurs, de seuils) et vise à expliquer les effets de contexte dans la reconnaissances des lettres et des mot. Il est également un modèle d’activation (passif) et interactif (cf. plus loin) - Différences : Il se différencie du modèle des logogènes de Morton car il est un modèle connexionniste et computationnel (simulations informatiques), ce que n’était pas le modèle de Morton
Le modèle IA de McClelland & Rumelhart (1981) Principaux effets expliqués par le modèle : Effet de supériorité du mot (comment notre connaissance des mots facilite-t-elle la reconnaissance de lettres ?) + effets associés (masquage, etc.) Reconnaissance de stimuli dégradés (bruités) Effet de fréquence Effet Stroop Effet de voisinage orthographique
Le modèle IA de McClelland & Rumelhart (1981) 3 Postulats de départ : Plusieurs niveaux de traitement : traits, lettres, mots, niveaux supérieurs (chaque niveau est impliqué dans la formation d’une représentation de l’information d’entrée à un niveau d’abstraction différent) Traitements en parallèle : la perception visuelle implique des traitements qui se déroulent en parallèle (2 sens) : traitements parallèles sur le plan spatial : les lettres d’un même mot (court) sont traitées simultanément ; le traitement se déroule simultanément sur plusieurs niveaux (traits, lettres, mots, supérieurs) en même temps. Traitements interactifs : la perception est un processus profondément interactif (traitements ascendants et descendants interviennent simultanément) Méthode : implémenter ces 3 postulats en utilisant une méthode simple inspirée du modèle neuronal reposant sur l’excitation / l’inhibition
Le modèle IA de McClelland & Rumelhart (1981) Architecture générale du modèle : Entre les niveaux de traitement, l’excitation et l’inhibition est communiquée par un mécanisme d’activation diffusante (l’activation diffuse d’un niveau au niveau voisin) Au sein d’un même niveau, les unités (i.e., lettres, mots) les unités sont reliées par des connexions uniquement inhibitrices (inhibition latérale). Au sein d’un même niveau une unité activée inhibe ses voisines (compétition)
Le modèle IA de McClelland & Rumelhart (1981) Les unités (au sein des niveaux) : Au sein d’un niveau, chaque unité (chaque trait, chaque lettre dans une position donnée, chaque mot) est un détecteur (au sens de Morton) Elle est représenté par un nœud (sorte de neurone formel) c’est-à-dire une sorte de « carrefour » dans un réseau de connexions complexe Par exemple, à la lettre « T » en 1ère position dans un mot correspond une unité, un nœud dans le modèle : j i Excitation + Inhibition - T Les nœuds auxquels est relié un nœud particulier sont appelés ses voisins. Les voisins d’un nœud peuvent être excitateurs ou inhibiteurs Ils sont obligatoirement situés au sein d’un même niveau ou dans un niveau adjacent.
Quelques interconnexions et nœuds voisins du nœud T lorsqu’il est en 1ère position dans un mot
Quelques interconnexions et nœuds voisins du nœud T lorsqu’il est en 1ère position dans un mot
Quelques interconnexions et nœuds voisins du nœud T lorsqu’il est en 1ère position dans un mot
Quelques interconnexions et nœuds voisins du nœud T lorsqu’il est en 1ère position dans un mot
Quelques interconnexions et nœuds voisins du nœud T lorsqu’il est en 1ère position dans un mot
Le modèle IA de McClelland & Rumelhart (1981) Paramètres d’activation d’un nœud : Chaque nœud a un seuil d’activation Le seuil d’activation d’un nœud est fixé à 0 A un instant t, chaque nœud a une valeur d’activation donnée (exprimée par un nombre) Lorsqu’un nœud ne reçoit pas d’excitations / inhibitions d’autres nœuds, il est inactif (valeur d’activation < 0) et a une valeur d’activation de repos qui dépend notamment de sa fréquence Lorsque, sur la base des excitations / inhibitions qu’il reçoit sa valeur d’activation devient positive (> 0) il devient actif puis sa valeur d’activation revient progressivement à son niveau de repos Un nœud n’a d’action sur ses voisins (ne diffuse son activité excitatrice ou inhibitrice) que lorsqu’il est actif j i Excitation + Inhibition -
Paramètres d’activation des nœuds Input arrivant sur le noeud i Effet de l’input total sur le noeud i à l’instant t Nouvelle valeur d’activation du noeud Probabilité de réponse du noeud à l’instant t
Simulations : Intérêt : permet de déterminer le comportement du modèle (les interactions sont tellement complexes que c’est la manière la plus simple de les analyser) Des simplifications ont été réalisées : Temps discret : l’unité de temps est le cycle de traitement (à chaque cycle les niveaux d’activation de tous les nœuds sont réactualisés) ; L’information d’entrée est simplifiée (cf. matrice ci-contre) ; - Le lexique est réduit à 1179 mots (noms communs) de 4 lettres
Compétition (inhibition) Compétition (inhibition) Niveau d’activation des mots et des lettres dans le cas d’un stimulus dégradé (ambiguïté sur la dernière lettre) Compétition (inhibition) Compétition (inhibition)
Effet de supériorité des mots (et des pseudo-mots) 4 facteurs sont importants : le nombre de voisins amis (qui contiennent la lettre-cible), le nombre de voisins ennemis (qui ne contiennent pas la lettre cible), l’effet de gang le « rich get richer effect ».
Le modèle Dual Route Cascade Model (DRC) à deux voies de Coltheart et coll. (2001) Originalité : ce modèle est un modèle computationnel (accès à la simulation sur le site internet de l ’auteur) Approche cumulative : il découle du modèle IA de McClelland & Rumelhart (1981) qui lui-même découle de celui de Morton (1971 - …)
FIN DE LA PARTIE SUR LES MODELES
Archives
MOTS LETTRES PHONÈMES TRAITS TRAITS Entrées des niveaux supérieurs MOTS Connexion facilitatrice Connexion inhibitrice LETTRES PHONÈMES TRAITS TRAITS Entrée visuelle Entrée acoustique