Les modèles de la reconnaissance des mots (L. Heurley / 2013)

Slides:



Advertisements
Présentations similaires
APPRENDRE A LIRE Présentation par : Marie-Christine Ratez CPC Chauny Roselyne Cail CPC Guise.
Advertisements

Dans l'ouvrage PHONO qui vise le développement des compétences phonologiques des élèves de GS et CP, GOIGOUX - CEBE - PAOUR ont mis en oeuvre les principes.
Reconnaissance des Mots
Approches comportementales et électroencéphalographiques
BEP Métiers du service administratif
TD METHODOLOGIE : RÉUSSIR LA PARTIE ANALYTIQUE
Introduction Pour concrétiser l’enseignement assisté par ordinateur
Exemple : Itinéraire de lecture.
La lecture et son apprentissage
Apprendre à lire.
Apprentissage continué de la lecture au Cycle 2
Apprentissage initial de la lecture
Compétences - tâches réparties par niveaux
Le logarithme décimal : quelques exemples (introduction, utilisation)
Modélisation des systèmes non linéaires par des SIFs
variable aléatoire Discrète
Caractéristiques des ondes mécaniques
SENS Lire, cest décoder pour comprendre.
GED Masters: Gestion Électronique de Documents
Structures de données linéaires
Découverte du principe alphabétique
Initiation à la conception de systèmes d'information
La prévention des difficultés d’écriture
Décodage des informations
Sons de l’Environnement
Mais l’analyse visuelle des mots est fragile :
Bases de données lexicales
SOCLE COMMUN LIRE ET COMPRENDRE
Reconnaissance de la parole Difficultés Modèles
LA COMPREHENSION EN LECTURE
Cadre européen commun de référence pour les langues
26 situations simples autour d'un texte court
LA PRODUCTION D’ECRITS EN MATERNELLE
Conscience phonologique
Symbolisme vs Connexionnisme
La méthodologie expérimentale Fondements et bases d’application
ADAMOS Une plate-forme pour concevoir et évaluer des services proactifs Système proactif ? qui évolue en fonction des paramètres de lenvironnement physique.
Compétence, capacité et objectif d’apprentissage, quel lien?
Mise en oeuvre des MMCs L'utilisation des MMCs en reconnaissance des formes s'effectue en trois étapes : définition de la topologie de la chaîne de Markov,
Chapitre 6: la lecture experte
Modélisation de la lecture grâce à un modèle connexionniste
Accréditations Publicités efficaces en termes de Mémorisation Olivier Trendel.
Existe-t-il une rééducation de la dyslexie ?
Module 8 : Surveillance des performances de SQL Server
L’apport du Connexionnisme
 Une image fonctionnelle des régions davantage activées par les stimulus colorés est ainsi produite,
La perception de la parole
JMG - 28/01/08 Des apprentissages implicites aux apprentissages explicites Caractère implicite ou explicite des apprentissages Les élèves ont certaines.
Animation Pédagogique FRANCHEVILLE – LYON – S te -FOY 10 Janvier 2007.
La facilitation / inhibition sociale
DESIGN MULTIMÉDIA Initiation aux bases de La scénarisation multimédia
Développement de la lecture chez les enfants trisomiques 21
Des activités à ritualiser
Techniques documentaires et veille stratégique Anne Pajard, avril 2008
Structures de données avancées : LH (Hachage linéaire) D. E ZEGOUR Institut National d ’Informatique.
8 La mémoire Chapitre.
Hiver 2004SEG2501 Chapître 41 Chapître 4 SDL – structure d’un système et son comportement.
20/06/2015propagation de signatures lexicales dans le graphe du Web 1 Propagation de signatures lexicales dans le graphe du Web M. Bouklit M. Lafourcade.
La dictée au cycle 2 Voiron 2.
Le traitement visuel des mots écrits
les compétences des élèves dans le domaine du vocabulaire
Le lexique mental Mme. MEDANE
Scénario Les scénarios permettent de modifier la position, taille … des calques au cours du temps. Son fonctionnement est très proche de celui de Macromedia.
La perception de la parole
Raison d'être de la structure de fichiers : Les premiers travaux : Début des années 1960 : En 1963 : Près de 10 ans plus tard... (à peu près 1973) : Durant.
Algorithmique Boucles et Itérations
IFT 703 Informatique cognitive ACT-R Modèle symbolique et perceptuel
Les modèles de la reconnaissance des mots
 Mise en évidence de certaines difficultés de lecture  Suspicion d’une éventuelle dyslexie  Repérage des enfants dits à risque permet une PEC adaptée.
MES STRATÉGIES DE LECTURE
Transcription de la présentation:

Les modèles de la reconnaissance des mots (L. Heurley / 2013)

Modèles de reconnaissance de la parole On distingue différents types de modèles : - Actifs / passifs - Autonomes / interactifs - Computationnels / non computationnels - Connexionnistes / non connexionnistes - Hybrides (mixtes) / purs

Actif / passif (selon la conception du lexique mental) Les modèles actifs reposent sur une conception particulière du lexique mental selon laquelle ce dernier serait conçu comme un « fichier » dont les entrées seraient structurées sur la base de critère bien définis. Les représentations lexicales seraient de nature statique et la reconnaissance d ’un mot supposerait la mise en œuvre d ’une procédure de recherche analogue à celle que l ’on doit effectuer pour trouver une entrée particulière dans un dictionnaire. Ces modèles sont dits actifs car la procédure de recherche est active.

Actif / passif (selon la conception du lexique mental) Les modèles passifs reposent quant à eux sur la conception du lexique mental selon laquelle les mots seraient représentés par des unités internes, ou détecteurs, susceptibles d ’être activées par l ’information sensorielle provenant du stimulus-mot. Dans ce cadre, la reconnaissance du mot prend place quand l ’unité correspondante atteint un niveau d ’activité donné ou « seuil ». Il n ’y a aucune procédure de recherche active postulée dans ces modèles.

Autonome / Interactif (selon le type d ’information susceptible d ’intervenir dans la procédure d ’accès au lexique) Les modèles autonomes proposent que seules les informations de niveaux inférieurs de traitement interviennent dans la détermination de l ’accès (bottom up ou dirigé par données). Les modèles interactifs reposent quant à eux sur l ’idée que des informations provenant des niveaux supérieurs d ’analyse (informations contextuelles) puissent participer à la procédure d ’accès au lexique (traitement bottom up + top down ; traitement dirigé par données + traitement dirigé par concepts)

Computationnels / Non computationnels (selon le type de modélisation) Les modèles computationnels présentent une description à la fois statique (le modèle proprement dit) et dynamique du processus (simulation informatique). Les modèles non computationnels ne fournissent que la description statique du processus.

Connexionnistes / Non connexionnistes (selon le type type de métaphore utilisée) Les modèles non connexionnistes reposent sur la métaphore informatique (utilisation des mots : fichiers, recherche, etc.). Les modèles connexionnistes reposent quant à eux sur la métaphore neuronale (le modèle est assimilable à un réseau de neurones formels comportant des nœuds structurés en couches entretenant des relations excitatrices (facilitatrices) et inhibitrices).

Principaux effets à l’oral Capacité d’analyser la parole : flux sonore continu, rapide, variable et et lacunaire Effet de perception catégorielle Effet de fréquence - Caractère automatique du processus - Effet de restauration phonémique - Effet de reconnaissance incrémentielle Effets de contexte Etc.

Principaux effets à l’écrit - Effet Stroop (Stroop, processus automatique) - Effet de fréquence - Effet de supériorité du mot (Reicher) - Effet de voisinage orthographique - Effet de cécité à la répétition en présentation visuelle sérielle rapide (RSVP, Kanwisher) - Effets de contexte (amorçage sémantique, Meyer & Schwaneveldt) - Etc.

Les modèles de la reconnaissance des mots parlés (parole)

Modèles de reconnaissance de la parole 1) Les modèles de recherche sérielle Le modèle de Forster (actif, autonome et non computationnel) 2) Les modèles d’activation (interactifs et passifs) Modèles non computationnels - Le modèle des logogènes de Morton (1969 - …) - Le modèle de la cohorte de Marslen-Wilson Modèles computationnels - Le modèle TRACE de McClelland & Elman (1986 - … , passif, interactif et computationnel) 3) Les modèles de recherche-activation (hybrides) - Les modèles de Becker et de Paap (cf. expérience de Besner & McCann)

Tâche de « shadowing » Répéter un texte entendu le plus rapidement possible Texte entendu : Les deux éléphants sont dans la … Les deux éléphants sont dans la … Le modèle de la cohorte de Marslen-Wilson (1980) Originalité : ce modèle est un modèle d’activation qui tient compte des spécificités du signal acoustique et de la rapidité du processus Il permet d’expliquer trois effets : 1) le fait que la reconnaissance d’un mot soit si rapide et le fait qu’à l’oral un mot soit reconnu avant d’avoir été complètement entendu ; 2) le fait que l’identification d’un mot dépende du contexte syntaxique et sémantique dans lequel il est présenté ; 3) le fait que les temps de reconnaissance varient en fonction de la composition du lexique : le temps de réponse est le même si on le mesure à partir du moment où il n’existe plus de mots dans le lexique correspondant aux informations disponibles. 370 à 400 ms 250 ms Mot dans un texte : 250 à 275 ms Mot dans un texte dénué de sens mais syntaxiquement correct : 336 ms Mot dans une séquence de mots en désordre : 360 ms XOMENE REVOLQUE « non » TR Temps

Le modèle de la cohorte de Marslen-Wilson (1980) Etapes du processus de reconnaissance : 1) Représentations acoustico-phonétiques générées par le signal d’entrée 2) Activation de plusieurs représentations lexicales stockées en mémoire : candidats formant la cohorte initiale 3) Sélection d’une représentation lexicale (candidat) et désactivation des autres candidats. Le mot est reconnu très rapidement, avant que la totalité du signal acoustique n ’ait été perçue (au point d’unicité) 4) Intégration du candidat sélectionné dans la suite discursive syntaxique et sémantique. Temps

Les modèles de la reconnaissance des mots écrits (lecture)

Modèles de reconnaissance des mots écrits 1) Les modèles de recherche sérielle Le modèle de Forster (actif, autonome et non computationnel) 2) Les modèles d’activation (interactifs et passifs) Modèles non computationnels - Le modèle des logogènes de Morton (1970 - …) Modèles computationnels - Le modèle de McClelland & Rumelhart (1981 passif, interactif, computationnel et connexionniste) - Le modèle DRC (Dual Route Cascade) de Coltheart et coll. (2001 passif, interactif, computationnel et connexionniste) 3) Les modèles de recherche-activation (hybrides) - Les modèles de Becker et de Paap (cf. expérience de Besner & McCann)

Le modèle de lecture de Goodman Originalité : ce modèle tente d ’expliquer essentiellement l ’effet des attentes sur la lecture (la lecture est assimilable à un processus de devinette)

Le modèle de Gough (1972) Originalité : ce modèle est un modèle de sérialité

Le modèle de recherche sérielle de Forster (1976 - …) Originalité : ce modèle est un modèle autonome (non interactif) qui pousse très loin la métaphore informatique Autonome : Ce modèle est qualifié d’autonome car suppose que l’accès à un mot s’effectue uniquement sur la base des propriétés sensorielles de ce mot (bottom-up), l’information contextuelle et le traitement du reste de la phrase n’influençant pas sur la reconnaissance du mot. /a/

Le modèle de recherche sérielle de Forster (1976 - …) Architecture : Le lexique interne est représenté sous forme d’un système de fichiers : Un fichier central (le lexique central) et trois fichiers périphériques munis de pointeurs renvoyant au fichier central. Le fichier central qui comporte l’ensemble des informations (syntaxiques, sémantiques et morphologogiques). /a/

Le modèle de recherche sérielle de Forster (1976 - …) Le fichier orthographique (ou voie d’accès orthographique) : comporte les entrées correspondant à la forme graphique des mots. Il intervient dans la reconnaissance des mots écrits. Le fichier phonologique : comporte des entrées correspondant aux phonèmes des mots (il intervient dans la perception de la parole). Le fichier sémantique et syntaxique comporte des informations syntaxiques et sémantiques et intervient dans la production de la parole. /a/

Le modèle de recherche sérielle de Forster (1976 - …) Recherche séquentielle active : Ce modèle suppose que la reconnaissance des mots durant la lecture repose sur une recherche séquentielle active. Lorsqu’un mot-stimulus est présenté, le lexique mental serait parcouru activement et séquentiellement jusqu’à ce qu’un appariement soit trouvé entre l’information sensorielle entrante et une représentation lexicale particulière. /a/

Le modèle de recherche sérielle de Forster (1976 - …) Les « bins » : Selon ce modèle, il est improbable que la liste entière de tous les mots connus par le lecteur soit recherchée pour reconnaître le mot-stimulus, mais plus pertinent de considérer que chaque recherche soit limitée à un secteur lexical particulier appelé « bin » (casier). Les bins sont supposés être structurés en fonction des propriétés orthographiques, phonétiques et de fréquence des mots et regrouper les mots possédant les mêmes premières lettres. Par exemple pour reconnaître le mot-stimulus TABLEAU le bin comportant par ordre décroissant de fréquence les mots TABLE, TABLEAU, TABAC, TABLIER, TABOURET, etc. serait sélectionné. Char Chapeau Chateau Chacal Charpie Etc. /a/ Informations relatives au mot « chat »

Le modèle de recherche sérielle de Forster (1976 - …) L’effet de fréquence : Selon ce modèle, l’effet de fréquence s’explique par le fait que les mots fréquents étant localisés en « début de bin » serait du fait de la recherche séquentielle contactés en premier. Les non-mots : la recherche s’effectue jusqu’à ce qu’un mot soit trouvé. La recherche se termine lorsque parvenue en fin de fichier, la recherche n’a abouti à aucune reconnaissance de mot. Char Chapeau Chateau Chacal Charpie Etc. /a/ Informations relatives au mot « chat »

Les modèles d’activation

Les modèles d’activation Les modèles d’activation se distinguent généralement des autres modèles par la précision avec laquelle les processus et sous-processus sont décrits. Qu’ils soient computationnels ou non, ils reposent tous sur l’idée selon laquelle les représentations lexicales et infra-lexicales (lettres, syllabes, etc.) sont directement activées par les mots (pas de recherche). Exemple d’approche cumulative : - Morton (1970) - McClelland & Rumelhart (1981) - Coltheart et coll. (2001)

Le modèle des logogènes de Morton (1970 - …) Premier modèle d’activation qui a servi de référence aux autres modèles. Selon ce modèle, chaque mot connu d’un lecteur / auditeur est représenté dans la mémoire par une unité interne, un détecteur d’indices caractérisant le mot. Ce détecteur est appelé un logogène (logogen)

Le modèle des logogènes de Morton (1970 - …) Les logogènes contiennent toutes les informations relatives à un mot : - orthographiques - Phonologiques Syntaxiques - sémantiques Caractéristiques : ils ont un niveau d’activité de base qui peut augmenter en fonction des stimuli visuels ou auditifs présents dans l’environnement. Au fur et à mesure que l’information parvient au lecteur - auditeur, leur niveau d’activation augmente ; ils ont un seuil d’activation qui lorsqu’il est atteint provoque l’activation et l’accès des informations contenues dans le logogène ; - une fois le seuil atteint, le retour au niveau d’activation de bas s’effectue graduellement et non brutalement.

Niveau d’activité Seuil de réponse Probabilité Logogène à l’état de repos Augmentation du niveau d’activité du logogène en fonction des stimuli de l’environnement Logogène reconnus (réponse = mot reconnu et informations disponibles) Mot reconnu

Le modèle IAC de McClelland & Rumelhart (1981)

Le modèle IA de McClelland & Rumelhart (1981) Originalité : c’est le premier modèle computationnel du processus de lecture (selon Coltheart et coll. 2001) Objectif : Le modèle IAC (interactive activation competition model) est un modèle de perception de lettres en contexte. Il vise notamment à expliquer et reproduire l’effet de supériorité du mot (sur les lettres isolées et les non-mots). Modèle IAC / modèle des logogènes de Morton : - Points communs : Il s’inspire du modèle de logogènes de Morton dans le sens où il utilise la métaphore neuronale (idée de détecteurs, de seuils) et vise à expliquer les effets de contexte dans la reconnaissances des lettres et des mot. Il est également un modèle d’activation (passif) et interactif (cf. plus loin) - Différences : Il se différencie du modèle des logogènes de Morton car il est un modèle connexionniste et computationnel (simulations informatiques), ce que n’était pas le modèle de Morton

Le modèle IA de McClelland & Rumelhart (1981) Principaux effets expliqués par le modèle : Effet de supériorité du mot (comment notre connaissance des mots facilite-t-elle la reconnaissance de lettres ?) + effets associés (masquage, etc.) Reconnaissance de stimuli dégradés (bruités) Effet de fréquence Effet Stroop Effet de voisinage orthographique

Le modèle IA de McClelland & Rumelhart (1981) 3 Postulats de départ : Plusieurs niveaux de traitement : traits, lettres, mots, niveaux supérieurs (chaque niveau est impliqué dans la formation d’une représentation de l’information d’entrée à un niveau d’abstraction différent) Traitements en parallèle : la perception visuelle implique des traitements qui se déroulent en parallèle (2 sens) : traitements parallèles sur le plan spatial : les lettres d’un même mot (court) sont traitées simultanément ; le traitement se déroule simultanément sur plusieurs niveaux (traits, lettres, mots, supérieurs) en même temps. Traitements interactifs : la perception est un processus profondément interactif (traitements ascendants et descendants interviennent simultanément) Méthode : implémenter ces 3 postulats en utilisant une méthode simple inspirée du modèle neuronal reposant sur l’excitation / l’inhibition

Le modèle IA de McClelland & Rumelhart (1981) Architecture générale du modèle : Entre les niveaux de traitement, l’excitation et l’inhibition est communiquée par un mécanisme d’activation diffusante (l’activation diffuse d’un niveau au niveau voisin) Au sein d’un même niveau, les unités (i.e., lettres, mots) les unités sont reliées par des connexions uniquement inhibitrices (inhibition latérale). Au sein d’un même niveau une unité activée inhibe ses voisines (compétition)

Le modèle IA de McClelland & Rumelhart (1981) Les unités (au sein des niveaux) : Au sein d’un niveau, chaque unité (chaque trait, chaque lettre dans une position donnée, chaque mot) est un détecteur (au sens de Morton) Elle est représenté par un nœud (sorte de neurone formel) c’est-à-dire une sorte de « carrefour » dans un réseau de connexions complexe Par exemple, à la lettre « T » en 1ère position dans un mot correspond une unité, un nœud dans le modèle : j i Excitation + Inhibition - T Les nœuds auxquels est relié un nœud particulier sont appelés ses voisins. Les voisins d’un nœud peuvent être excitateurs ou inhibiteurs Ils sont obligatoirement situés au sein d’un même niveau ou dans un niveau adjacent.

Quelques interconnexions et nœuds voisins du nœud T lorsqu’il est en 1ère position dans un mot

Quelques interconnexions et nœuds voisins du nœud T lorsqu’il est en 1ère position dans un mot

Quelques interconnexions et nœuds voisins du nœud T lorsqu’il est en 1ère position dans un mot

Quelques interconnexions et nœuds voisins du nœud T lorsqu’il est en 1ère position dans un mot

Quelques interconnexions et nœuds voisins du nœud T lorsqu’il est en 1ère position dans un mot

Le modèle IA de McClelland & Rumelhart (1981) Paramètres d’activation d’un nœud : Chaque nœud a un seuil d’activation Le seuil d’activation d’un nœud est fixé à 0 A un instant t, chaque nœud a une valeur d’activation donnée (exprimée par un nombre) Lorsqu’un nœud ne reçoit pas d’excitations / inhibitions d’autres nœuds, il est inactif (valeur d’activation < 0) et a une valeur d’activation de repos qui dépend notamment de sa fréquence Lorsque, sur la base des excitations / inhibitions qu’il reçoit sa valeur d’activation devient positive (> 0) il devient actif puis sa valeur d’activation revient progressivement à son niveau de repos Un nœud n’a d’action sur ses voisins (ne diffuse son activité excitatrice ou inhibitrice) que lorsqu’il est actif j i Excitation + Inhibition -

Document Paramètres d’activation des nœuds Input arrivant sur le noeud i Effet de l’input total sur le noeud i à l’instant t Nouvelle valeur d’activation du noeud Probabilité de réponse du noeud à l’instant t

Simulations : Intérêt : permet de déterminer le comportement du modèle (les interactions sont tellement complexes que c’est la manière la plus simple de les analyser) Des simplifications ont été réalisées : Temps discret : l’unité de temps est le cycle de traitement (à chaque cycle les niveaux d’activation de tous les nœuds sont réactualisés) ; L’information d’entrée est simplifiée (cf. matrice ci-contre) ; - Le lexique est réduit à 1179 mots (noms communs) de 4 lettres

Compétition (inhibition) Compétition (inhibition) Niveau d’activation des mots et des lettres dans le cas d’un stimulus dégradé (ambiguïté sur la dernière lettre) Compétition (inhibition) Compétition (inhibition)

Effet de supériorité des mots (et des pseudo-mots) 4 facteurs sont importants : le nombre de voisins amis (qui contiennent la lettre-cible), le nombre de voisins ennemis (qui ne contiennent pas la lettre cible), l’effet de gang le « rich get richer effect ».

Pour réaliser soi-même des simulations aller la page de Walter van Heuven : http://www.psychology.nottingham.ac.uk/staff/wvh/jiam/

http://www.psychology.nottingham.ac.uk/staff/wvh/jiam/ Stimulus (input) : MAVE (pseudo-mot) MOVE est victime de l’effet de gang

http://www.psychology.nottingham.ac.uk/staff/wvh/jiam/ Stimulus (input) : WORD (pseudo-mot) WORD gagne la compétition, notamment contre WORK

http://www.psychology.nottingham.ac.uk/staff/wvh/jiam/ Stimulus (input) : WOR* (* = dernière lettre dégradée) WORK est reconnu contre WORD

Les modèles d’activation Le modèle Dual Route Cascade Model (DRC) à deux voies de Coltheart et coll. (2001) Originalité : Ce modèle est un modèle computationnel (accès à la simulation sur le site internet de l’auteur) Approche cumulative (nested modelling) : il est, selon Coltheart et coll., une généralisation (pour des mots de 8 lettres) du modèle IAC de McClelland & Rumelhart (1981) qui lui-même découlait de celui de Morton (1971 - …). Le modèle IAC est donc un cas particulier du modèle de Coltheart et coll.

Les modèles d’activation Selon ce modèle, la reconnaissance d’un mot peut s’effectuer via 2 voies (d’où le nom du modèle) : la voie lexicale non sémantique (directe) la voie de conversion graphème phonème (indirecte) Nota : la 3ème voie « lexicale sémantique » n’a pas été implémentée) Lorsqu’un mot écrit est rencontré, les deux voies entrent en action simultanément. Chez l’adulte, la voie lexicale non sémantique (directe), plus automatisée, que la voie de la médiation phonologique ou de conversion graphème-phonème (indirecte) est plus rapide. Voie lexicale non sémantique (directe) Voie de conversion graphème-phonème (indirecte)

FIN DE LA PARTIE SUR LES MODELES