Modélisation de la lecture grâce à un modèle connexionniste
Le modèle connexionniste • Rejet de la notion de représentation • Opérations mentales vs calculs • Notion de traitement parallèle distribué (PDP = parallel distributed processing) • Idée de base: cerveau composé d’unités ou neurones connectées entre elles en un immense réseau • Chaque neurone effectue des opérations simples : – Réagir ou non à excitation, transmettre ou non à ses voisins… • Certaines connexions sont plus fréquemment sollicitées – Configurations stables, constellations • Quand les neurones d’une constellation sont excités, ils envoient des messages à leurs voisins et activent des configurations globales
Critiques du modèle computationniste : – On ne peut étudier la pensée sans tenir compte des contraintes liées à la structure du cerveau donc : partir des neurones et de leur enchevêtrement – Conception en série incompatible avec rapidité du traitement d’information : traitement parallèle pour expliquer la rapidité – Refus de la notion de modularité Modèle: la pensée résulte de l’activité d’un immense ensemble de neurones (millions de neurones, milliards de synapses)
Comparaison Biologique/naturel
Modèles connexionistes Réseau connexionniste = ensemble d’unités Unités ou neurones
Réseau multicouches Poids des connexions Neurone de sortie Couche Neurones d’entrée Neurone de sortie Couche cachée Poids des connexions La couche d’entrées corrspond aux entrées la sortie au resultat ex calcul de la valeur marchande d’une maison en fonction de taille nbre de pieces garage mitoyennete... Système non linéaire L’apprentissage va ajuster les poids des connexions mais l’architecture nombre de neurones dans la couche cachée est un choix arbitraire. On divise les données initiales en un ens d’apprentissage et un ens de test sur lequel on regarde la qualité d’ajustement du réseau.
Propriétés 1. Les connexions entre les unités permettent la transmission d’un niveau donné d’activation. Si le poids d’une connexion est négatif par exemple, l’unité en question transmettra une inhibition plutôt qu’une activation. Par conséquent, dans ces réseaux, on parle de transmission d’activation et non plus de transmission d’information symbolique comme c’était le cas pour les modèles de type cognitifs. 2. Les opérations réalisées par chaque unités sont de simples modifications arithmétiques opérées sur le signal d’entrée. On parle d’opérations locales. 3. Il n’y a pas de processeur central qui contrôle le fonctionnement du réseau. 4. Les réseaux connexionistes sont capables d’apprendre grâce à l’ajustement progressifs des poids des différentes connexions de chaque unités.
Les différents types de réseaux : 1- Les réseaux à connexions stables les poids sont fixes (McClelland & Rumelhart, 81) mot lettre Traits visuels
D w= e a e 2- Réseaux à algorithmes d’apprentissage les poids sont appris par le réseau La règle Delta de rétro-propagation de l’erreur D w= e a e Coefficient d’apprentissage erreur poids
Conception « classique », computationiste : La reconnaissance visuelle des mots repose sur 2 processus différents : Une procédure visuelle « accès direct ».
La reconnaissance visuelle des mots repose sur 2 processus différents : Une procédure phonologique « accès indirect ». Une procédure visuelle « accès direct ». Modèle à double accès (Coltheart, 1978).
L’étape d’assemblage n’est pas instantanée.
Seidenberg & McClelland (1989) 400 unités 460 unités 200 unités 400 unités
Simulation Appentissage (3000 mots) 250 époques pour l’apprentissage (230 HF, 10 BF) Erreur d’activation : Aentrée-Asortie Résultats : Prononciation Fréquence, Régularité, voisinage mais difficultés avec pseudomots Développement apprentissage pathologies
Phase de test sur 3000 mots : 63 erreurs de prononciation Très proches des erreurs des dyslexiques
5 spécifiques 14 communes 10 spécifiques 8 communes