De l’orthographe à la prononciation: Nature des processus de conversion graphème-phonème dans la reconnaissance des mots écrits Marielle Lange Merci Monsieur.

De l’orthographe à la prononciation: Nature des processus de conversion graphème-phonème dans la reconnaissance des mots écrits Marielle Lange Merci Monsieur Azzi, Comme vient de vous le démontrer monsieur Azzi, lire des mots à voix haute est une activité cognitive commune et aisée pour les adultes lettrés que nous sommes. Mais vous êtes-vous jamais demandé comment vous faisiez pour obtenir la prononciation d ’un mot écrit. Pour un mot comme « orthographe », c ’est facile, vous connaissez le mot et l ’avez déjà entendu prononcé, il vous suffit de vous souvenir de sa prononciation. Mais pour un mot comme graphème, que la plupart d ’entre vous n ’ont jamais rencontré, comment faites-vous? Visiblement, vous êtes capables d ’exploiter une connaissance des relations entre lettres et sons en français pour « deviner » la prononciation de la séquence. Mais comment? Et bien c ’est justement la problématique de mon travail de thèse que je vous présente aujourd ’hui. Mais avant tout, clarifions ces termes de graphème et phonème. Pour une description des relations orthographe-son de la langue, il est souvent utile de faire référence à des unités plus larges que la lettre, comme pour le segment PH qui se prononce /f/. Le terme de graphème est utilisé à cette fin pour désigner les lettres ou suites de lettres qui correspondent chacunes à un son de parole. Suivant cette définition, dans le mot écrit graphème, g, r, a , ph, etc. sont identifiés comme des graphèmes car associés chacun à un phonème ou son de parole.

Relations stables entre orthographe et prononciation
CH E P CH  /S/ mais CH  /k/ dans CHAOS E  /E/ mais E  /e/ dans CLEF E  /a/ dans FEMME P  /p/ mais P  silence dans COUP CH E P CH  /S/ E  /E/ P  /p/ Sans aucun doute, ce qui caractérise des langues comme le français où l’anglais est l’existence de relations stables entre graphème et phonème. Une graphème est fréquemment prononcé par le même son (le groupement CH par le son /che/) et un son retranscrit par la même lettre (/che/ par CH). Cette caractéristique fait qu ’ une connaissance de ces relations stables permet souvent de déduire avec succès la prononciation d ’une séquence familière ou non familère à partir d’une identification des lettres qui la composent. Ainsi, bien que personne je pense n ’ait jamais appris la prononciation de la séquence C, H, E, P, tout le monde s ’accordera normalement à la prononcer /chaip/, reflétant le fait qu ’en français CH se prononce régulièrement /che/, E se prononce régulièrement /ai/ et P se prononce régulièrement /p/.  Cependant, pour la plupart des langues alphabétiques, comme c’est le cas pour le français ou l’anglais, ces relations ne sont pas parfaitement systématiques. Il peut arriver qu’un même groupe de lettres se voie attribuer des prononciations différentes selon le contexte. Ainsi, CH se prononce plutôt “KE” dans chaos. E se prononce aussi “é” dans clef ou “a” dans femme. Enfin, P se traduit parfois par un silence comme dans COUP. Bref, les prononciations des graphèmes sont souvent prédictibles mais pas toujours à 100% et, comme en donne un aperçu la comparaison de E très instable et de P non systématique mais tout de même très prédictible, la force des associations ou prédictibilité des relations entre graphèmes et phonèmes est très variable d’un groupement de lettres à l’autre.

Questions centrales Comment cette connaissance des relations assez systématiques entre orthographe et prononciation est-elle représentée mentalement? Comment participe-t-elle à la dérivation de la prononciation d’une forme orthographique? Dans le domaine de la reconnaissance des mots écrits, deux questions au centre de bons nombres de travaux sont: Comment cette connaissance des relations assez systématiques entre orthographe et phonologie est-elle représentée mentalement? Comment participe-t-elle à la dérivation de la prononciation d’une chaîne de caractères? De nombreux auteurs s ’accordent à considérer qu ’il existe un système de transcodage spécifique, à côté d ’un autre système de traitement, lexical, récupérant la prononciation sur base de l ’identification d ’une forme orthograhique familière. Toutefois, la question de la manière dont une connaissance des relations entre orthographe et prononciation est représentée et utilisée est loin d’être résolue. En fait, différentes équipes de psycholinguistes proposent des explications très différentes quant à la nature de ces connaissances et processus cognitifs qui interviennent lors du transcodage du mot écrit en mot parlé.

Explications très différentes
Nature des représentations: Connaissance de la prononciation la plus fréquente de chacun des graphèmes de la langue. Analogie à des traces syllabiques. Réseau associatif lettre-phonème. Nature du processus de transcodage: Déchiffrement lettre-après-lettre. Transcodage syllabe-après-syllabe. Traduction synchrone de toutes les lettres d’une chaîne. Pour en donner un aperçu rapide, Par rapport à la question de la nature des représentations des relations entre orthographe et prononciation, certains font l ’hypothèse d’une connaissance de la prononciation la plus fréquente de chacun des graphèmes de la langue. D ’autres proposent que la prononciation d’une chaîne de caractères est obtenue par analogie à des syllabes dont la prononciation nous est connue. D ’autres encore proposent que la connaissance des relations orthographe-son prend la forme d’un réseau associatif connectant les lettres aux phonèmes, avec des connexions aussi bien vers les phonèmes des positions correspondantes que vers les phonèmes des positions adjacentes.  Par rapport à la question de la nature du processus de transcodage, certains font l’hypothèse d’un traitement séquentiel, parcourant la chaîne de caractères lettre-après-lettre. D ’autres font celle d ’un déchiffrement syllabe-après-syllabe. D ’autres encore font l ’hypothèse d ’une traduction synchrone de toutes les lettres d’une chaîne de caractères

Deux hypothèses évaluées
Connaissance des relations orthographe-son capturée par des règles graphème-phonème de type tout-ou-rien. Nature séquentielle, lettre-après-lettre du processus de transcodage. L ’objectif de mon travail était de statuer sur la pertinence de certaines de ces propositions théoriques. Je me suis en particulier intéressée à deux hypothèses, celle d ’une représentation des relations orthographe-son par un répertoire de règles graphème-phonème et celle d ’un transcodage lettre-après-lettre de la chaîne de caractères. Ces deux hypothèses caractérisent en fait un des modèles actuels le plus influent, le modèle de Coltheart et collègues.

Modèle de Coltheart et coll.
[foto] p /p/ h f h ph /f/ f f o t o # ñ o pho ??? _ o /o/ o t t o Règles de conversion graphème-phonème Transcodage lettre-après-lettre Ainsi, pour Coltheart et collègues, la traduction d ’un mot écrit comme photo (en bas) en mot parlé /foto/ (en haut) repose sur la consultation d ’un répertoire qui reprend chaque suite de lettres reconnue pour opérer comme un graphème (par exemple la suite PH) et lui attribue le phonème ou son de parole qui lui est le plus fréquemment associé (soit /f/ pour PH). Cette consultation prend place au cours d ’un déchiffrement lettre-à-lettre de la chaîne de caractères.  Concrètement, comme le montre l’animation, P, la première lettre du mot photo est isolée et une tentative de traduction effectuée. La lettre P est trouvée dans le répertoire, avec pour traduction /p/ et ce dernier phonème est activé au niveau du système de production, qui prépare la réponse articulatoire.  La deuxième lettre, H, est ensuite traitée. Afin de permettre l’identification de la prononciation de graphèmes multilettres comme PH, cette nouvelle lettre est d’abord accolée à l’unité précédemment traduite. Si, comme ici, la traduction réussit, l ’identité du phonème à prononcer est réactualisée (le phonème /f/ vient remplacer le /p/ précédemment actif).  La troisième lettre, O, est ensuite traitée. Elle est elle aussi d ’abord accolée à l’unité précédemment traduite, soit PH. Mais ici la traduction échoue car PHO, n ’est pas repris dans le répertoire des graphèmes de la langue. Une nouvelle position phonémique est ouverte puis, une tentative de traduction effectuée sur la seule lettre courante.  Le second phonème est alors identifié comme /o/ par traduction du graphème O.   Le processus continue ainsi jusqu ’à la dernière lettre.  Lorsque le mécanisme de lecture lettre à lettre arrive à un blanc qui lui indique une fin de chaîne, un signal pour déclencher la réponse est donné et les phonèmes identifiés articulés (ici, /foto/). Ce sont donc principalement les hypothèses de ce modèle par rapport à la nature des représentations et processus que nous avons évalué dans notre travail de thèse. photo p o

Représentations Commençons par celle relative aux représentations.
[[Pause]]

Règles Graphème-Phonème?
Position de Coltheart et collègues: Connaissance des relations orthographe-son limitée à des règles graphème  associé phonèmique le plus fréquent. Associations simples Associations multiples Règles Comme nous l ’avons vu il y a un instant, Coltheart et collègues font l ’hypothèse d ’une représentation des relations orthographe-son par un répertoire de correspondances graphème-phonème dans lequel la prononciation la plus fréquente de chaque graphème de la langue est indiquée. Une question non résolue est celle de la nature exacte des représentations contenues dans ce répertoire. Trois alternatives peuvent être envisagées. 1. Celle de règles de correspondance choisie par Coltheart et collègues qui suppose que chaque graphème active un seul associé phonémique avec une force constante quelle que soit la prédictibilité de cette prononciation dans la langue. 2. Celle d ’associations simples qui suppose une représentation graduelle de la régularité, avec une prononciation qui serait activée de manière variable suivant la force d ’association entre un graphème et sa prononciation dans la langue. 3. Celle d ’associations multiples qui suppose une représentation de tous les associés phonémiques d ’un graphème, avec activation des associations minoritaires à côté de l ’association la plus fréquente, avec une force qui varie suivant la prédictibilité de l ’association dans la langue. Pour Coltheart et collègues il n ’y aurait actuellement aucune donnée impliquant une représentation plus riche que celle capturée par des règles. Mais en réalité, la question de la représentation graduelle ou non des associations graphème-phonème n ’a jusqu ’à présent jamais été réellement directement évaluée. La raison principale en est qu ’une telle évaluation nécessite l ’accès à une estimation de l ’ambiguïté relative des différentes prononciation des graphèmes. Or de telles données sont actuellement absentes ou difficilement exploitables. Une contribution importante de cette étude a dès lors été l’établissement d ’analyses des associations graphème-phonème, de l ’anglais d ’une part, pour les études menées pendant mon séjour à Cambridge, du français d ’autre part, pour les études réalisées à Bruxelles. B ON G OU R

Estimation de la fréquence des associations graphème-phonème en français et en anglais
Ces analyses ont pour objet l ’établissement d ’une table reprenant pour chacune des associations graphème-phonème de la langue une estimation de la fréquence avec laquelle cette association apparaît dans la langue.

Méthodologie menant au décompte
Corpora Français: mots de 1 à 3 syllabes; Anglais: mots de 1 ou 2 syllabes (et leur prononciation britannique). Choix des associations dans nos analyses GP + contexte: Ceiy  /s/ PLACE, CIEL GP + position: Sfin  /silence/ CAS, NOS CLEF: EF  /e/ ou E  /e/ et F  /silence/? Les analyses ont été effectuées séparément pour les associations du français et de l ’anglais. Celles du français portaient sur un corpus d’environ mots de 1 à 3 syllabes et celles l ’anglais sur un corpus d‘environ mots de 1 ou 2 syllabes avec leur prononciation britannique. La méthodologie adoptée ensuite procède en 3 étapes.  La première consiste à déterminer les associations qui seront reprises dans la table. Elle implique d ’abord des critères généraux. Dans notre étude, il s ’agissait principalement de la décision d ’inclure dans la table des graphèmes marqués pour les contextes qui modifient de manière systématique la prononciation d’un graphème. Par exemple, inclure le graphème Ceiy pour représenter le C qui se prononce systématiquement “SE” devant “E, I, Y”, ou le graphème Sfin pour représenter le S qui comme les autres consonnes du français est muet en fin de mot. Cette première étape se caractérise aussi par de nombreuses décisions au cas par cas pour déterminer quels groupements de lettres on choisit de considérer comme des graphèmes, à savoir des unités fonctionnelles pour la prononciation. Par exemple, pour clef, on pourrait hésiter entre soit isoler EF comme un graphème ou soit, par analogie avec CHEF, considérer que EF se décompose en deux graphèmes, E associé au phonème /é/ et F associé à un silence. C ’est la dernière option que nous avons le plus souvent choisie.

Méthodologie ... (suite) Segmentation en graphèmes et phonèmes
ch.e.f. /S.E.f./ c.l.e.f. /k.l.e.-./ p.i.e.d. /p.i.e.-./ Décompte de la fréquence des associations GP ch.e.f. /S.E.f./ [CH, /S/]++ [E, /E/]++ [F, /f/]++ La seconde étape, consiste à segmenter chacune des formes orthographiques et phonologiques du corpus en graphèmes et phonèmes. Dans nos analyses, un programme informatique a été écrit pour effectuer cette segmentation de manière à assurer la plus grande systématicité de codage possible. Les analyses perdraient en effet beaucoup de leur valeur si les segmentations étaient inconsistantes d ’un mot à l ’autre (par exemple EF en un graphème dans CLEF par analogie avec CHEF mais ED en deux graphèmes dans PIED).  L ’étape finale est celle du décompte. Pour chaque mot du corpus, la forme orthographique segmentée en graphèmes et la forme phonologique segmentée en phonèmes, sont parcourues de gauche à droite. Chaque fois qu’une certaine association entre graphème et phonème est rencontrée, sa valeur de fréquence est augmentée de 1.

Estimations de la régularité GP
Une fois le décompte effectué, des estimations de la régularité non seulement dichotomiques mais aussi graduelles peuvent être dérivées. Ainsi, si l’on se fie à nos tables, le graphème Ceiy n’a qu’une prononciation, /s/ qui apparaît dans 44 mots. Le graphème C en a 3, /k/ comme dans COUP qui apparaît dans 165 mots, silence comme dans CLERC qui apparaît dans 12 mots et g qui n’apparaît que dans un seul mot monosyllabique, ZING.  Ces différentes valeurs de fréquence d ’association permettent d ’établir la prononciation régulière pour chaque graphème. C ’est simplement l ’associé le plus fréquent d ’un graphème, soit /s/ pour Ceiy et /k/ pour C.  Ces valeurs de fréquence permettent également la dérivation de diverses estimations graduelles de la régularité. Une seule est décrite ici, la probabilité de l’association entre graphème et phonème. Elle mesure la probabilité qu’un graphème donné soit prononcé par un certain associé phonémique. Ici, on voit que la prononciation /s/ de Ceiy est parfaitement prédictible alors que la prononciation /k/ de C bien que très probable n ’est pas parfaitement prédictible.

Etudes empiriques Venons-en aux expériences qui tirent parti de ces analyses. La plupart utilisent une tâche de dénomination, de mots, et plus souvent de non-mots reconnus pour solliciter de manière maximale les systèmes de transcodage.

Dénomination Dénomination immédiate * Scores de différence
dilve Scores de différence Latences immédiates - différées  temps pour le transcodage Dénomination différée * dilve Voici comment les choses se déroulent pour chaque participant dans ce type de tâche: un signal puis un écran blanc puis un mot ou un non-mot apparaissent au centre d ’un écran d ’ordinateur. Le participant a pour consigne de dénommer, c ’est à dire lire à voix haute, le mot le plus rapidement possible, sans faire d’erreur.  Comme cette tâche présente l’inconvénient d ’une part d’ inclure des temps de traitement liés à la programmation articulatoire et d ’autre part de refléter d’éventuelles différences de sensibilité du micro au premier son prononcé (une sifflante comme S est connue pour déclencher le micro avec retard), traditionnellement on présente également les mêmes items dans une tâche de dénomination différée pour mesurer l ’impact de ces deux facteurs sur les effets observés. Ici, le participant voit un signal puis un mot apparaître au centre de l’écran mais il a pour consigne de ne pas dénommer le mot immédiatement mais d’attendre un signal de réponse pour le faire.  Des scores de différence sont alors calculés en soustrayant les temps de dénomination différée aux temps de dénomination immédiate de manière à atteindre une meilleure estimation des variations dans la performance induites par le transcodage. Deux expériences exploratoires ont été menées avec ce type de paradigme pendant mon séjour à Cambridge. Elles montrent un effet de la régularité des associations GP en dénomination de mots ainsi qu’une contribution significative de la valeur moyenne de probabilité des associations graphème-phonème, au-delà de la catégorie de régularité, sur ces mêmes temps.

Entropie moyenne de graphèmes
Manipulation Entropie de graphème = estimation de l’incertitude de la prononciation de chacun des graphèmes de la langue. Matériel Pseudomots monosyllabiques français de valeurs d’entropie moyenne de graphèmes élevée (GATTE) ou faible (VATTE). Elles ont été complétées à mon retour à Bruxelles par une troisième expérience qui évalue l ’effet de la manipulation de l’entropie moyenne de graphèmes d ’un non-mot. Cette variable, que je n’ai pas encore présentée donne une estimation de l’incertitude de la prononciation du graphème. Sa valeur augmente en fonction du nombre d’associés phonémiques et de la similarité des valeurs de probabilité d ’association de ces différents associés. Plus concrètement, elle vaut 0 quand un graphème n’a qu’une association de probabilité 1, elle est maximale quand les différentes prononciations d ’un graphème sont équiprobables. Le matériel est composé de non-mots qui ont pour moitié des valeurs moyenne d ’entropie de graphèmes élevées parce que le non-mot contient une association régulière mais non systématique (comme celle du G vers /g/ dans GATTE) et pour moitié des valeurs faibles parce le non-mot contient une association régulière et systématique (comme celle du V dans VATTE).

GATTE plus lent que VATTE
Entropie, résultats Effet significatif de l’entropie (incertitude) moyenne de graphèmes GATTE plus lent que VATTE Associations simples au lieu de règles. Notre manipulation donne les résultats suivants: quand on compare les temps de dénomination pour deux listes de non-mots, comparables par rapport à une série de caractéristiques orthographiques, mais de valeurs moyennes d’entropie de graphème soit élevée pour des non-mots comme GATTE, soit faible pour des non-mots comme VATTE, on observe que les premiers sont dénommés plus lentement. Nous statuons que cet effet du degré d ’incertitude de la prononciation de graphèmes réguliers remet en question l ’hypothèse de règles et ne peut être expliqué qu ’en faisant au moins l ’hypothèse d ’associations simples, avec une efficacité de la traduction d ’un graphème variable en fonction de la prédictibilité de sa prononciation la plus fréquente.  A noter, 30% des erreurs de prononciation produites dans cette expérience sont des erreurs d ’assignation des correspondances où une association minoritaire du graphème est donnée en lieu et place de l ’association régulière attendue. Ceci pourrait indiquer que les associations sont multiples plutôt que simples. A noter 30% des erreurs de prononciation sont des erreurs d’assignation de correspondance (CLYPHE lu SLYPHE).

Activation des associations minoritaires d’un graphème?
Paradigme de détection de lettres de Ziegler & Jacobs (1995): détecter une lettre dans un non-mot brièvement présenté puis masqué. J GEU ##### La quatrième expérience s ’efforce de l ’établir en montrant des traces claires de l ’activation des associés phonémiques les moins fréquents d ’un graphème lors du transcodage. Elle utilise une tâche de détection de lettres introduite par Ziegler et Jacobs. Dans ce type de tâche, une lettre apparaît au centre de l ’écran d ’ordinateur, puis un mot, rapidement remplacé par un masque visuel. Il s ’agit pour le participant de décider si la lettre était présente dans le mot brièvement affiché puis masqué en poussant le plus rapidement possible sur un des deux boutons de réponse (un pour la réponse oui, lettre présente, l ’autre pour la réponse non, lettre absente). Ziegler et collaborateurs ont montré que, si la lettre est absente du non-mot, les participants font plus de détections erronées de la lettre quand le non-mot sonne comme un mot qui contient cette lettre. Par exemple, s ’ils doivent détecter J dans G,E, U, lu GEU par comparaison avec un autre non-mot de similarité orthographique comparable par rapport à JEU qui contient la lettre. Notre expérience se base sur ce résultat ainsi que sur celui de Peereman montrant des prononciations BONJOUR de BONGOUR pour introduire une distinction entre des non-mots homophones-par-règle et homophones-par-association.  Les non-mots homophones-par-règles sont des non-mots qui sont homophones d ’un mot français lorsqu ’ils sont traduits par les correspondances graphème-phonème régulières du français. Les non-mots homophones-par -association sont des non-mots qui sont homophones d ’un mot français lorsqu ’ils sont traduits par n ’importe quel associé phonémique d ’un graphème. Suivant l ’hypothèse de règles ou d ’associations simples, seul GEUDI est susceptible de produire une effet d ’homophonie. Suivant l ’hypothèse d ’associations multiples, à la fois GEUDI et BONGOUR sont susceptibles de produire un tel effet, car pour les deux non-mots, le phonème /j/ est partiellement activé lors du transcodage, comme une association dominante dans GEUDI, comme une association minoritaire dans BONGOUR. Classiquement, désavantage de l’homophonie.

Homophone par association
Résultats Temps de décision Voici le résultat important: Pour les latences de réponse correctes (non la lettre n ’était pas présente), les participants présentent un désavantage de l ’homophonie pour les deux types de chaînes, homophones par règles et par association. Les participants trouvent plus difficile de décider que J est absent de BONGOUR que de BONDOUR. Ce résultat est incompatible avec l ’hypothèse de règles ou d ’associations simples qui supposent que G dans BONGOUR ne va jamais activer sa prononciation minoritaire /j/. Au contraire, puisque par construction BONGOUR et BONDOUR sont équivalents en termes de similarité orthographique à BONJOUR qui contient le J, la différence observée dans leurs temps de décision ne semble pouvoir s ’expliquer que par l ’activation partielle au cours du transcodage phonologique de l ’association /j/ de J venant renforcer l ’indécision quant à l ’absence de J dans la chaîne. Bref, combinées, les deux expériences remettent en question la proposition de Coltheart et collègues d ’une représentation des relations orthographe-son par un répertoire de règles où seul l’associé phonémique le plus fréquent est représenté. Elles appuient au contraire fortement l ’hypothèse d ’une représentation de ces relations par un système d ’associations multiples dans lequel un phonème active toutes ses associations avec une force variable dépendant de sa prédictibilité dans la langue. Homophone par règle Homophone par association J? GEUDI-BEUDI BONGOUR-BONDOUR

Processus Voici pour notre contribution à la question des représentations. Tournons nous maintenant vers celle des processus.

Transcodage lettre-après-lettre?
Position de Coltheart et collègues: Effet de longueur en faveur d’un transcodage séquentiel. Effet de complexité graphémique en faveur d’un transcodage lettre-après-lettre. F OO PH (5 l., 2 gr. complexes) plus lentement que S P U R F (5 l., gr. simples) Ici, l ’hypothèse spécifiquement évaluée est celle d ’un transcodage par traduction lettre-après-lettre d ’une chaîne de caractères. Cette hypothèse, défendue par Coltheart et son équipe, trouve son origine dans deux faits expérimentaux. Le premier fait correspond aux effets de longueur fréquemment rapportés dans la littérature. Au plus une chaîne compte de lettres, au plus il faut de temps pour la dénommer. Ces effets du nombre de lettres révéleraient l ’intervention d’un mécanisme séquentiel, parcourant la chaîne de gauche à droite, et nécessitant des temps de traitement d ’autant plus longs qu ’il y a d ’unités successives à traduire. Le second fait correspond aux effets de complexité graphémique récemment obtenus par Rastle et Coltheart: des non-mots de 5 lettres contenant des graphèmes multilettres comme PH pour lesquels la prononciation de la première lettre est différente de celle du graphème sont dénommés plus lentement que des non-mots de même nombre de lettres ne contenant que des graphèmes simples. Pour Coltheart cet effet soutiendrait l ’hypothèse plus spécifique selon laquelle le transcodage opère à partir d’un décriptage lettre-après-lettre des chaînes de caractères car il impliquerait un mécanisme supposant que la première lettre puis le graphème sont successivement traduits, l ’activation temporaire d ’une prononciation erronée par la première lettre ralentissant les temps de dénomination.  Toutefois, une difficulté avec le lien dessiné par Rastle et Cotlheart entre les effets de complexité et un mécanisme lettre-à-lettre est que des graphèmes complexes comme PH sont souvent de moindre fréquence d’occurence dans la langue que des graphèmes simples comme R ou F. Il est possible que l’effet étiqueté comme un effet de complexité par Coltheart et collègues ne soit pas autre chose qu ’un effet de fréquence déguisé. Pour l ’établir, nous avons mené une série d ’expériences, toutes en français, évaluant la contribution de trois variables sur les temps de dénomination des non-mots. Ces trois variables sont la fréquence de graphème, la complexité graphémique à fréquence de graphème constante et l ’opacité graphémique à fréquence de graphème constante. Mais Valeurs de fréquence différentes pour les graphèmes complexes (ph) et simples (r, f).

Fréquence de graphème Question
Dans quelle mesure les variations de fréquence de graphème pourraient être responsables de l’effet observé par R&C? NUSE vs NUZE Effet de fréquence de graphème à complexité constante. La première étude que nous avons menée évaluait une influence de la fréquence de graphème sur les temps de dénomination de manière à déterminer dans quelle mesure les variations de fréquence moyenne de graphèmes entre non-mots graphémiquement simples et complexes pourraient être responsables de l’effet observé par Rastle et Coltheart.  Cette étude compare les temps de dénomination pour des non-mots contenant des graphèmes fréquents comme S à des non-mots contenant des graphèmes rares comme Z. Elle montre que les non-mots contenant des graphèmes fréquents sont dénommés significativement plus rapidement que ceux contenant des graphèmes rares. Ce résultat révèle donc qu’il est possible que la fréquence de graphème ait joué un rôle dans l ’effet observé par R&C.Pour le vérifier, nous avons effectué une réanalyse des données de ces derniers en introduisant la fréquence de graphème comme variable covariante de manière à statistiquement annuler la contribution de cette variable sur les temps de dénomination. Si, indépendamment d ’un rôle éventuel de la fréquence de graphème, l ’effet de complexité est bel et bien présent, on devrait observer un effet éventuellement ralentit mais de même signe. Contrairement à cette prédiction, on observe que l’effet de la complexité graphémique, négatif dans l ’étude de R&C, devient positif lorsqu ’on annule les variations de performances induites par les différences de fréquence de graphème. Ceci affaiblit grandement le lien établit par R&C entre les effets de complexité et le traitement lettre-à-lettre.

Complexité en français
Question Effet de la complexité indépendamment des effets induits par les différences en termes de fréquence de graphème? NURFE (gr. unilettres) NUPHE (gr. mult. div.) Effet inverse de la complexité graph. à fréquence de graphème comparable. Pour conforter ce résultat, nous avons conduit de nouvelles expériences procédant à la même manipulation de la complexité que celle utilisée par R&C mais avec un matériel choisi pour ne pas présenter de différence en termes de fréquence de graphème entre les non-mots graphémiquement simples et complexes.  Deux expériences ont été menées. Elles utilisent une manipulation de la complexité reposant sur une comparaison entre des non-mots de 5 lettres contenant 0 ou 1 graphème complexe, soit des items comme NURFE et NUPHE. Si l ’effet de complexité observé par R&C trouve son origine dans le traitement lettre-à-lettre et non dans les différences de fréquence entre listes, on devrait trouver comme eux un effet inhibiteur de la complexité. Contrairement à cette prédiction, nous avons trouvé que les non-mots contenant un graphème complexe comme PH sont lus plus rapidement plutôt que plus lentement que les non-mots de même longueur ne contenant que des graphèmes simples. Cet effet inversé remet cette fois fortement en question l ’hypothèse d ’un mécanisme lettre-à-lettre. Toutefois, toute conclusion définitive est rendue difficile par le fait que la manipulation utilisée entraîne une variation simultanée du nombre de phonèmes à articuler puisque RF compte deux phonèmes alors que PH n ’en compte qu ’un. Pour écarter une influence possible du nombre de phonèmes de nos interprétations, nous avons introduit une nouvelle manipulation, celle de l ’opacité.

Complexité et opacité /f/ Opacité Activation /f/ Complexité /p/ /f/
Commençons par distinguer clairement les manipulations de la complexité et de l ’opacité. Le graphe présente les phonèmes activés pour la seconde lettre d’un groupement de lettres. Trois types de séquences de deux lettres sont considérées, un graphème multilettre divergent comme PH, un bigramme formé de deux graphèmes simples comme RF, et un graphème multilettre convergent comme FF. L ’axe vertical montre les valeurs d ’activation des phonèmes. Comme nous l ’avons déjà vu, la manipulation de la complexité correspond à une comparaison entre graphème multilettre divergent et séquence de deux graphèmes simples. Pour un graphème multilettre divergent comme PH, il y a traduction de PH en phonème /f/ pour une position phonémique pour laquelle /p/ était préalablement activé. Bien que la nouvelle activation remplace rapidement l’ancienne, l ’activation temporaire d ’un phonème incorrect ralentit la montée en activation du phonème correct /f/. Par comparaison, pour une séquence de deux graphèmes simples comme RF, le graphème F est traduit en /f/ dans une position phonémique nouvelle dans laquelle il n’y a encore eu activation d’aucun phonème. Comme le traitement lettre à lettre induit une compétition dans le premier cas mais pas dans le second, des temps de dénomination plus lents sont attendus pour les graphèmes complexes que pour les graphèmes simples  La manipulation de l ’opacité correspond à une comparaison entre graphème multillettre divergent et convergent. Pour un graphème multilettre convergent comme FF, il y a activation temporaire du phonème /f/ pour une position phonémique pour laquelle ce phonème était déjà partiellement actif. Ceci accélère la montée en activation de ce dernier. Dans un mécanisme lettre-à-lettre, l’effet d ’opacité prédit est au moins aussi grand que l ’effet de complexité rapporté par Rastle et Coltheart puisqu’il inclut une composante facilitatrice en plus de la composante inhibitrice responsable de l ’effet de complexité. /f/ p h r f f f Graph. mult. div. (f oo ph) 2 gr. simples (s p u r f) Graph. mult. conv. (p o ff e)

Opacité en français Question
Effet d’opacité graphémique, conforme aux prédictions d ’un mécanisme lettre-à-lettre? NUPHE (gr. mult. div.) NUFFE (gr. mult. conv.) Effet d’opacité. Mais, 25 msec avec NUTTE, 0 msec avec NUTHE. Une nouvelle étude cherche donc à confronter l ’effet d ’une manipulation de l ’opacité graphémique aux prédictions d ’un mécanisme lettre-à-letre.  Cette étude compare les temps de dénomination pour des non-mots comme NUPHE contenant un graphème multilettre divergent à des non-mots comme NUFFE contenant un graphème multilettre convergent. Cette fois, l ’effet prédit par un mécanisme lettre-à-lettre est observé: des non-mots comme NUPHE avec PH sont dénommés plus lentement que des non-mots comme NUFFE avec FF. Cependant, une analyse fine du matériel indique que cet effet n ’est présent que dans le cas bien spécifique où les deux lettres formant un graphème multilettre convergent vers la prononciation correcte de celui-ci. L ’effet n ’est pas présent lorsque le non-mot contient un graphème multilettre comme TH où l ’associé de la seconde lettre est différent de celui du graphème. Cette différence entre TT et TH n ’est pas prédite par le mécanisme de traitement lettre-à-lettre (décrit précédemment) qui suppose que la deuxième lettre est accolée à la précédente et non traduite au cours de la conversion. Elle suggère au contraire que la deuxième lettre du graphème est aussi traduite, entraînant l ’activation d ’un phonème erroné qui ralentirait la montée en activation du phonème correct. On pourrait envisager d ’expliquer ce résultat ainsi que les précédents par l ’hypothèse défendue par certains auteurs d ’une traduction simultanée de toutes les lettres d ’une chaîne de caractères. Pour expliquer l ’effet facilitateur de la complexité observé dans l ’expérience précédente, on supposerait alors que pour un graphème comme PH, le bénéfice de la co-détermination lié au fait que chacune des deux lettres active partiellement la prononciation correcte /f/, serait plus élevé que le coût de la divergence lié au fait que chacune des lettres active aussi partiellement sa prononciation spécifique, /p/ pour l ’un et /h/ pour l ’autre. Certains psycholinguistes considèrent cependant cette hypothèse d ’un transcodage simultané de toutes les lettres comme improbable car incapable de rendre compte des effets de longueur rapporté dans diverses études. Mais la majorité de ces études manipulant la longueur ne contrôlent pas les listes expérimentales pour la fréquence de graphème ou la composition graphémique, or nous venons de montrer que ces deux variables ont une influence sur les temps de dénomination. Il est dès lors possible d ’envisager que les effets de longueur soient eux aussi artefactuels.

Longueur Question Pas d ’effet de longueur à fréquence de graphème et composition graphémique constante? NUFE 166 msec NURFE 199 msec DRISME 244 msec Effet de la longueur. NUFE (gr. simples) NUFFE (gr. conv.) Effet de la longueur spécifiquement en lettres de 9 msec Afin d ’évaluer cette possibilité, deux nouvelles études ont été menées, manipulant la longueur cette fois à composition graphémique constante.  Dans la première étude, les graphèmes multilettres sont tout simplement évités. On compare des non-mots de 4 lettres- 4 graphèmes à des non-mots de 5 lettres-5 graphèmes et des non-mots de 6 lettres et 6 graphèmes. On trouve, sur les scores de différences, une augmentation linéaire des temps de dénomination en fonction de la longueur, établissant la réalité de cet effet en dehors de variations de la fréquence ou de la composition graphémique. Toutefois, cette manipulation présente l ’inconvénient de confondre longueur en lettres et longueur en phonèmes puisque les mots qui comptent le plus de lettres sont aussi ceux qui comptent le plus de phonèmes à prononcer. Pour écarter de manière encore plus décisive une origine artefactuelle des effets de longueur, nous avons introduit unenouvelle manipulation qui n ’entraîne pas de différence de longueur en phonèmes.  Pour cela, nous avons comparé NUFE et NUFFE, à savoir deux non-mots qui comptent le même nombre de phonèmes mais une lettre de différence. En réalité, il s ’agit du test le plus contraignant que l ’on puisse imaginer car la présence dans la condition la plus longue d ’ un graphème multilettre convergent qui produit un effet facilitateur sur les temps de dénomination, va à l ’encontre de nos prédictions. En dépit de ces contraintes extrêmes, nous avons à nouveau trouvé un effet de la longueur, ici spécifiquement en lettres. Comme nous l ’avons précédemment établi, un tel effet n ’est pas prédit par l ’hypothèse d ’une traduction simultanée de toutes les lettres d ’une chaîne. Bref, si les effets relatifs à la complexité remettent fortement en question l’hypothèse d’un transcodage strictement lettre-à-lettre et suggèrent qu ’il y a traduction de chacune des lettres formant un graphème multilettre, les effets de longueur remettent en cause l’hypothèse opposée introduite par certains auteurs d’un traitement simultané de toutes les lettres d’une chaîne pour en dériver la prononciation. Ils signeraient, au contraire, l ’intervention d’une composante séquentielle, parcourant le mot de gauche à droite, lors du transcodage. Ce pourrait, par exemple, être un mécanisme de refixation occulaire qui traduit simultanément les lettres d ’une séquence par groupes successifs de 3 ou 4 lettres.

Conclusions générales
Objectif Réduire la grande diversité des hypothèses théoriques relatives aux représentations et processus impliqués dans le transcodage d’une chaîne en sa phonologie. Construction d’un outil Analyse des associations graphème-phonème du français et de l’anglais. En conclusion, l ’objectif de ce travail était de réduire la grande diversité des hypothèses théoriques actuelles en évaluant certaines des hypothèses relatives aux représentations et processus impliqués dans le transcodage d ’une chaîne de caractères en sa phonologie.  Une première étape a consisté en la réalisation d ’analyses statistiques des associations graphème-phonèmes du français et de l ’anglais. J ’ai ensuite tiré partie de ces analyses pour réaliser deux séries d ’expériences.

Conclusions ... (suite) Représentations des relations orthographe-son
Effet de l’incertitude (probabilité, entropie) de la prononciation d’un graphème en dénomination  associations simples. Désavantage de l’homophonie pour des homophones-par-association comme BONGOUR dans une tâche de détection de lettre  associations multiples. Réseau d’associations multiples plutôt que répertoire de règles. La première série d ’expériences adressait la question de la nature des représentations des relations orthographe-son utilisées lors du transcodage d ’une chaîne de caractères en sa prononciation. Dans deux expériences menées en anglais et en français j ’ai montré un effet de l ’incertitude de la prononciation d ’un graphème sur les latences de dénomination. J ’ai conclu que de tels résultast impliquaient une représentation de la force des associations dans le système de règles. Dans une quatrième expérience, utilisant une tâche de détection de lettre, j ’ai mis en évidence un désavantage de l ’homophonie pour des homophones-par-association comme bongour. J ’ai affirmé que celui-ci ne pouvait s ’expliquer que par l ’activation d ’une association minoritaire au cours du transcodage. Et j ’ai conclu qu ’ensemble, ces différents résultats montraient que contrairement à la position défendue par Coltheart et collègues, la connaissance des relations orthographe-son utilisée par les lecteurs pour la traduction d ’une chaîne en sa phonologie devait être conçue comme un réseau d ’associations multiples plutôt que par un répertoire de règles.

Conclusions ... (fin) Processus de transcodage
Absence d’effet de complexité à fréquence de graphème comparable  pas lettre-à-lettre. Effet nul de l’opacité lorsque la seconde lettre induit une prononciation erronée (TH). Eventuellement, traduction simultanée de toutes les lettres d ’une chaîne. Mais effet de longueur spécifiquement en lettres  composante séquentielle. Traduction de toutes les lettres qui forment un graphème multilettre mais avec une composante séquentielle. La seconde série d ’expériences adressait la question de la nature du processus de transcodage. Différentes manipulations soit de la composition graphémique, soit de la longueur ont été utilisées pour évaluer la pertinence de l ’hypothèse d ’un transcodage lettre-à-lettre. Avec les manipulations de la fréquence et de lacomplexité graphémique, j ’ai trouvé que l ’effet de complexité sur lequel se basent Coltheart et collègues pour défendre l ’idée d ’un traitement lettre-à-lettre était induit par les différences de fréquence entre graphèmes simples et complexes et non à la présence de graphème complexe . Avec une manipulation de l ’opacité graphémique, l ’ effet nul de l ’opacité lorsque la seconde lettre induit une prononciation erronée (TH) m ’a conduit à définitivement rejetter l ’hypothèse d ’un processus spécifiquement lettre-à-lettre. J ’ai envisagé pour un temps qu ’il pourrait marquer une traduction simultanée de toutes les lettres d ’une chaîne. Toutefois, l ’obtention d ’effets de longueur spécifiquement en lettres m ’a conduit à remettre en cause cette dernière hypothèse et à privilégier plutôt un mécanisme qui parcourt un mot de gauche à droite par refixation de suites de trois ou quatre lettres. Ces deux séries d ’expériences demandent bien sûr à être poursuivies de manière à spécifier de manière encore plus précise les représentations et processus impliqués dans le transcodage. Je vous remercie de votre attention

De l’orthographe à la prononciation: Nature des processus de conversion graphème-phonème dans la reconnaissance des mots écrits Marielle Lange Merci Monsieur.

Présentations similaires

Présentation au sujet: "De l’orthographe à la prononciation: Nature des processus de conversion graphème-phonème dans la reconnaissance des mots écrits Marielle Lange Merci Monsieur."— Transcription de la présentation:

Présentations similaires

Notre projet

Feed-back

Entrer

S'autoriser via un réseau social:

De l’orthographe à la prononciation: Nature des processus de conversion graphème-phonème dans la reconnaissance des mots écrits Marielle Lange Merci Monsieur.

Présentations similaires

Présentation au sujet: "De l’orthographe à la prononciation: Nature des processus de conversion graphème-phonème dans la reconnaissance des mots écrits Marielle Lange Merci Monsieur."— Transcription de la présentation:

Présentations similaires

Notre projet

Feed-back