Développement d’un outil de cartographie automatique de texte d’aide à la compréhension de texte pour des apprenants dyslexiques Mario LAURENT, Thierry CHANIER Laboratoire de Recherche sur le Langage, Université Blaise Pascal et Logolexie/Médialexie L’intérêt d’utiliser des cartes (Apedys, 2012) Carte heuristique réalisée par un dyslexique Double voie de lecture Les dyslexiques ont de grandes difficultés à lire et à écrire. 5 à 8% de la population d’une classe d’âge est atteinte (INSERM, 2007). Chaque cas est différent : le diagnostic est différentiel et manque de normalisation (Jacquier-Roux et al., 2010). D’autres troubles du langage sont couramment associés comme la dysorthographie et la dyscalculie (Habib & Joly-Pottuz, 2008). Les dyslexiques souffrent de problèmes de décryptage ou de reconnaissance des mots et des lettres, bien qu'ils n'aient pas de problèmes cognitifs (Tanaka et al., 2011). L’activité de conversion de graphèmes à phonèmes consomme trop de mémoire de travail et les empêche d’accéder au sens d’un texte. Une vitesse de lecture minimale est nécessaire pour assurer l’intégration sémantique (Coirier et al. 96). Ces difficultés nuisent à leur parcours scolaire car, en France, l'apprentissage scolaire repose beaucoup sur les capacités de lecture et d'écriture, qui sont parfois des critères de sélection. Pour que les dyslexiques puissent suivre un cursus normal, il est nécessaire de leur proposer des outils adaptés. Conférence EIAH 2013 : 29, 30 & 31 Mai Université Paul Sabatier - Toulouse - IRIT Médialexie est une entreprise spécialisée dans l’aide aux personnes atteintes de troubles spécifiques du langage ou d’un handicap de communication. Son objectif est d’apporter des solutions logicielles. Médialexie commercialise une barre d’outils regroupant : Dictée vocale Synthèse vocale Ecriveur Prédicteur Le logiciel de Médialexie Des outils développés par la communauté de Traitement Automatique des Langues ont été adaptés pour aider les personnes atteintes de troubles du langage : Synthèse vocale, reconnaissance vocale, correction automatique, prédiction de mots et conception de cartes. L’efficacité de ces outils a été confirmée par plusieurs études (Hecker & Engstrom, 2007; MacArthur & Cavalier, 2004). On peut faciliter la compréhension d'un texte en fournissant son résumé au lecteur (Margarido et al., 2008; Nandhini & Balasundaram, 2011). Moins de mots = plus de disponibilité de mémoire de travail pour accéder au sens. D'autres astuces permettent de facilité la lecture : -Utiliser différentes couleurs ou sons - Augmenter l’espacement entre les lettres (Zorzi et al., 2012) Les outils d’aide et de remédiation Les élèves dyslexiques en difficulté dans leurs parcours scolaire Hypothèse : les dyslexiques ont une certaine affinité avec une organisation spatiale des idées. Solution : développement d’un nouvel outil, le LICI (Logiciel Intelligent de Cartographie Inversée). Public : élèves de collège Utilisation : importer un fichier texte ou copier/coller un texte et en obtenir en un clic une version schématique Résultat attendu : affichage des termes (entités nommées) les plus importants pour accéder au sens du texte et de liens entre eux, pouvant être d’ordre sémantique, spatial ou chronologique. Objectif : gagner du temps lors d’une activité de documentation ou en situation d’apprentissage d’une leçon L’interface sera simple, les éléments pourront être affichés un par un et lus par une voix de synthèse. Chaque utilisateur aura un profil permettant de sauvegarder ses préférences. Changer le mode de représentation : le LICI Au niveau technique, il existe plusieurs méthodes algorithmiques pour extraire les futurs termes de la carte à partir d'un texte. Nous appliquerons une chaîne de traitement : Pré-traitement : - segmentation en phrases et en mots - filtrage des mots vides et de la ponctuation - normalisation des mots. Sélection des termes importants par pondération : - Basée sur un corpus de référence avec Term Frequency- Inverse Document Frequency ou Okapi (Claveau & Raymond, 2012) - Ou alors, uniquement à partir du texte traité, avec par exemple la méthode Random Reflexive Indexing (Ghali et al., 2012) Chaîne de traitement Problématiques Ce travail est effectué dans le cadre d’un partenariat CIFRE entre le Laboratoire de Recherche sur le Langage et l’entreprise Médialexie. Nous sommes confrontés à une double problématique : Une mission au sein de l'entreprise : Développer un logiciel de schématisation automatique de textes pour aider les dyslexiques dans leurs apprentissages scolaires. Une question de recherche : Quelle représentation spatiale de l'information est la plus adaptée pour faciliter la compréhension de textes scolaires chez les dyslexiques ? Pour répondre à notre question de recherche et choisir une stratégie algorithmique adéquate, nous allons : -Demander à des dyslexiques de produire des cartes à partir de textes tirés d’un exemplier. Il est constitué de textes liés aux programmes scolaires de 6 ème ou 5 ème, issus de manuels scolaires libres (lelivrescolaire.fr, licence Creative Commons) et d'articles de Vikidia. - Mettre en place un questionnaire post-expérimentation pour connaître leurs familiarités/difficultés avec les cartes heuristiques. - Analyser leurs productions et déterminer empiriquement des caractéristiques saillantes. Perspectives/Expérimentation