Comment optimiser laide à la rédaction? S. Verlinde KU Leuven - ILT
enseigne- ment tempsrésultatarchivage dicos grammaires tempsrésultat apprentis- sage
Aide à la rédaction? 1 objectif – 2 composantes o aide lors de la production du texte > predictive writing aid o aide lors de la révision du texte > corrective writing aid (Ziyuan 2012) 3 langues – 1 site o utilisabilité/ergonomie: efficacité, efficience et satisfaction
Démo: predictive writing aid
Démo: corrective writing aid
Traitement des données
Analyse: suites de caractères … bien … Mais aussi: avions, entreprises, …
Analyse: motifs … Ver + Nom … Ver + Det + Nom Ver + Det + Adj + Nom Ver + Adv + Det + Nom Ver + Adv + Det + Adj + Nom Ver + Adv + Det + Adv + Adj + Nom … Nom + Ver
Analyse: parseur? Selon un article ce qu'est publiée il y a quelques semaines, 66pour cent des étudiants travaille comme Jobiste pendant l'été
Analyse: parseur?
Analyse: parseur? > Antidote 8
Analyse: analyse syntaxique de surface? Ouanalyse syntaxique superficielle shallow parsing identification des constituants dune phrase (groupes nominaux, verbe) sansstructure interne fonctions dans la phrase
Enrichissement: ressources Ressources TAL: Lefff, Dela Résultats danalyses de corpus: Google n-gram 92815dictionnaire Nom:Mas+SG
Enrichissement: ressources Ressources lexicographiques ex. verbes support
Enrichissement: ressources enseignement
Correcteur orthographique (nl.)
Comment sy prendre? Ressources TAL/lexicographiques: listes de formes (768385) Données diverses: listes dentités nommées, de sigles, … Listes derreurs fréquentes (enseignement) Règles dorthographe ex. régulier: peer > peren + sap > perensap paardenbloem, depuis le , auparavant: paardebloem unique: maan > *manen + schijn > maneschijn Règles de composition de mots (analyse de corpus) ex.apparaat + nom > 2: apparaatsnoer, apparaatskosten nom + apparaat > +370 mots composés defensie + nom > +110 mots composés nom + defensie > 1: milieudefensie aanbieding + nom > 0 Préfixes et suffixes + leur longueur Néologismes: mesttsunami Performances? Cf. Word
Correction derreurs lexicales: combinaisons de mots (fr.)
Comment sy prendre? Détection derreurs Correction des erreurs Espagne (Wanner, A. Ramos)Belgique synonymes traductions 1)mesure daffinité 2)mesure de contexte lexical 3)mesure de paramètres contextuels fonctions lexicales Melčuk 1)fréquence 2)mesure dassociation 3)fréquence * mesure dassociation
Fonctions lexicales: verbes support
Fonctions lexicales
Démarche inventaire verbes support (collocatifs - 233) + noms (bases - 673) T. Fontenelle Dafles Analyse de corpus673 bases * 233 collocatifs: fréquence + mesure dassociation Analyse linguistique structure prédicative des 673 bases identification de la fonction lexicale Programmation PHPIntégration des données
La touche finale… Informations contextuelles Google n-gram Programmation PHPappariement bases + collocatifs informations contextuelles Programmation PHPInterface utilisateur
Et le résultat?
Références bibliographiques Ferraro, G. - Nazar, R. - Wanner, L. (2011). Collocations: A Challenge in Computer-Assisted Language Learning. Heift, T. – Schulze, M. (2007). Errors and intelligence in computer-assisted language learning. Parsers and pedagogues. New York: Routledge. Leacock, C. - Chodorow, M. - Gamon, M. - Tetreault, J. (2010). Automated grammatical error detection for language learners. San Rafael : Morgan & Claypool. Verlinde, S. – Peeters, G. (2012). Data access revisited: The Interactive Language Toolbox. In S. Granger – M. Paquot (éds). Electronic Lexicography. Oxford: Oxford University Press. Wanner, L. – Alonso Ramos, M. – e.a. (2011). Annotation of collocations in a learner corpus for building a learning environment. eo_1_.pdf eo_1_.pdf