Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
Publié parAriane Robinet Modifié depuis plus de 10 années
1
Traitement Automatique des Langues appliqué à l’Acquisition du Langage Apports d’une pluridisciplinarité Luiggi SANSONETTI EA 2290 SYLED – EA 170 CALIPSO Colloque International APLIC – 25/26 Juin 2004 – Paris
2
Colloque International APLIC Paris, 25-26 Juin 20042 Plan 1. Corpus utilisés1. Corpus utilisés 2. Repérage automatique des reprises et reformulations2. Repérage automatique des reprises et reformulations 3. Etiquetage morphosyntaxique3. Etiquetage morphosyntaxique 4. Evolution du langage et ajustement des locuteurs4. Evolution du langage et ajustement des locuteurs 5. Limites de l’automatisation de certaines tâches et « remèdes » possibles5. Limites de l’automatisation de certaines tâches et « remèdes » possibles
3
Colloque International APLIC Paris, 25-26 Juin 20043 Introduction Corpus d’interactions verbales adulte/enfantCorpus d’interactions verbales adulte/enfant –Enregistrement (K7, DAT, VIDEO) –Transcription (conventions suivant objectifs) –Analyses (grilles, courbes, tableaux) Logiciels et programmes informatiquesLogiciels et programmes informatiques –Correcteur orthographique (syntaxe, grammaire) –Statistique textuelle (lexicométrie, évolution du vocabulaire) –Traitement du signal (phonologie, prosodie)
4
Colloque International APLIC Paris, 25-26 Juin 20044 1. Corpus utilisés JulienJulien –3 dialogues de 5 ans 10 mois à 6 ans 4 mois –Transcriptions imprimées et sauvegardées sur disquette –Analyses, grilles, courbes, tableaux MathildeMathilde –3 dialogues de 4 ans 9 mois à 4 ans 11 mois –Transcriptions imprimées et sauvegardées sur disquette –Analyses, grilles, courbes, tableaux
5
Colloque International APLIC Paris, 25-26 Juin 20045 Extrait d’une transcription d’un autre corpus 1. Corpus
6
Colloque International APLIC Paris, 25-26 Juin 20046 Extrait d’une grille d’analyse 1. Corpus
7
Colloque International APLIC Paris, 25-26 Juin 20047 Exemple d’un tableau récapitulatif 1. Corpus
8
Colloque International APLIC Paris, 25-26 Juin 20048 Exemple d’un graphique d’évolution 1. Corpus
9
Colloque International APLIC Paris, 25-26 Juin 20049 2. Repérage automatique Logiciel utilisé :Logiciel utilisé : –Lexico3 (SYLED 2290 – A. Salem, W. Martinez, C. Lamalle, S. Fleury) http://www.cavi.univ-paris 3.fr/ilpga/ilpga/tal/lexicoWWW Corpus utilisés :Corpus utilisés : –Julien –Mathilde
10
Colloque International APLIC Paris, 25-26 Juin 200410 Phases de Préparation du corpus 2. Reprises et Reformulations
11
Colloque International APLIC Paris, 25-26 Juin 200411 Dictionnaire des formes 2. Reprises et Reformulations
12
Colloque International APLIC Paris, 25-26 Juin 200412 Carte des énoncés Qui parle Dialogue n° Enoncé n° Forme recherchée 2. Reprises et Reformulations
13
Colloque International APLIC Paris, 25-26 Juin 200413 Repérage des Feed-back 2. Reprises et Reformulations
14
Colloque International APLIC Paris, 25-26 Juin 200414 Repérage des tentatives 2. Reprises et Reformulations
15
Colloque International APLIC Paris, 25-26 Juin 200415 3. Etiquetage de l’oral Corpus utilisés :Corpus utilisés : –Julien –Mathilde Logiciels utilisés :Logiciels utilisés : –Cordial Université 6 (Synapse Developpement) http://www.synapse-fr.com –MkCorpus (CLA2T/SYLED – S. Fleury) http://www.cavi.univ-paris3.fr/ilpga/ilpga/sfleury/mkcorpusProject.htm
16
Colloque International APLIC Paris, 25-26 Juin 200416 Forme-Cat et Lemme-Cat 3. Corpus étiquetés
17
Colloque International APLIC Paris, 25-26 Juin 200417 Concordance des PREP 3. Corpus étiquetés
18
Colloque International APLIC Paris, 25-26 Juin 200418 Repérage Subjonctif 3. Corpus étiquetés
19
Colloque International APLIC Paris, 25-26 Juin 200419 4. Evolution et Ajustement Enoncés Adulte ad1-2 Enoncés Julien ju1-2 Enoncés Adulte ad1-3 Enoncés Julien ju1-3 JulienMathilde Enoncés Adulte ad2-2 Enoncés Julien ma2-2 Enoncés Adulte ad2-3 Enoncés Julien ma2-3
20
Colloque International APLIC Paris, 25-26 Juin 200420 Prep+VInf 4. Evolution et Ajustement
21
Colloque International APLIC Paris, 25-26 Juin 200421 Ajustement du langage 4. Evolution et Ajustement
22
Colloque International APLIC Paris, 25-26 Juin 200422 5. Limites de la recherche Peu de corpus et corpus trop petitsPeu de corpus et corpus trop petits Transcriptions et représentationsTranscriptions et représentations Etiquetage automatiqueEtiquetage automatique
23
Colloque International APLIC Paris, 25-26 Juin 200423 Mots inconnus 5. Limites
24
Colloque International APLIC Paris, 25-26 Juin 200424 Erreurs d’étiquetage 5. Limites « en fait » a trois étiquetages différents : – en fait_ADV (7 occurrences) uniquement dans le discours de l’adulte ; – en_PREP fait_NCMS (13 occurrences) ; – en_PREP fait_ADJMS (3 occurrences) uniquement en début d’énoncé avec le segment « madame Bodot » à la suite. « pour » : – pour (11 occurrences) en contexte « pour que_SUB » ; – pour_PREP (88 occurrences) dont une en contexte « pour_PREP que_SUB » ; – pour_NCMS (2 occurrences) dans les énoncés suivants : - […] elle l’amena des palmiers pour euh remettre sa / pour - euh on a que cinq doigts dans une main six comme les / pour les six pattes d’un insecte […].
25
Colloque International APLIC Paris, 25-26 Juin 200425 Merci luiggi.sansonetti@noos.frhttp://mapage.noos.fr/luiggi.sansonetti/
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.