La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Traitement Automatique des Langues appliqué à l’Acquisition du Langage Apports d’une pluridisciplinarité Luiggi SANSONETTI EA 2290 SYLED – EA 170 CALIPSO.

Présentations similaires


Présentation au sujet: "Traitement Automatique des Langues appliqué à l’Acquisition du Langage Apports d’une pluridisciplinarité Luiggi SANSONETTI EA 2290 SYLED – EA 170 CALIPSO."— Transcription de la présentation:

1 Traitement Automatique des Langues appliqué à l’Acquisition du Langage Apports d’une pluridisciplinarité Luiggi SANSONETTI EA 2290 SYLED – EA 170 CALIPSO Colloque International APLIC – 25/26 Juin 2004 – Paris

2 Colloque International APLIC Paris, 25-26 Juin 20042 Plan 1. Corpus utilisés1. Corpus utilisés 2. Repérage automatique des reprises et reformulations2. Repérage automatique des reprises et reformulations 3. Etiquetage morphosyntaxique3. Etiquetage morphosyntaxique 4. Evolution du langage et ajustement des locuteurs4. Evolution du langage et ajustement des locuteurs 5. Limites de l’automatisation de certaines tâches et « remèdes » possibles5. Limites de l’automatisation de certaines tâches et « remèdes » possibles

3 Colloque International APLIC Paris, 25-26 Juin 20043 Introduction Corpus d’interactions verbales adulte/enfantCorpus d’interactions verbales adulte/enfant –Enregistrement (K7, DAT, VIDEO) –Transcription (conventions suivant objectifs) –Analyses (grilles, courbes, tableaux) Logiciels et programmes informatiquesLogiciels et programmes informatiques –Correcteur orthographique (syntaxe, grammaire) –Statistique textuelle (lexicométrie, évolution du vocabulaire) –Traitement du signal (phonologie, prosodie)

4 Colloque International APLIC Paris, 25-26 Juin 20044 1. Corpus utilisés JulienJulien –3 dialogues de 5 ans 10 mois à 6 ans 4 mois –Transcriptions imprimées et sauvegardées sur disquette –Analyses, grilles, courbes, tableaux MathildeMathilde –3 dialogues de 4 ans 9 mois à 4 ans 11 mois –Transcriptions imprimées et sauvegardées sur disquette –Analyses, grilles, courbes, tableaux

5 Colloque International APLIC Paris, 25-26 Juin 20045 Extrait d’une transcription d’un autre corpus 1. Corpus

6 Colloque International APLIC Paris, 25-26 Juin 20046 Extrait d’une grille d’analyse 1. Corpus

7 Colloque International APLIC Paris, 25-26 Juin 20047 Exemple d’un tableau récapitulatif 1. Corpus

8 Colloque International APLIC Paris, 25-26 Juin 20048 Exemple d’un graphique d’évolution 1. Corpus

9 Colloque International APLIC Paris, 25-26 Juin 20049 2. Repérage automatique Logiciel utilisé :Logiciel utilisé : –Lexico3 (SYLED 2290 – A. Salem, W. Martinez, C. Lamalle, S. Fleury) http://www.cavi.univ-paris 3.fr/ilpga/ilpga/tal/lexicoWWW Corpus utilisés :Corpus utilisés : –Julien –Mathilde

10 Colloque International APLIC Paris, 25-26 Juin 200410 Phases de Préparation du corpus 2. Reprises et Reformulations

11 Colloque International APLIC Paris, 25-26 Juin 200411 Dictionnaire des formes 2. Reprises et Reformulations

12 Colloque International APLIC Paris, 25-26 Juin 200412 Carte des énoncés Qui parle Dialogue n° Enoncé n° Forme recherchée 2. Reprises et Reformulations

13 Colloque International APLIC Paris, 25-26 Juin 200413 Repérage des Feed-back 2. Reprises et Reformulations

14 Colloque International APLIC Paris, 25-26 Juin 200414 Repérage des tentatives 2. Reprises et Reformulations

15 Colloque International APLIC Paris, 25-26 Juin 200415 3. Etiquetage de l’oral Corpus utilisés :Corpus utilisés : –Julien –Mathilde Logiciels utilisés :Logiciels utilisés : –Cordial Université 6 (Synapse Developpement) http://www.synapse-fr.com –MkCorpus (CLA2T/SYLED – S. Fleury) http://www.cavi.univ-paris3.fr/ilpga/ilpga/sfleury/mkcorpusProject.htm

16 Colloque International APLIC Paris, 25-26 Juin 200416 Forme-Cat et Lemme-Cat 3. Corpus étiquetés

17 Colloque International APLIC Paris, 25-26 Juin 200417 Concordance des PREP 3. Corpus étiquetés

18 Colloque International APLIC Paris, 25-26 Juin 200418 Repérage Subjonctif 3. Corpus étiquetés

19 Colloque International APLIC Paris, 25-26 Juin 200419 4. Evolution et Ajustement Enoncés Adulte ad1-2 Enoncés Julien ju1-2 Enoncés Adulte ad1-3 Enoncés Julien ju1-3 JulienMathilde Enoncés Adulte ad2-2 Enoncés Julien ma2-2 Enoncés Adulte ad2-3 Enoncés Julien ma2-3

20 Colloque International APLIC Paris, 25-26 Juin 200420 Prep+VInf 4. Evolution et Ajustement

21 Colloque International APLIC Paris, 25-26 Juin 200421 Ajustement du langage 4. Evolution et Ajustement

22 Colloque International APLIC Paris, 25-26 Juin 200422 5. Limites de la recherche Peu de corpus et corpus trop petitsPeu de corpus et corpus trop petits Transcriptions et représentationsTranscriptions et représentations Etiquetage automatiqueEtiquetage automatique

23 Colloque International APLIC Paris, 25-26 Juin 200423 Mots inconnus 5. Limites

24 Colloque International APLIC Paris, 25-26 Juin 200424 Erreurs d’étiquetage 5. Limites « en fait » a trois étiquetages différents : – en fait_ADV (7 occurrences) uniquement dans le discours de l’adulte ; – en_PREP fait_NCMS (13 occurrences) ; – en_PREP fait_ADJMS (3 occurrences) uniquement en début d’énoncé avec le segment « madame Bodot » à la suite. « pour » : – pour (11 occurrences) en contexte « pour que_SUB » ; – pour_PREP (88 occurrences) dont une en contexte « pour_PREP que_SUB » ; – pour_NCMS (2 occurrences) dans les énoncés suivants : - […] elle l’amena des palmiers pour euh remettre sa / pour - euh on a que cinq doigts dans une main six comme les / pour les six pattes d’un insecte […].

25 Colloque International APLIC Paris, 25-26 Juin 200425 Merci luiggi.sansonetti@noos.frhttp://mapage.noos.fr/luiggi.sansonetti/


Télécharger ppt "Traitement Automatique des Langues appliqué à l’Acquisition du Langage Apports d’une pluridisciplinarité Luiggi SANSONETTI EA 2290 SYLED – EA 170 CALIPSO."

Présentations similaires


Annonces Google