Traitement Automatique des Langues appliqué à l’Acquisition du Langage Apports d’une pluridisciplinarité Luiggi SANSONETTI EA 2290 SYLED – EA 170 CALIPSO.

Slides:



Advertisements
Présentations similaires
Le contentieux dans le domaine du sport
Advertisements

Utilisation d'approches systémiques dans le développement de systèmes d'information cliniques Luc Mathieu, inf., DBA.
23 Octobre 2004 Présentation du tuning et du site
La place des holdings familiaux dans le non coté
GIS Incendies de Forêt, Colloque de Marseille, 1 décembre 2004
Le satellite HERSCHEL et son spectro-imageur infrarouge PACS…
L’alimentation: Chasse dans la Lagune, Carpaccio
Automatisation des processus dans IIJCan par François HARVEY (Programmeur-analyste)
Action Spécifique Observatoire Virtuel France
Atelier IDD Boîte à outils : site web de l'IDD - 30 avril ATELIER IDD 2004 Boîte à outils de lIDD « Site Web de lIDD » Par Philippe Feredj,
30/09/20041 QoS Quelques exemples des règles en vigueur dans divers pays européens Réunion QOSTIC Paris 30 septembre 2004 P-Y Hébert - AFUTT.
Paul de Deckker - Vème CONFRASIE - Siem Reap - 12 février L.M.D. 19 juin ministres européens de léducation réunis à Bologne signent une déclaration.
Ingénieurs 2000 – Année 2004/ Ludovic LELION
La motivation et la Délégation
Université Paris 3 La Dictée vocale SLFD Johanna Deron.
ANDRE Marine DABIN Julie WATERLOT Amandine
INTRODUCTION Définition : Cordial c’est un correcteur orthographique et grammaticaux des textes. Les pluspart des logiciels de traitement de texte possèdent.
Les outils du TAL Par RIGAUD Anaïs RALLIER Armelle SANTIAGO Gwendoline
Outil de statistique textuelle FALLET Justine CRUAUD Marion
Sémantique et Corpus, Toulouse, juin La sémantique des connecteurs: de lanalyse manuelle à lanalyse automatisée de corpus Liesbeth Degand FNRS/Université
PREVENTION DE L’ILLETTRISME
IAE PARIS - DESS CAAE MBA Systèmes d'information -Janvier Cas « réservations hôtelières » Partie 2 SYSTEMES DINFORATION AUBE FLEURY Laetitia ….
Cas « réservations hôtelières »
Le modèle entité / associations MCD (Modèle Conceptuel des Données)
Les flux en Méditerranée : les enjeux d’une interface
des élèves aujourd’hui ?
Travaux pratiques sur Nooj
"Appui institutionnel aux OP" Ouagadougou - Juin MODULE 1 : INTRODUCTION Avec quels types dOP ont travaillé les programmes dappui? En quoi les enseignements.
Exploration textuelle dinteractions verbales entre un adulte et un enfant avec Lexico3 Luiggi Sansonetti Université Paris 3 – ILPGA EA2290 – SYLED CLA2T.
25 janvier La nouvelle loi sur les ASBL Les conséquences pour lAAM et ses clubs.
PREMIER MINISTRE Direction du développement des médias La télévision numérique de terre 25 février « Perspectives économiques de la Télévision numérique.
ECHANGE RECTEUR / PARENTS - ACADEMIE DE STRASBOURG - 26 JANVIER 2004
Atelier de l'OMC sur les biens environnementaux
Information et documentation en milieu scolaire - HEG Genève, décembre La recherche des informations en milieu scolaire constats et propositions.
La mise en œuvre pratique du démarchage bancaire et financier
INRIA, Sophia Antipolis
RHRT 6 La Rochelle Juin De la logique technologique à la logique culturelle: questionner les études dusages Claire Bélisle IR CNRS LIRE Lyon Christine.
Les bases de l’assouplissement
Approche lexicométrique de corpus de dialogues adulte-enfant
Représentation du Thésaurus MeSH et de la Terminologie CISMeF en OWL
Détection de défaut par filtrage numérique
Etre performants ensemble
Projet « IMPEC : EDF et changement climatique » ( )
La Classification
Corpus parallèles et textométrie
Projets GEV : avancements 28 mai Conception et développement doutils dauto-évaluation et de mise à niveau en mathématiques projets GEV:avancements.
31 mars Le contrôle de l exécution des lois de finances Les objectifs : pour faire quoi ? pour qui ? Le contenu Le rôle de l ISC : l organisation.
Amaury Daele FUNDP – DET – Belgique 20 janvier 2004
Benoît Misset Réanimation Polyvalente Hôpital Saint-Joseph Paris
30/09/20041 Colloque ANAES-FSM du 30 septembre 2004 Les actes à risques sérieux De quoi s agit-il ? Les enjeux de santé publique Direction générale de.
Dépt. de Physique Théorique
Forum des Industries de la Langue, 17 mars 2010
UMB/DLADL - CS Les CLES pour ouvrir sur des politiques plurilingues à luniversité Claude Springer Université Marc Bloch Strasbourg
Étude de Modulateurs à Electroabsorption (MEAs) pour la conversion de longueur d’onde à haut débit (40Gbit/s) A.Védadi(1,5), N. El Dahdah(1,2), K. Merghem(1),
Analyses statistiques pour la détection de tendances ou de ruptures dans le régime des crues et sécheresses en France Co-financement EDF Insertion dans.
Journée des thèses, mai Analyses statistiques pour la détection de tendances ou de ruptures dans le régime des crues et sécheresses en France.
Contribution de APC au développement de matrices de bolomètres
JOURNÉES PROFESSIONNELLES DES DOCUMENTALISTES DE L’ACADÉMIE DE LYON
Stage Air Liquide Richemont
Paul-Émile Séguin FPE UQAM, Octobre 2004.
L’impact de la globalisation sur les ressources en TI 30 mars 2004 André Nadeau Vice-président exécutif et chef de la direction stratégique.
Journée Technique - 23 septembre 2004
"Appui institutionnel aux OP" Ouagadougou - Juin INTRODUCTION AU MODULE 2 : Les programmes d’appui aux OP ont-ils contribué à améliorer les relations.
الجريدة التربوية الالكترونية ترحب بكم blogspot
Enumération des permutations à motif exclu
Soutenance de projet de fin d'études
DEAT - DST - UAD Le nouveau paysage de la certification Juin 2004 Le formateur langues dans.
10 millions de présumés coupables Loi pour la confiance dans l'économie numérique :
Comment l’enfant apprend à parler? Quelques éléments à partir de Bruner Données sur le langage – Angers le 5 janvier 2010.
ASTI PARTENA Les règlements européens en matière sociale : Quelles sont les règles applicables ? Luc Tilman Tournai le Bienvenue.
Transcription de la présentation:

Traitement Automatique des Langues appliqué à l’Acquisition du Langage Apports d’une pluridisciplinarité Luiggi SANSONETTI EA 2290 SYLED – EA 170 CALIPSO Colloque International APLIC – 25/26 Juin 2004 – Paris

Colloque International APLIC Paris, Juin Plan 1. Corpus utilisés1. Corpus utilisés 2. Repérage automatique des reprises et reformulations2. Repérage automatique des reprises et reformulations 3. Etiquetage morphosyntaxique3. Etiquetage morphosyntaxique 4. Evolution du langage et ajustement des locuteurs4. Evolution du langage et ajustement des locuteurs 5. Limites de l’automatisation de certaines tâches et « remèdes » possibles5. Limites de l’automatisation de certaines tâches et « remèdes » possibles

Colloque International APLIC Paris, Juin Introduction Corpus d’interactions verbales adulte/enfantCorpus d’interactions verbales adulte/enfant –Enregistrement (K7, DAT, VIDEO) –Transcription (conventions suivant objectifs) –Analyses (grilles, courbes, tableaux) Logiciels et programmes informatiquesLogiciels et programmes informatiques –Correcteur orthographique (syntaxe, grammaire) –Statistique textuelle (lexicométrie, évolution du vocabulaire) –Traitement du signal (phonologie, prosodie)

Colloque International APLIC Paris, Juin Corpus utilisés JulienJulien –3 dialogues de 5 ans 10 mois à 6 ans 4 mois –Transcriptions imprimées et sauvegardées sur disquette –Analyses, grilles, courbes, tableaux MathildeMathilde –3 dialogues de 4 ans 9 mois à 4 ans 11 mois –Transcriptions imprimées et sauvegardées sur disquette –Analyses, grilles, courbes, tableaux

Colloque International APLIC Paris, Juin Extrait d’une transcription d’un autre corpus 1. Corpus

Colloque International APLIC Paris, Juin Extrait d’une grille d’analyse 1. Corpus

Colloque International APLIC Paris, Juin Exemple d’un tableau récapitulatif 1. Corpus

Colloque International APLIC Paris, Juin Exemple d’un graphique d’évolution 1. Corpus

Colloque International APLIC Paris, Juin Repérage automatique Logiciel utilisé :Logiciel utilisé : –Lexico3 (SYLED 2290 – A. Salem, W. Martinez, C. Lamalle, S. Fleury) 3.fr/ilpga/ilpga/tal/lexicoWWW Corpus utilisés :Corpus utilisés : –Julien –Mathilde

Colloque International APLIC Paris, Juin Phases de Préparation du corpus 2. Reprises et Reformulations

Colloque International APLIC Paris, Juin Dictionnaire des formes 2. Reprises et Reformulations

Colloque International APLIC Paris, Juin Carte des énoncés Qui parle Dialogue n° Enoncé n° Forme recherchée 2. Reprises et Reformulations

Colloque International APLIC Paris, Juin Repérage des Feed-back 2. Reprises et Reformulations

Colloque International APLIC Paris, Juin Repérage des tentatives 2. Reprises et Reformulations

Colloque International APLIC Paris, Juin Etiquetage de l’oral Corpus utilisés :Corpus utilisés : –Julien –Mathilde Logiciels utilisés :Logiciels utilisés : –Cordial Université 6 (Synapse Developpement) –MkCorpus (CLA2T/SYLED – S. Fleury)

Colloque International APLIC Paris, Juin Forme-Cat et Lemme-Cat 3. Corpus étiquetés

Colloque International APLIC Paris, Juin Concordance des PREP 3. Corpus étiquetés

Colloque International APLIC Paris, Juin Repérage Subjonctif 3. Corpus étiquetés

Colloque International APLIC Paris, Juin Evolution et Ajustement Enoncés Adulte ad1-2 Enoncés Julien ju1-2 Enoncés Adulte ad1-3 Enoncés Julien ju1-3 JulienMathilde Enoncés Adulte ad2-2 Enoncés Julien ma2-2 Enoncés Adulte ad2-3 Enoncés Julien ma2-3

Colloque International APLIC Paris, Juin Prep+VInf 4. Evolution et Ajustement

Colloque International APLIC Paris, Juin Ajustement du langage 4. Evolution et Ajustement

Colloque International APLIC Paris, Juin Limites de la recherche Peu de corpus et corpus trop petitsPeu de corpus et corpus trop petits Transcriptions et représentationsTranscriptions et représentations Etiquetage automatiqueEtiquetage automatique

Colloque International APLIC Paris, Juin Mots inconnus 5. Limites

Colloque International APLIC Paris, Juin Erreurs d’étiquetage 5. Limites « en fait » a trois étiquetages différents : – en fait_ADV (7 occurrences) uniquement dans le discours de l’adulte ; – en_PREP fait_NCMS (13 occurrences) ; – en_PREP fait_ADJMS (3 occurrences) uniquement en début d’énoncé avec le segment « madame Bodot » à la suite. « pour » : – pour (11 occurrences) en contexte « pour que_SUB » ; – pour_PREP (88 occurrences) dont une en contexte « pour_PREP que_SUB » ; – pour_NCMS (2 occurrences) dans les énoncés suivants : - […] elle l’amena des palmiers pour euh remettre sa / pour - euh on a que cinq doigts dans une main six comme les / pour les six pattes d’un insecte […].

Colloque International APLIC Paris, Juin Merci