La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

ATALA Le présent document contient des informations qui sont la propriété de France Télécom. L'acceptation de ce document par son destinataire implique,

Présentations similaires


Présentation au sujet: "ATALA Le présent document contient des informations qui sont la propriété de France Télécom. L'acceptation de ce document par son destinataire implique,"— Transcription de la présentation:

1 ATALA Le présent document contient des informations qui sont la propriété de France Télécom. L'acceptation de ce document par son destinataire implique, de la part de ce dernier, la reconnaissance du caractère confidentiel de son contenu et l'engagement de n'en faire aucune reproduction, aucune transmission à des tiers, aucune divulgation et aucune utilisation commerciale sans l'accord préalable écrit de France Télécom R&D Un environnement de développement pour le TALN 15/12/2OO1 Christine Chardenon, FTR&D DMI/GRI

2 La communication de ce document est soumise à autorisation de France Télécom R&D France Télécom R&D Plan Critères de développement Architecture : applicatifs Architecture : le Cœur TALN Données linguistiques Livrables Conclusion

3 La communication de ce document est soumise à autorisation de France Télécom R&D France Télécom R&D Critères de développement Indépendance par rapport aux données linguistiques Robustesse Souplesse dutilisation Sorties multiples Tracabilité de chaque module Portabilité (C,C++ sous Solaris UNIX, LINUX, … WINDOWS) Modules paramétrables Stockage des résultats dans un graphe danalyse

4 La communication de ce document est soumise à autorisation de France Télécom R&D France Télécom R&D Architecture : applicatifs Serveur TALN Analyse thématique Abrégeur QA topotopo

5 La communication de ce document est soumise à autorisation de France Télécom R&D France Télécom R&D Architecture : le coeur Segmentation Analyse Minimale Chunking Analyse En Dépendance Graphe sémantique

6 La communication de ce document est soumise à autorisation de France Télécom R&D France Télécom R&D Segmentation Le 15/12/2001, à 11h30, ellemange une peche avec son couto. Fr (Le MOT)(15/12/2001 DATE)(, SEP) (à MOT)(11H30 HEURE)(, SEP) (ellemange MOT)(une MOT)(peche MOT)(avec MOT)(son MOT) (couto MOT)

7 La communication de ce document est soumise à autorisation de France Télécom R&D France Télécom R&D Analyse minimale Méthodes correctives Analyse Minimale Interprétation de segments Analyse morphologique Création dunité lexicale Analyse Lexicale Exact Utilisateur Correctif Traduction de Traits

8 La communication de ce document est soumise à autorisation de France Télécom R&D France Télécom R&D Analyse lexicale Correction phonétique Correction par réaccentuation pechecouto Accès exact une Pêche,NOM-FEMN-SING Pèche,VERB-1PRS-SING Pêché,VERB, PART-PAS … Couteau,NOM-MASC-SING couteaux,NOM-MASC-PL Une, DET-SING-FEMN une, PRN-SING-FEMN

9 La communication de ce document est soumise à autorisation de France Télécom R&D France Télécom R&D Analyse morphologique Affixation : indéscotchable, lyaktubu Compositionnelle : SchneeBrettGefahr éclatement ellemange Elle, PRN-SUJ-3PRS-FEMN Elle, PRN-OBJI-3PRS-FEMN Mange, VERB-3PRS Mangé, VERB-PART-PASS

10 La communication de ce document est soumise à autorisation de France Télécom R&D France Télécom R&D Analyse minimale : profil [[Corrections] ListeDesCorrections = "RéAccentuation","STOP", "CorrectionPhonétique","CorrectionParConcaténation","STOP", "CorrectionMorpho", "CorrectionTypographique", "STOP","CorrectionMorphoPrédictive", "STOP" ListeDesCorrectionsFormesCapitalisées = "RéAccentuation " FichierPourLaCorrectionMorphoPre = morphoPredFCorrection.ini PasDAnalyseTypoPourUnMotAyantUnNombreDeCaracteresStrictementInf erieurA = 5 FichierPourLaCorrectionMorpho = morphoFCorrection.ini [NomsPropres] CatégoriesDesMotsPouvantÊtreDesNomsPropresEnDébutDePhrase = "NOM" NomPropreAjoutésAuxAutresAnalyses = oui

11 La communication de ce document est soumise à autorisation de France Télécom R&D France Télécom R&D Analyse morpho-syntaxique Chunking … ellemange une peche avec son couto … Elle/elle/P mange/manger/V une/un/D pêche/pêche/N avec/avec/S son/mon/P couteau/couteau/N

12 La communication de ce document est soumise à autorisation de France Télécom R&D France Télécom R&D Analyse syntaxique Chunking … ellemange une peche avec son couto … Analyse en dépendance Chunking … ellemange une peche avec son couto … Elle/elle/P/1/SUJ(2) mange/manger/V/2 une/un/D/3/DET(4) pêche/pêche/N/4/OBJD(2) avec/avec/S/5/P(8) son/mon/PP/6/PP(7) couteau/couteau/N/7/GPN(2)

13 La communication de ce document est soumise à autorisation de France Télécom R&D France Télécom R&D Arbre de dépendance GS1 GV-PT, ID3(31), ( NOMBRE/SINGULIER GENRE/FEMININ PERSONNE/3PRS SUJ TRANSITIF/OUI OBJD ) Terminaux mange [ manger, ( PERSONNE/1PRS/3PRS CATEP/GV-PT TRANSITIF/OUI NOMBRE/SINGULIER ), ( us_eat) ] Fonction: SUJ (3),PRN-S, ID1(24), ( NOMBRE/SINGULIER GENRE/FEMININ PERSONNE/3PRS ) Terminaux elle [ je, ( PERSONNE/3PRS CATEP/PRN-S GENRE/FEMININ NOMBRE/SINGULIER ), ( ) ] Fonction: OBJD (3), GN-NC, ID10(32), ( NOMBRE/SINGULIER GENRE/FEMININ DETER ) Terminaux pêche [ pêche, ( CATEP/GN-NC GENRE/FEMININ NOMBRE/SINGULIER COR/REACC ), ( us_peach ) ] Fonction: DET(10),DET ID6(14), ( NOMBRE/SINGULIER GENRE/FEMININ ) Terminaux une [ un, ( CATEP/DET GENRE/FEMININ NOMBRE/SINGULIER ), ( ) ]

14 La communication de ce document est soumise à autorisation de France Télécom R&D France Télécom R&D Analyse en dépendance : profil [Dépendance_Fr] EnService = vrai FichierRègles = grammaireDep.txt NombreMaximumDeReglesAAppliquer = 300 ModeExtraction = faux CatégoriesPourLExtraction = "GN-NP" AnalyseAPartirDeTousLesGS1 = vrai SolutionsMultiplesàX% = 100

15 La communication de ce document est soumise à autorisation de France Télécom R&D France Télécom R&D Graphe sémantique Construction dun graphe à partir De larbre en dépendance syntaxique De données sémantiques décrivant prédicats et arguments us_eat(eating, objd=patient:food, suj=agent:animate, arg0=situation:action) eat peach entité Anap3s entité Eat(agent=a,patient=b)&Anap3s(entité=a)&peach(entité=b) agentpatient

16 La communication de ce document est soumise à autorisation de France Télécom R&D France Télécom R&D Données(1) SegmentationAnalyse Minimale Chunking Français xxx Anglais xxx Allemand xxx Espagnol x En cours Arabe x En cours Polonais xxx

17 La communication de ce document est soumise à autorisation de France Télécom R&D France Télécom R&D Données (2) Analyse en dépendance Données sémantiques thésaurus Français x appli x Anglais xx Allemand Espagnol Arabe Polonais x

18 La communication de ce document est soumise à autorisation de France Télécom R&D France Télécom R&D Livrables Exécutables (+ options dappels) Librairie dynamique Mode client serveur Choix des sorties ASCII XML

19 La communication de ce document est soumise à autorisation de France Télécom R&D France Télécom R&D Conclusion Evolution de larchitecture Exploitation de modèles de langage probabiliste Génération Lexicale Génération syntaxique Génération Sémantique

20 La communication de ce document est soumise à autorisation de France Télécom R&D France Télécom R&D Format Données Lexique eau, [o], N23, -PREPGOUV/DEF-NOM_SEM/NOM_CONC, eau_23,,,, eaux, [o], N20P, -NOM_SEM/NOM_CONC, eau_22,,,,


Télécharger ppt "ATALA Le présent document contient des informations qui sont la propriété de France Télécom. L'acceptation de ce document par son destinataire implique,"

Présentations similaires


Annonces Google