La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

1 Approches quantitatives de lextraction de ressources traductionnelles à partir de corpus parallèles Auteur : Maria ZIMINA-POIROT Thèse dirigée par André

Présentations similaires


Présentation au sujet: "1 Approches quantitatives de lextraction de ressources traductionnelles à partir de corpus parallèles Auteur : Maria ZIMINA-POIROT Thèse dirigée par André"— Transcription de la présentation:

1 1 Approches quantitatives de lextraction de ressources traductionnelles à partir de corpus parallèles Auteur : Maria ZIMINA-POIROT Thèse dirigée par André SALEM UNIVERSITÉ PARIS 3 SORBONNE NOUVELLE ÉCOLE DOCTORALE : Langage et langues Doctorat en Sciences du langage : 26/11/2004 1

2 2 Plan de lexposé Parcours… Ressources textuelles multilingues –Gestion, accès au contenu linguistique… –Domaines dapplication Textométrie multilingue –Un nouveau courrant de recherches interdisciplinaire… –Bilan sur les utilisations 26/11/2004 2

3 3 Parcours Etudes de lettres (Université Lomonossov, Moscou) –Philologie –Linguistique et langues modernes Information Technology for Linguists (Coventry University, UK) –Travail sur corpus de textes –Première approche de concordanciers parallèles Approches quantitatives de corpus parallèles (Université de la Sorbonne nouvelle – Paris 3) … 3

4 4 « Il est maintenant possible d enregistrer et de manipuler par ordinateur des masses pratiquement illimitées de textes… Compte tenu de l évolution récente en informatique, tout indique en effet que les traducteurs pourront bientôt accéder facilement à de très vastes corpus bilingues contenant leurs propres traductions et celles de leurs collègues. » ISABELLE Pierre et WARWICK-ARMSTRONG Susan (1993). « Les corpus bilingues : une nouvelle ressource pour le traducteur ». In Bouillon, P. et Clas, A. (Eds.), La traductique. Montréal : les presses de lUniversité de Montréal, pp /11/2004 4

5 5 Analyse de ressources textuelles multilingues Corpus de textes parallèles ou comparables Bi-textes numérisés Visualisations sélectives du contenu linguistique Sources : Web, archives de textes traduits… Outils de gestion : aligneurs, étiqueteurs et analyseurs syntaxiques… Moyens daccès au contenu linguistique : concordanciers parallèles, mémoires de traduction, lexiques de termes multilingues… État 1 État 2 État 3 26/11/2004 5

6 6 Traduction Lexicographie Terminologie Enseignement des langues étrangères Recherche dinformation multilingue … Corpus multilingues : domaines dapplication 26/11/2004 6

7 7 TRAITEMENT AUTOMATIQUE DE CORPUS MULTILINGUES Textométrie multilingue TEXTOMÉTRIE TRADUCTOLOGIE Ingénierie multilingue 26/11/2004 Alignement automatique Extraction de ressources traductionnelles 7

8 8 Exploration textométrique parallèle (étape 1) volet françaisvolet anglais fonctionnaires 26/11/2004 8

9 9 volet françaisvolet anglais fonctionnairesservants Exploration textométrique parallèle (étape 2) 26/11/2004 9

10 10 Analyse des résultats fonctionnaires (Frq.Tot.=49) officers (Frq.P.=10) officials (Frq.P.= 7) servants (Frq.P.=31) 48 volet françaisvolet anglais ? 26/11/

11 11 Travail effectué en collaboration avec William Martinez Univers lexicaux parallèles 26/11/2004 F A F A F A 11

12 12 Bilan… sur lextraction de ressources traductionnelles 26/11/2004 Notre approche permet dextraire semi automatiquement et sans faire appel à des savoirs a priori, des correspondances traductionnelles à partir de corpus parallèles. La textométrie met en évidence des phénomènes traductionnels complexes : variations contextuelles des traductions, groupes thématiques déquivalences lexicales, constellations lexicales parallèles, etc. Appuyée sur la représentation topographique de corpus pluri textuels, cette approche permet dexplorer la structure des équivalences lexicales. 12

13 13 Bilan… sur la création doutils de traitement automatique de corpus multilingues Maquettes de logiciels dexploration textométrique multilingue ; Procédures et objets informatiques indispensables pour lacquisition de ressources traductionnelles à base de corpus. 26/11/


Télécharger ppt "1 Approches quantitatives de lextraction de ressources traductionnelles à partir de corpus parallèles Auteur : Maria ZIMINA-POIROT Thèse dirigée par André"

Présentations similaires


Annonces Google