UNIVERSITÉ PARIS 3 ─ SORBONNE NOUVELLE

Slides:



Advertisements
Présentations similaires
Multilingual eLearning in LANGuage Engineering
Advertisements

André Salem Montréal 2004 Approches quantitatives des corpus textuels André Salem Systèmes linguistiques, énonciation et discursivité (SYLED - EA 2290)
Aides logicielles à l'écriture
Sciences Ingénierie FD.
Constitution de produits terminologiques à partir de corpus
Rencontre avec… DICTIONNAIRES EN LIGNE ET OUTILS DE TRADUCTION
Faculté des Sciences, Service des Langues
Olivier Kraif, Agnès Tutin LIDILEM
1 er décembre 2005Projet ILD&ISTC1 Langues et documents Perspectives.
La dynamique dans les modèles, méthodes et outils pour les systèmes daide à la décision : Cadre du processus dintelligence économique Amos DAVID Septembre.
ANDRE Marine DABIN Julie WATERLOT Amandine
SYSTRAN Un outil du TAL Victoria AUPERT Marjorie LORSUNG.
Girard Pia & Laffont Caroline
Les outils du TAL Par RIGAUD Anaïs RALLIER Armelle SANTIAGO Gwendoline
Vers un système de traduction automatique du langage texto Centre de recherche en linguistique et traitement automatique des langues Lucien Tesnière Université
Un projet collectif pour le réseau : la production d’écrit
2 ième édition 1 Introduction aux systèmes dinformation Un outil essentiel pour lentreprise branchée Chapitre James A. OBrien © 2003 Les Éditions de la.
Caroline Patenaude Bibliothécaire – responsable informatique et Web Bibliothèque des lettres et sciences humaines, Université de Montréal 4 novembre 2010.
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
Exposé Duan Kun Alexandra Moraru M2 Pro Traductique, INALCO
Site web des bibliothèques Les accès : RECHERCHE, PROFIL, BIBLIOTHEQUE(S) 26/03/2013Service commun de la documentation.
Thibault ROY Laboratoire GREYC Université de Caen / Basse-Normandie Une plate-forme logicielle dédiée à la cartographie de corpus Journées portes ouvertes.
Corpus parallèles et textométrie
Traducteur Technique en Interne Christophe Jovelin DESS ILTS 2005
Institut des Sciences du Langage 22, Place du Parc 7000 MONS 065/
Mamadou Dieye, Mohamed Rafik Doulache,
Échéancier # E) Bilan réflexif /rapport individuel (cours # 15 individuel disponible sur le site section travaux (Attention : rédiger votre travail.
La résolution de la référence et son évaluation: un Atelier de Traitement de la Référence mettant en œuvre les « représentations mentales » Andrei Popescu-BelisISSCO,
Yasmina ABBAS EDF - Division Recherche et Développement (Division R&D)
Mise en oeuvre dun outil original daide en ligne à la lecture de textes en langue étrangère. G. Deville - M. Miceli (Ecole des Langues Vivantes - FUNDP)
Titre de la diapositive Unité mixte de recherche 7118 Accueil diaporama.
Introduction à lutilisation des corpus 1. Quest-ce quun corpus? Alexandra VOLANSCHI
Introduction à l’utilisation des corpus 1. Qu’est-ce qu’un corpus?
Introduction théorie et pratique
Introduction théorie et pratique
Introduction à lutilisation des corpus 2. Comment constituer un corpus?
Introduction à lutilisation des corpus 2. Comment constituer un corpus?
Association des Technologies de lInformation pour lEducation et la Formation
École de bibliothéconomie et des sciences de linformation 1 Gestion de linformation électronique (GIE) Maîtrise en sciences de linformation EBSI Université.
Présentation de larchive ouverte « ArchiveTématice » Colloque Technologies pour lapprentissage et léducation, Paris,
École de bibliothéconomie et des sciences de l’information 1 Gestion de l’information électronique (GIE) Maîtrise en sciences de l’information EBSI Université.
Le Programme « Science sans Frontières »
Alexandre Guigue La dimension culturelle du langage juridique : un défi pour le traducteur et le comparatiste. 1. Pourquoi réunir le traducteur et le comparatiste.
1 Outils bibliographiques Plume 20 mars- Lyon Yannick Maignien.
Méthodologie pour la structuration semi- automatique d’un corpus lexicographique bilingue : le cas du dictionnaire français-kabyle Mahfoud MAHTOUT Université.
Direction de la normalisation terminologique (DNT) Mai 2010 La terminologie : une passion, des métiers !
CoRRecT : Démarche coopérative pour l’évaluation de systèmes de reconnaissance de termes Chantal Enguehard IRIN – Université de Nantes 2 rue de la Houssinière.
Agenda de la présentation
L’utilisation d’outils de traitement automatique de la langue naturelle dans le domaine de la terminologie: une voie d’optimisation de ressources 1.
L’historien, le texte et l’ordinateur novembre 2006 – École Normale LSH de Lyon U.M.R. 6039, CNRS – ILF – UNSA L’apport de l’Analyse de Données.
PAPS ESRS Séminaire de lancement des activité 26 mars 2012 Université Mentouri Constantine 1PAPS-ESRS, 26 mars 2012, UMC.
Docteur en Sciences et Techniques des Activités Physiques et Sportives
Tel : +33 (0) Création L&M : 2002 Capital : € Lauréat OSEO-ANVAR 2001 et er Prix LangTech.
Dictionnaires, lexicographie, lexicographes
Les études à l’université
Sylwia Ozdowska1, Vincent Claveau2
L ’ordinateur est un outil parmi d ’autres.
Thibault ROY Université de Caen / Basse-Normandie Laboratoire GREYC – Equipe ISLanD Apport d’outils d’informatique documentaire à l’analyse de forums de.
Le projet de terminologie
TEXT MINING Fouille de textes
ETI Département de traitement informatique multilingue Présentation ASTTI Neuchâtel, 7 juin 2011 Les outils d’aide à la traduction: peut-on s’équiper à.
Introduction à l’utilisation des corpus 1. Qu’est-ce qu’un corpus?
Le Traitement Automatique des Langues (TAL)
Pierre Malenfant Technologie 9 École du Carrefour
Architectures articulant des représentations hétérogènes L’exemple de Gate (Mini tutoriel, journée Atala du 12 février 2005) Thierry Poibeau LIPN (CNRS.
Un projet qui prend forme 29 juillet LinguisTech  Il s’agit d’une boîte à outils de technologies langagières, enrichie par un site Web de référence.
NEDERLEX : un outil en ligne d'aide à la lecture de textes en langue étrangère. G. Deville - M. Miceli (Ecole des Langues Vivantes - FUNDP) L. Dumortier.
Introduction à l’utilisation des corpus 1. Qu’est-ce qu’un corpus?
Introduction à l’utilisation des corpus
Transcription de la présentation:

UNIVERSITÉ PARIS 3 ─ SORBONNE NOUVELLE ÉCOLE DOCTORALE : Langage et langues 1 Doctorat en Sciences du langage : Approches quantitatives de l’extraction de ressources traductionnelles à partir de corpus parallèles Auteur : Maria ZIMINA-POIROT Thèse dirigée par André SALEM 26/11/2004

Plan de l’exposé Parcours… Ressources textuelles multilingues 2 Plan de l’exposé Parcours… Ressources textuelles multilingues Gestion, accès au contenu linguistique… Domaines d’application Textométrie multilingue Un nouveau courrant de recherches interdisciplinaire… Bilan sur les utilisations 26/11/2004

Parcours Etudes de lettres (Université Lomonossov, Moscou) 3 Etudes de lettres (Université Lomonossov, Moscou) Philologie Linguistique et langues modernes Information Technology for Linguists (Coventry University, UK) Travail sur corpus de textes Première approche de concordanciers parallèles Approches quantitatives de corpus parallèles (Université de la Sorbonne nouvelle – Paris 3) …

4 « Il est maintenant possible d ’enregistrer et de manipuler par ordinateur des masses pratiquement illimitées de textes… Compte tenu de l ’évolution récente en informatique, tout indique en effet que les traducteurs pourront bientôt accéder facilement à de très vastes corpus bilingues contenant leurs propres traductions et celles de leurs collègues. » ISABELLE Pierre et WARWICK-ARMSTRONG Susan (1993). « Les corpus bilingues : une nouvelle ressource pour le traducteur ». In Bouillon, P. et Clas, A. (Eds.), La traductique. Montréal : les presses de l’Université de Montréal, pp. 288-306. 26/11/2004

Analyse de ressources textuelles multilingues 5 Analyse de ressources textuelles multilingues Sources : Web, archives de textes traduits… Outils de gestion : aligneurs, étiqueteurs et analyseurs syntaxiques… Moyens d’accès au contenu linguistique : concordanciers parallèles, mémoires de traduction, lexiques de termes multilingues… Corpus de textes parallèles ou comparables État 1 Bi-textes numérisés État 2 Visualisations sélectives du contenu linguistique État 3 26/11/2004

Corpus multilingues : domaines d’application 6 Corpus multilingues : domaines d’application Traduction Lexicographie Terminologie Enseignement des langues étrangères Recherche d’information multilingue … 26/11/2004

TRAITEMENT AUTOMATIQUE DE CORPUS MULTILINGUES 7 Textométrie multilingue TRADUCTOLOGIE TRAITEMENT AUTOMATIQUE DE CORPUS MULTILINGUES Extraction de ressources traductionnelles TEXTOMÉTRIE Ingénierie multilingue Alignement automatique http://www.cavi.univ-paris3.fr/lexicometrica/jadt/textometrie-multilingue/ 26/11/2004

Exploration textométrique parallèle (étape 1) 8 volet français volet anglais fonctionnaires 26/11/2004

Exploration textométrique parallèle (étape 2) 9 volet français volet anglais fonctionnaires servants 26/11/2004

Analyse des résultats ? officers (Frq.P.=10) officials (Frq.P.= 7) servants (Frq.P.=31) fonctionnaires (Frq.Tot.=49) 48 volet français volet anglais ? 26/11/2004

Univers lexicaux parallèles 11 F A F A F A Travail effectué en collaboration avec William Martinez 26/11/2004

Bilan… sur l’extraction de ressources traductionnelles 12 Bilan… sur l’extraction de ressources traductionnelles Notre approche permet d’extraire semi automatiquement et sans faire appel à des savoirs a priori, des correspondances traductionnelles à partir de corpus parallèles. La textométrie met en évidence des phénomènes traductionnels complexes : variations contextuelles des traductions, groupes thématiques d’équivalences lexicales, constellations lexicales parallèles, etc. Appuyée sur la représentation topographique de corpus pluri textuels, cette approche permet d’explorer la structure des équivalences lexicales. 26/11/2004

13 Bilan… sur la création d’outils de traitement automatique de corpus multilingues Maquettes de logiciels d’exploration textométrique multilingue ; Procédures et objets informatiques indispensables pour l’acquisition de ressources traductionnelles à base de corpus. 26/11/2004