Le Traitement Automatique des Langues (TAL)

Slides:



Advertisements
Présentations similaires
Les présentateurs doivent souvent transmettre des informations techniques à des auditeurs qui connaissent moins bien le sujet et le vocabulaire spécifique.
Advertisements

APPRENDRE A LIRE Présentation par : Marie-Christine Ratez CPC Chauny Roselyne Cail CPC Guise.
DÉFINITION DU DOMAINE D’ÉVALUATION (DDE) CONTENU DE LA PRÉSENTATION
Prof. Assist. Dr Penphan THIPKONG
Sandrine Peraldi (ISIT) Jean-Philippe KOTOWICZ (INSA Rouen)
Algèbre de composants : une approche fonctionnelle à la sémantique de documents Bart Lamiroy LORIA/INPL QGar - École des Mines de Nancy.
Rencontre avec… DICTIONNAIRES EN LIGNE ET OUTILS DE TRADUCTION
DE LEVALUATION CE1 AU PPRE. Animation pédagogique circonscription de Nice 3. Septembre/octobre 2006.
Les études en Economie Droit Baccalauréat professionnel
Urbanisation de Systèmes d'Information
CONVERGENCES ENTRE LES LANGUES VIVANTES ET LA LANGUE DE SCOLARISATION CONVERGENCES ENTRE LES LANGUES VIVANTES ET LA LANGUE DE SCOLARISATIONBulgarie.
1 er décembre 2005Projet ILD&ISTC1 Langues et documents Perspectives.
TRAITEMENT AUTOMATIQUE DES LANGUES : LES PRINCIPAUX PROGRAMMES
SYSTRAN Un outil du TAL Victoria AUPERT Marjorie LORSUNG.
Girard Pia & Laffont Caroline
Les outils du TAL Par RIGAUD Anaïs RALLIER Armelle SANTIAGO Gwendoline
Par Aline Mahot et Charlyne Routier
Apprendre à lire.
Evaluer à l’école maternelle
Comprendre le fonctionnement du code écrit
Apprentissage initial de la lecture
DOSSIER TICE 2006 MASSON Wendy 1 ère année sciences du langage
Reconnaissance de la parole
Cordial, le TAL et les aides à la rédaction
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
L’observation réfléchie de la langue au cycle 3
BIOMETRIE La biométrie : La gestion d’accès de demain
INTELLIGENCE COLLECTIVE : RENCONTRES 2006Nîmes mai 2006 CENTRE DE RECHERCHE LGI2P 1- Doctorante Ecole des mines de Paris, 2- Maitre de Conférences.
Collège Joachim du Bellay Septembre 2011
Algorithmique et Programmation
Académie de Versailles - Inspection pédagogique régionale de lettres
26 situations simples autour d'un texte court
Conscience phonologique
Reconnaissance Vocale
Le Sémiographe Outil générique pour effectuer des opérations texte sens texte ou texte sens actions
Forum des Industries de la Langue, 17 mars 2010
Chapitre 2 La description du langage
École de bibliothéconomie et des sciences de linformation 1 Gestion de linformation électronique (GIE) Maîtrise en sciences de linformation EBSI Université.
Nouveaux programmes de mathématiques à la rentrée 2012 Mars Avril 2012.
1 er décembre 2005IFT6010 – Jean-Yves Guyomarc’h Colorless green ideas…. Une « guerre de religion »
École de bibliothéconomie et des sciences de l’information 1 Gestion de l’information électronique (GIE) Maîtrise en sciences de l’information EBSI Université.
Traitement de la parole : Synthèse et reconnaissance
Savoir déchiffrer et reconnaître la signification des mots
Human Knowledge La nouvelle génération de moteurs sémantiques.
 L’informatique ne cesse de se développer. Elle est devenue une science à part entière, fondamentale et appliquée.  En effet, elle intervient de plus.
Algorithmes et Programmation
Animation Pédagogique FRANCHEVILLE – LYON – S te -FOY 10 Janvier 2007.
LINGUISTIQUE APPLIQUÉE À L’ENSEIGNEMENT-APPRENTISSAGE DU FRANÇAIS
Le système informatique et le système d’information
Arkhênum Patrimoine du Futur. Répartitions par types d’erreurs mineures.
Dominique LAURENT Patrick SEGUELA
Présentation RFIA janvier 2002
Activités langagières Les questions à se poser. ACTIVITÉS LANGAGIÈRES DE COMMUNICATION: PRODUCTION ORALE EN CONTINU 2 Dote-t-on l’élève de stratégies.
Informatique et Science du Numérique
Services en Text Mining. Introduction : Qui est Mentis ? Mentis a été fondée en 2005 comme une société spin-off du Laboratoire d'I ntelligence Artificielle.
TEXT MINING Fouille de textes
Stage à Ontomantics Master Pro TILDE
L’enseignement de l’Analyse Fonctionnelle et Structurelle S 5 en S. T
BACCALAUREAT PROFESSIONNEL 3 ANS MICROTECHNIQUES Quelques points clés.
Pierre Malenfant Technologie 9 École du Carrefour
Architectures articulant des représentations hétérogènes L’exemple de Gate (Mini tutoriel, journée Atala du 12 février 2005) Thierry Poibeau LIPN (CNRS.
STRATÉGIE DE RECHERCHE DOCUMENTAIRE Trouver des articles de périodiques Adèle Flannery, Cynthia Lisée et Christine Médaille, bibliothécaires.
Sciences du langage et de la communication Responsable du pilier : Corinne Rossari Professeure de linguistique française Présentation : Tobias von Waldkirch.
Bilan du cours Information Spécialisée M1 RETIC. Objectifs du cours (annoncés) Acquérir une culture informationnelle en SIC ; Acquérir une culture informationnelle.
Introduction aux Interfaces Homme-Machine
NEDERLEX : un outil en ligne d'aide à la lecture de textes en langue étrangère. G. Deville - M. Miceli (Ecole des Langues Vivantes - FUNDP) L. Dumortier.
BTS AGPME, journée académique de formation du 12 janvier 2009 M. DESSERTENNE Présentation d’une situation de formation Animanutrix 2 Gérer les documents.
1 4th International Conference on Arabic Language Processing, May 2–3, 2012, Rabat, Morocco Titre Mohamed El Amine ABDERRAHIM Mohamed Alaedine ABDERRAHIM.
Production de ressources pour le cycle 3 Lycée Diderot le 8 mars 2016
 Lycée Déodat de Séverac. ➲ Toutes les matières utilisent l'informatique mais jusqu'à présent la programmation restait en post bac. ➲ Avec l'ISN vous.
Transcription de la présentation:

Le Traitement Automatique des Langues (TAL) Jérôme Helmstetter Nicolas Mastro Jean-Baptiste Hainzelin Laurent Gendre

Plan Le TAL, une discipline jeune Le TAL aujourd’hui Méthode d’analyse de texte Méthode d’analyse de la parole Liens entre le TAL et la linguistique Un exemple

Le TAL, une discipline jeune Seconde guerre mondiale : développement des premiers Calculateurs. Début des années 50, guerre froide : début de la traduction automatique – Besoins : déchiffrer même approximativement des documents en russes pour identifier ceux qui doivent être confier à un traducteur humain. – Approche de base pour l’automatisation : • traduction mot à mot • + règles de réarrangement de l’ordre des mots – Les problématiques, difficultés, idées et méthodes essentielles du TAL sont identifiées dès cette époque : • En particulier : « syntaxe opérationnelle »

Le TAL aujourd’hui Une discipline autonome… – qui a pour objectif la réalisation de systèmes informatiques capables de traiter en entrées des données linguistiques (mots, phrases, textes) – qui a ses cursus de formation, ses revues (TAL en France, Computational Linguistics), sa société savante (ATALA) … liée à la linguistique et à l’informatique Principales applications : – Oral : reconnaissance vocale, dictée vocale – Écrit : traduction assistée par ordinateur, correction grammaticale, recherche d’informations, résumé automatique, … Composants de base : – Étiquetage des mots en fonction de leur syntaxe – Analyse syntaxique

Pro. Pro. Verbe Pro. Nom Art. Nom Analyse de texte L’analyse de texte d’un système de traitement automatique des langues est décomposé en 5 étapes : Le découpage en mots, l’étiquetage (genre), reconnaissance de la structure, l’évaluation du sens (traduction) et la mise en contexte. Cas de l’étiquetage des noms : Affecter à chaque mot d’une phrase sa catégorie grammaticale (nom, verbe, adjectif, …) sachant que chaque catégorie correspond a un code dans l’algorithme de programmation. – Difficulté : l’ambiguïté morphologique il la porte il ferme la porte. Pro. Pro. Verbe Pro. Nom Art. Nom

Analyse de la parole La Reconnaissance Automatique de la Parole est aussi très importante dans le TAL et elle peut être décomposé en plusieurs parties : Acquisition et numérisation d’un signal sonore Extraction des paramètres tel que l’énergie ou encore les coefficients cepstraux (signal dans le domaine qfréquentiel) Paramétrisation de la parole avec la Transformé de Fourier discrète Comparaison du signal à l’aide de différents modèles but : faire correspondre des parties du signal pour trouver des mots Ainsi, il existe des systèmes de commandes vocales plus ou moins fiables suivant les méthodes employées et les lexiques associés.

Liens entre le TAL et la linguistique Les talistes ont des compétences en informatique et des compétences en linguistique spécifiques, adaptées à l’activité de développement de systèmes de TAL Linguistique -> TAL – Le TAL sollicite diverses branches des sciences du langage (morphologie, syntaxe, lexicologie, sémantique, …) TAL -> linguistique – Le développement de modèles formels et de systèmes de TAL génère de nouvelles connaissances pour la description des langues. – Les outils de TAL et la disponibilité de très grands corpus de textes permettent de constituer de nouveaux observatoires de langue en usage, susceptibles de renouveler l’investigation linguistique.

Exemple Synomia : une PME – Créée en 2000 – Recherche d’une technologie novatrice : rencontre avec l’ERSS – Rôle d’un chef de projet en linguistique-informatique – Une douzaine de personnes aujourd'hui – Commercialisation active depuis janvier 2000 Des produits – Produits d'aide à la navigation dans un site web – Recherche, Index, Référencement, Liens promotionnels – Un service clé en main, entièrement automatisé Des clients – 180 abonnements en France, Grande-Bretagne et US – 240 000 requêtes/jour

Merci de votre attention