21-23 Novembre 2012SIMC III1 La langue française à lheure du numérique The French Language in the Digital Age J. Mariani 1,2 P. Paroubek 1, G. Francopoulo.

Slides:



Advertisements
Présentations similaires
Click to edit Master title style Soccuper de notre personnel Investir dans leur développement professionnel Leur donner confiance en lavenir Look after.
Advertisements

Commission européenne
COMPARAISON DES LOGICIELS DE TRAITEMENT DES DONNEES TEXTUELLES par
Ecdc.europa.eu Jaime ANDREU DG EAC, Unité Communication et Information Marseille, le 15/2/2007 Jeunesse en Action
Click to edit Master text styles Second level Third level Fourth level Fifth level Click to edit Master title style Ahmed Legrouri
The Civil Aviation University World-wide CNS/ATM Systems Implementation Conference Rio de Janeiro, May 1998 Formations nécessaires.
Apprendre Apprendre du voisin la langue la langue du voisin.
1 La bibliométrie pour l'évaluation stratégique des institutions de recherche : usages et limites Indicators for strategic positioning of the research.
un plus pour la réussite professionnelle un plus pour une formation en Allemagne un plus pour la mobilité transfrontalière.
Teacher Education in Sub-Saharan Africa (TESSA) Présentation de TESSA Michèle Deane, The Open University, Royaume-Uni Atelier de Tové Tové, mars.
LES LANGUES VIVANTES en France rentrée 2008
1 La Commission européenne pour l'efficacité de la justice Association des magistrats du pouvoir judiciaire de la République et canton de Genève, 26 janvier.
Réseaux et associations internationales Mardi 8 décembre h h30 Olivier Rey Veille scientifique et technologique.
© Cers und Partner Apprendre la langue Apprendre lalangue du voisin dun pays voisin.
TRAITEMENT AUTOMATIQUE DES LANGUES : LES PRINCIPAUX PROGRAMMES
Girard Pia & Laffont Caroline
UNIVERSITÉ - INDUSTRIE: une approche comparative Patrick LLERENA BETA- UMR CNRS-ULP Strasbourg.
Europe-Education-Formation France
Bischheim, 06 et 07 mai Éducnet, le site de la SDTICE Journées nationales des interlocuteurs académiques en SPCFA
LA FORMATION DE LENSEIGNANT LENQUÊTE ECPALE MODULE PEDAGOGIQUE LA CONNAISSANCE ET LE RÔLE DE LENQUÊTE UN SUPPORT POUR COMPRENDRE LACCIDENT.
L3 Sciences du langage. Tronc commun Syntaxe 3 et 4 Sémantique 2 Phonologie 3 Discours Texte 2 et 3 Morphologie constructionnelle Lexique 2 Sociolinguistique.
EDUCASOURCES JACQUES PIOT CRDP MIDI-PYRÉNÉES. EDUCASOURCES Base de données en ligne Ressources en ligne fiables Ressources en adéquation avec les programmes.
16-18 mai La visioconférence : un outil efficace pour le suivi à distance des étudiants Sandrine CHARLES Christophe BATIER.
Les équations différentielles
FRANÇAIS MÉDICAL Solange GOY Matinées TICE du 14 Juin 2007.
BLOGFOR TIC-PME 2010 – Réunion Région du 8 février 2007 La filière forêt – bois – papier en France Une ressource forestière diffuse 27 % de la surface.
L’IMPORTANCE DE L’ALLEMAND SUR LE MARCHE DE L’EMPLOI !
Profil TIC des étudiants du collégial : Bilan, constats, perspectives Nicole PerreaultNicole Perreault, Réseau des répondantes et répondants TIC, Fédération.
Modèles de choix discrets (III) Mirta B. Gordon Laboratoire Leibniz-IMAG Grenoble Dynamique des systèmes complexes et applications aux SHS : modèles, concepts.
Geneviève Gaillard – Jean-Michel Schmitt Séminaire BTP Lycée Louis le Grand – PARIS novembre 2013 Enseignement de Technologie en Langue Vivante.
F. Mourlhon-Dallies. Réunion Groupe FOS/FOU Présentation des chapitres 3 et 4 Roberto de Abreu
De l’oral à l’écrit Difficultés Troubles
Un monde de possibilités : linternationalisation des formations collégiales Avis du Conseil supérieur de léducation (2013)
APPRENTISSAGE EN LIGNE (OLACEFS) UNE OPTION DE FORMATION DANS LORGANISATION DES INSTITUTIONS SUPREMES DAUDIT DE LAMERIQUE LATINE ET LA CARAIBE (OLACEFS)
Université de Lodz. Constitution de la République de Pologne du 2 avril 1997 Loi du 8 mars 1990 sur lautogestion de la commune Loi du 5 juin 1998 sur.
Le Réseau dExcellence des centres européens de recherche en sciences humaines sur lensemble euro-méditerranéen 1/10/2004 Maison Méditerranéenne des Sciences.
Socle commun et livret personnel de compétences
REGARDS CROISÉS SUR LES TRANSFORMATIONS AU SEIN DES ADMINISTRATIONS PUBLIQUES Sur quoi faut-il agir pour transformer un milieu? Mini-colloque organisé
Stratégie sur les océans du Canada Participation à léchelle nationale de juin à septembre 2002 LA STRATÉGIE SUR LES OCÉANS DU CANADA Nos océans, notre.
CONSEIL DE DEVELOPPEMENT Groupe de travail « Accès aux services » Projet sur laccès aux services à la population sur le Pays de Redon et Vilaine Présentation.
Aurélie Sgro Chargée de Projet ICMPD Bruxelles
Handicap et politiques de coopération internationale Etat des lieux du handicap dans la coopération internationale.
CONSTRUIRE LE SOCLE DE LA BIBLIOTHÈQUE SCIENTIFIQUE NUMÉRIQUE NATIONALE. 1.
Nom du module Date Lieu de la formation. 2 Genèse du projet Historique, partenaires, publics Pour qui ? Pourquoi ? Qui ? Comment ? Quand ?
Staatskanzlei – Chancellerie d'État 1 AET, 6e Sommet européen et international de terminologie, Oslo, 12 octobre 2012 La terminologie au service de l'administration.
La recherche documentaire sur internet au Cycle 3
Présentation OTeN – e-Forum Casablanca 14 juin 2007 Un observatoire des initiatives numériques sur le territoire français Emmanuel Vandamme, délégué de.
2008 C. Ghelfi et K. Chèvre / Service de coordination des bibliothèques SFX.
Origine du concept de Cohésion Sociale
Epreuve pratique dévaluation des capacités expérimentales Durée : 1 heure : 4 points sur 20 Lévaluation des capacités expérimentales a lieu dans le courant.
Science et technologie au primaire Lévaluation aux 2 e et 3 e cycles 1.
COMITE NATIONAL DE SUIVI PARIS, 30 juin 2011 Fonds social européen Programme opérationnel FSE « Compétitivité régionale et Emploi » Le comité
1 7 Langues niveaux débutant à avancé. 2 Allemand.
Le transport fluvial en France : évolutions en cours et attendues
Concours Recrutement d’administrateurs linguistes dans le domaine de la traduction.
Interaction Homme Robot Sujet « 16/03/2012 » Réalisé par :
Jeunesse en Action Marzia Conte
CAS DE RECHERCHE SUR LES BASES - Mme Nafissa BELCAID (OMPIC) -
© International Road Transport Union (IRU) 2012 Séminaire international sur les instruments de facilitation du commerce et du transport routier de lONU.
Economie française Edité par l’OFCE.
29e CONFÉRENCE INTERNATIONALE DES COMMISSAIRES À LA PROTECTION DES DONNÉES ET DE LA VIE PRIVÉE 29 th INTERNATIONAL CONFERENCE OF DATA PROTECTION AND PRIVACY.
Numérisation du patrimoine culturel
JEUNESSE EN ACTION  Instrument pour la mise en œuvre du Livre blanc sur la jeunesse et la coopération européenne dans le domaine de la jeunesse.
English as a Second Language PROGRAMME DE FORMATION DE L’ÉCOLE QUÉBÉCOISE Faits saillants.
IMMERSION LINGUISTIQUE Première année secondaire
CHOISIR L’ESPAGNOL COMME SECONDE LANGUE VIVANTE EN 4ème
Dominique LAURENT Patrick SEGUELA
Vers un système européen de Vérification des Éco-technologies Towards an EU system for Environmental Technologies Verification Pierre Henry Commission.
Programme cofinancé par l’Union européenne – Fonds européen de développement régional. L’union investit dans votre avenir Formations aux fonctions d’aide.
Formation disciplinaire Accompagnement de la Réforme des enseignements en collège Sciences Industrielles de l’Ingénieur Technologie Mars – Avril 2016.
Transcription de la présentation:

21-23 Novembre 2012SIMC III1 La langue française à lheure du numérique The French Language in the Digital Age J. Mariani 1,2 P. Paroubek 1, G. Francopoulo 2, A. Max 1, F. Yvon 1, P. Zweigenbaum 1

Livres Blancs Livres Blancs sur les langues européennes –Publiés par le réseau META-NET (Sept. 2012) –Présentent la situation de ces langues létat des technologies qui les traitent –31 Livres Blancs pour 30 langues Nationales / régionales dont les 23 langues officielles de lUE Bilingues : langue concernée + anglais Novembre 2012SIMC III2

Livre Blanc pour le Français Novembre 2012SIMC III3

La langue française 128 millions de locuteurs « natifs ou réels » –16 ème langue maternelle la plus parlée dans le monde 300 millions de personnes parlant français –6 ème langue la plus parlée dans le monde Derrière langlais, le chinois mandarin, lespagnol, lhindi et le russe Novembre 2012SIMC III4

La langue française Langue officielle dans près de 30 pays –Deuxième place derrière langlais Langue de la République Française –Plus de 80 langues parlées en France Langue de travail dans de nombreuses organisations internationales –OCDE, ONU (UNESCO, OIT), CIO, OEB, UA… Novembre 2012SIMC III5

La langue française Deuxième langue la plus traduite (langue source) dans le monde (UNESCO) –(loin) derrière langlais Troisième langue la plus traduite (langue cible) dans le monde –derrière lallemand et lespagnol Novembre 2012SIMC III6

La langue française 129 millions de personnes parlent français en Europe –3 ème langue seconde derrière langlais et lallemand Une des 23 langues officielles de lUnion Européenne –2 ème langue la plus traduite à la CE (derrière langlais) - langue source ou langue cible –1997 : 45% des documents traduits étaient en anglais et 40% en français –2007 : 72% des documents traduits étaient en anglais et 12% en français ! Novembre 2012SIMC III7

Le français sur Internet Novembre 2012SIMC III8

Le français sur Internet Wikipedia –284 langues (Juin 2012) –+ 1 M articles : Anglais (3,9M), Allemand (1,4M), Français (1,2M), Néerlandais (1 M) –+ 100K : Basque,… –+ 10K : Occitan, Breton,… –+ 1K : Corse, Flamand, Franco-provençal, Picard… 5 June 2012French Month of Science - HLT Workshop - Tallinn - Estonia 9

21-23 Novembre 2012SIMC III10 Les technologies de la langue Traitement automatique de la langue écrite –Monolingue Analyseur morphosyntaxique, analyseur syntaxique, Extracteur de terminologie, … Compréhension et génération de texte, Résumé Automatique, Recherche dInformations (moteur de recherche), Systèmes de Réponse aux Questions (cf IBM Watson/Jeopardy)… –Interlingue Recherche dInformations interlingue, Traduction automatique ou assistée, … Traitement automatique de la langue parlée –Monolingue Reconnaissance et compréhension de la parole, Synthèse vocale, Dialogue oral, Reconnaissance du locuteur, … –Interlingue Identification de la Langue, Traduction vocale,…

21-23 Novembre 2012SIMC III11 Les technologies de la langue Traitement automatique de la langue signée –Analyse, Synthèse, Traduction Technologies essentielles pour permettre laccessibilité –Technologies intermédias : Synthèse vocale à partir du texte (handicapés visuels), Transcription de la parole, Traitement de la langue des signes (handicapés auditifs), Commande vocale (handicapés moteurs) –Technologies interlingues : pour supprimer les barrières de la langue, quon peut considérer comme un handicap.

21-23 Novembre 2012SIMC III12 Ressources Linguistiques Nécessité de disposer dune infrastructure pour développer les technologies – Ressources linguistiques – Moyens dévaluation Ressources linguistiques –Données, corpus, lexiques, dictionnaires, bases terminologiques et encyclopédiques (Wikipédia, DBpédia, Semanticpédia)… Nécessaires pour mener les recherches en linguistique Nécessaires pour effectuer lapprentissage automatique des systèmes basés sur les approches statistiques (plus grandes sont les données, meilleurs sont les systèmes) –Standards pour la distribution des données

21-23 Novembre 2012SIMC III13 Evaluation Evaluation des Technologies de la Langue –Comparer les performances des systèmes de différents laboratoires, basés sur différentes approches, sur des données communes, avec un procole commun, dans le cadre de campagnes dévaluation Indicateur de la qualité de la recherche et du progrès technologique Compétition / coopération internationales (« coopétition ») Compare les performances des technologies avec les besoins des applications (TRL)

21-23 Novembre 2012SIMC III14 Histoire de la Reconnaissance Vocale à travers les évaluations du NIST

21-23 Novembre 2012SIMC III15 Performances en Traduction Automatique (score BLEU %)

21-23 Novembre 2012SIMC III16 Corpus Parallèles pour la Traduction Automatique Courtesy Euromatrix

Etat des technologies et des ressources pour le français (0- 6) Novembre 2012SIMC III17

Traitement de la parole Novembre 2012SIMC III18

Traitement de lécrit Novembre 2012SIMC III19

Traduction Automatique Novembre 2012SIMC III20

Ressources linguistiques Novembre 2012SIMC III21

Effort technologique en France Quelques grands programmes nationaux au fil des ans –FRANCIL (AUF), Techno-Langue, Quaero,… –Disponibilité de ressources linguistiques –Connaissance du niveau technologique Bon niveau de la recherche Tissu industriel : PMEs Novembre 2012SIMC III22

Conclusions Ressources et technologies disponibles pour le français, mais loin derrière langlais Manque de continuité dans le soutien des pouvoirs publics à leffort scientifique et industriel (France et Europe) Alors quil apparaît essentiel de disposer de Technologies de la langue pour traiter le multilinguisme (donnée fondamentale de lUE) Souhait dun large programme coordonné au plan européen (Commission et Etats-Membres) Novembre 2012SIMC III23