La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

21-23 Novembre 2012SIMC III1 La langue française à lheure du numérique The French Language in the Digital Age J. Mariani 1,2 P. Paroubek 1, G. Francopoulo.

Présentations similaires


Présentation au sujet: "21-23 Novembre 2012SIMC III1 La langue française à lheure du numérique The French Language in the Digital Age J. Mariani 1,2 P. Paroubek 1, G. Francopoulo."— Transcription de la présentation:

1 21-23 Novembre 2012SIMC III1 La langue française à lheure du numérique The French Language in the Digital Age J. Mariani 1,2 P. Paroubek 1, G. Francopoulo 2, A. Max 1, F. Yvon 1, P. Zweigenbaum 1

2 Livres Blancs Livres Blancs sur les langues européennes –Publiés par le réseau META-NET (Sept. 2012) –Présentent la situation de ces langues létat des technologies qui les traitent –31 Livres Blancs pour 30 langues Nationales / régionales dont les 23 langues officielles de lUE Bilingues : langue concernée + anglais http://www.meta-net.eu/whitepapers 21-23 Novembre 2012SIMC III2

3 Livre Blanc pour le Français 21-23 Novembre 2012SIMC III3

4 La langue française 128 millions de locuteurs « natifs ou réels » –16 ème langue maternelle la plus parlée dans le monde 300 millions de personnes parlant français –6 ème langue la plus parlée dans le monde Derrière langlais, le chinois mandarin, lespagnol, lhindi et le russe 21-23 Novembre 2012SIMC III4

5 La langue française Langue officielle dans près de 30 pays –Deuxième place derrière langlais Langue de la République Française –Plus de 80 langues parlées en France Langue de travail dans de nombreuses organisations internationales –OCDE, ONU (UNESCO, OIT), CIO, OEB, UA… 21-23 Novembre 2012SIMC III5

6 La langue française Deuxième langue la plus traduite (langue source) dans le monde (UNESCO) –(loin) derrière langlais Troisième langue la plus traduite (langue cible) dans le monde –derrière lallemand et lespagnol 21-23 Novembre 2012SIMC III6

7 La langue française 129 millions de personnes parlent français en Europe –3 ème langue seconde derrière langlais et lallemand Une des 23 langues officielles de lUnion Européenne –2 ème langue la plus traduite à la CE (derrière langlais) - langue source ou langue cible –1997 : 45% des documents traduits étaient en anglais et 40% en français –2007 : 72% des documents traduits étaient en anglais et 12% en français ! 21-23 Novembre 2012SIMC III7

8 Le français sur Internet 21-23 Novembre 2012SIMC III8

9 Le français sur Internet Wikipedia –284 langues (Juin 2012) –+ 1 M articles : Anglais (3,9M), Allemand (1,4M), Français (1,2M), Néerlandais (1 M) –+ 100K : Basque,… –+ 10K : Occitan, Breton,… –+ 1K : Corse, Flamand, Franco-provençal, Picard… 5 June 2012French Month of Science - HLT Workshop - Tallinn - Estonia 9

10 21-23 Novembre 2012SIMC III10 Les technologies de la langue Traitement automatique de la langue écrite –Monolingue Analyseur morphosyntaxique, analyseur syntaxique, Extracteur de terminologie, … Compréhension et génération de texte, Résumé Automatique, Recherche dInformations (moteur de recherche), Systèmes de Réponse aux Questions (cf IBM Watson/Jeopardy)… –Interlingue Recherche dInformations interlingue, Traduction automatique ou assistée, … Traitement automatique de la langue parlée –Monolingue Reconnaissance et compréhension de la parole, Synthèse vocale, Dialogue oral, Reconnaissance du locuteur, … –Interlingue Identification de la Langue, Traduction vocale,…

11 21-23 Novembre 2012SIMC III11 Les technologies de la langue Traitement automatique de la langue signée –Analyse, Synthèse, Traduction Technologies essentielles pour permettre laccessibilité –Technologies intermédias : Synthèse vocale à partir du texte (handicapés visuels), Transcription de la parole, Traitement de la langue des signes (handicapés auditifs), Commande vocale (handicapés moteurs) –Technologies interlingues : pour supprimer les barrières de la langue, quon peut considérer comme un handicap.

12 21-23 Novembre 2012SIMC III12 Ressources Linguistiques Nécessité de disposer dune infrastructure pour développer les technologies – Ressources linguistiques – Moyens dévaluation Ressources linguistiques –Données, corpus, lexiques, dictionnaires, bases terminologiques et encyclopédiques (Wikipédia, DBpédia, Semanticpédia)… Nécessaires pour mener les recherches en linguistique Nécessaires pour effectuer lapprentissage automatique des systèmes basés sur les approches statistiques (plus grandes sont les données, meilleurs sont les systèmes) –Standards pour la distribution des données

13 21-23 Novembre 2012SIMC III13 Evaluation Evaluation des Technologies de la Langue –Comparer les performances des systèmes de différents laboratoires, basés sur différentes approches, sur des données communes, avec un procole commun, dans le cadre de campagnes dévaluation Indicateur de la qualité de la recherche et du progrès technologique Compétition / coopération internationales (« coopétition ») Compare les performances des technologies avec les besoins des applications (TRL)

14 21-23 Novembre 2012SIMC III14 Histoire de la Reconnaissance Vocale à travers les évaluations du NIST

15 21-23 Novembre 2012SIMC III15 Performances en Traduction Automatique (score BLEU %)

16 21-23 Novembre 2012SIMC III16 Corpus Parallèles pour la Traduction Automatique Courtesy Euromatrix

17 Etat des technologies et des ressources pour le français (0- 6) 21-23 Novembre 2012SIMC III17

18 Traitement de la parole 21-23 Novembre 2012SIMC III18

19 Traitement de lécrit 21-23 Novembre 2012SIMC III19

20 Traduction Automatique 21-23 Novembre 2012SIMC III20

21 Ressources linguistiques 21-23 Novembre 2012SIMC III21

22 Effort technologique en France Quelques grands programmes nationaux au fil des ans –FRANCIL (AUF), Techno-Langue, Quaero,… –Disponibilité de ressources linguistiques –Connaissance du niveau technologique Bon niveau de la recherche Tissu industriel : PMEs 21-23 Novembre 2012SIMC III22

23 Conclusions Ressources et technologies disponibles pour le français, mais loin derrière langlais Manque de continuité dans le soutien des pouvoirs publics à leffort scientifique et industriel (France et Europe) Alors quil apparaît essentiel de disposer de Technologies de la langue pour traiter le multilinguisme (donnée fondamentale de lUE) Souhait dun large programme coordonné au plan européen (Commission et Etats-Membres) 21-23 Novembre 2012SIMC III23


Télécharger ppt "21-23 Novembre 2012SIMC III1 La langue française à lheure du numérique The French Language in the Digital Age J. Mariani 1,2 P. Paroubek 1, G. Francopoulo."

Présentations similaires


Annonces Google