Daniel Prado Secrétaire exécutif du Réseau Maaya Multilinguisme et cyberespace UNESCO – SMSI +10 Paris, 26/02/2013
1. Évolution de la diversité linguistique dans la toile UNESCO – SMSI +10 Paris, 26/02/2013
L’Internet vers 1996 – pourcentage de langue dans dans la toile Pimienta
Évolution de la présence des langues dans la toile entre 1998 et 2007 (en pourcentages) Funredes – Union latine
3. Internautes par langue (Indicateur 9.2 – SMSI) UNESCO – SMSI +10 Paris, 26/02/2013
Internet World Stats (basé sur Nielsen – UIT et autres)
Internet World Stats (basé sur Nielsen – UIT et autres)
3. Présence des langues dans le cyberespace aujourd’hui (Indicateur 9.3 – SMSI) UNESCO – SMSI +10 Paris, 26/02/2013
Nombre de noms de domaine (ICANN) Non ICANN (Chine, Russie, OpenRoot, The Commonwealth, Ligue des Nations indiennes d’Amérique, etc.) ??? Sites considérés « actifs » et sans doublons Web indexé (5-10 %) Statistiques linguistiques relativement fiables W3tech.com – (basé sur Alexa.com) Pimienta - Pouzin – Greffenstette – etc. Netcraft - news.netcraft.com OpenRoot Novembre 2012
Web indexé (5-10 %) w3Tech.com / Alexa Autres espaces numériques
Autres langues présentes (moins de 1 % chaque) Bulgare, Catalan, Coréen, Croate, Danois, Finnois, Grec, Hébreu, Hongrois, Indonésien, Letton, Lituanien, Malais, Norvégien, Norvégien Bokmål, Perse, Roumain, Serbe, Slovaque, Slovène, Suédois, Tagalog, Tchèque, Thaï, Ukrainien, Vietnamien, etc.
4. Articles dans Wikipédia par langue (Indicateur 9.5 – SMSI) UNESCO – SMSI +10 Paris, 26/02/2013
Probablement l’outil Web le plus multilingue. Transparent, notamment en matière de langues: ◦285 versions linguistiques de Wikipédia (fév. 2013) ◦Anglais: >4 M articles et 18 M utilisateurs (125 m actifs) ◦Allemand, Français, Néerlandais > 1M articles ◦36 langues entre 100 m et 1 M articles ◦75 langues entre 10 m et 100 m ◦Entre 2 et 10 fois plus de matériel (discussions, images, projets, catégories, etc.) par langue, 4 fois en moyenne. ◦Nombre total d’articles disponibles : ◦Nombre total de matériel : ◦Nombre d’utilisateurs (éditeurs) : ◦Images :
15 premières langues de Wikipédia
5. Cyberespace: Fracture linguistique UNESCO – SMSI +10 Paris, 26/02/2013
Comparatif nombre de langues et nombre de locuteurs Ethnologue
Internautes diversité linguistique Net.lang:
Complications supplémentaires... langues dites “orales” (près de 6 sur 7 langues) 98 % des langues ne couvriraient que des besoins affectifs et locaux. Ciral – Univ. Laval ~ 2,5 % langues disposeraient de la protection ou veille d’une entité publique. Ciral – Univ. Laval Net.lang:
35 langues = 99 % du Web sur les 1 M de sites les mieux classés Langues décrites dans Langues en danger Google Scholar (10) Twitter (30) * Google outils linguistiques (reconnaissance traduction) ~ 70 Facebook (70-78 versions linguistiques) * Windows(100) Wiktionnaire (144 interfaces, 61 langues > mots) Wikipédia (285) 117 avec > art. Net.lang:
Langues « visibles » sur l’Internet Langues bien représentées Langues partiellement présentes Présence très insuffisante Présence « ponctuelle » Langues référencées: Atlas des langues en danger (Unesco) Langues en danger (Google) Sorosoro Linguasphère Ethnologue Etc. Net.lang:
Quelques leçons tirées L’anglais recule en pourcntage dans l’Internet, certes, mais les langues les plus répandues (10-15) sont les seules à en profiter La numérisation d’ouvrages et la littérature préexistante au numérique favorise cette fracture D’autres langues (écrites) peuvent prendre une place mais ont besoin de réduire l’écart textuel Le Web 2.0 et l’audio-visuel pourraient favoriser les langues moins présentes, notamment celle dites “orales” L’accès ne suffit pas, l’alphabétisation numérique est primordiale et les nouveaux outils (mobiles et audiovisuels) fondamentaux. Net.lang:
6. Manque d’indicateurs UNESCO – SMSI +10 Paris, 26/02/2013
- La taille du web est devenue importante pour une indexation traditionnelle (proche de l’infini!). - Les moteurs de recherche couvriraient moins d’un dixième de l’ensemble (probablement même moins de 5 %) - Le comptage des moteurs a perdu toute fiabililté. - … et, de toutes manières, tout ce que l’on trouve n’est que des données statiques d’où l’on n’obtient que le nombre de pages par langue. Indicateurs Net.lang: Pimienta-Prado, Mikami
Les deux indicateurs les plus fiables : Par indexation des ccTLD en utilisant des algorithmes de reconnaissance appliqués aux langues moins usitées de l’Asie, de l’Afrique et des Caraïbes (LOP). En faisant des recherches, via les moteurs du marché, sur un ensemble fini des mots avec équivalents exacts pour un nombre limité de langues. FUNREDES/UNION LATINA). Indicateurs Net.lang: Pimienta-Prado, Mikami
Vise à construire des indicateurs de la diversité linguistique dans le monde numérique afin de o pouvoir proposer les politiques publiques pour les langues aux niveaux national et mondial o et aider à la prise en compte du facteur linguistique dans l'économie numérique. Soumission d'un projet auprès de l'UE (FP7) en cours Collaboration initiale entre l’ UNESCO, l’OIF, l’Union latine avec la participation de MAAYA et de l’UIT. Projet mené actuellement avec le soutien de l’Organisation internationale de la Francophonie Consortium international (10 labos, entreprises et ONG) présentant le projet SEMACORE Maaya - OIF
Pédagogique, politique et pratique permettant d'appréhender et de comprendre les principaux enjeux du multilinguisme dans le cyberespace et proposer des pistes pour une présence équitable des langues dans la société de l'information. Soutien de l’UNESCO, Union latine, ANLOC, CRDI, Francophonie 27 articles - sur la base d’un cahier des charges, par 27 auteurs venant d’une vingtaine de pays différents (quatre continents) Édition bilingüe FR-EN. Version RU en cours et d’autres en recherche de partenariats. Éditions numériques gratuites (PDF, ePub). Édition imprimée payante (34 €) Net.lang: Réussir le cyberespace multilingue Towards a multilingual cyberspace
Daniel Prado Secrétaire exécutif du Réseau Maaya Multilinguisme et cyberespace UNESCO – SMSI +10 Paris, 26/02/2013