Localisation et Référencement multilingue 12/02/2015 Doriane BEHR MASTER CAWEB
Contexte Le référencement des sites multilingues est d’autant plus d’actualité que le contexte économique dans lequel on évolue est orienté vers l’internationalisation et la mondialisation Introduction Problématique Outre la localisation, se pose également la question du référencement d’un site internet multilingue, comment optimiser l'indexation d’un site dans les différents moteurs de recherche, pour chacun des pays ou des langues cibles ?
Plan 1) La localisation des URL a)Sous-domaines b)Répertoires c)Domaines dédiés 2) Structure d’un site multilingue a)L’attribut href lang b)Le sitemap c)La détection des langues 3) Référencement et site multilingue a)Hébergement géolocalisé b)Webmastertools et Google Analytics c)Duplicate content
DEFINTIONS
Site multilingue Un site Web multilingue est un site dont le contenu est proposé dans plusieurs langues. Par exemple, une entreprise française dont le site est disponible en anglais et en français. Ne pas confondre : Site multirégional Un site Web multirégional est un site qui cible explicitement les internautes de pays différents. Certains sites sont à la fois multilingues et multirégionaux. Par exemple, un site peut proposer une version pour les États-Unis et une autre pour le Canada, et être disponible en français et en anglais dans la version canadienne.
1. URL Localisées
1) Un Sous-Domaine par langue ▧ Facilité de mise en œuvre et séparation claire des sites ▧ Possibilité d’utiliser le ciblage géographique dans le webmasters tools ▧ Acquisition d’un seul nom de domaine et création d’autant de sous-domaines que de langues ▧ L’utilisation de sous-domaines peu perdre les internautes pas habitués à ce genre d’url ▧ Chaque sous-domaine doit être indexé de façon indépendante, fastidieux et engendre un travail de référencement long ▧ Plus considérés comme des sites à part entière : linking impossible Avantages Inconvénients Exemples :
2) Un répertoire par langue ▧ Facilité de mise en œuvre ▧ Acquisition d’un seul nom de domaine et création d’autant de répertoires que de langues ▧ Peu de maintenance ▧ Pas de géolocalisation du serveur possible ▧ Séparation des sites plus complexe AvantagesInconvénients Exemples :
3) Un domaine dédié par langue ▧ Ciblage géographique clair et précis ▧ Séparation des sites : chacun à sa langue ▧ Utiliser un nom de domaine par pays : + grande proximité, + de confiance auprès des internautes. Favorise la création de liens entrants ayant une origine locale = référencement du site web sur le marché ciblé ▧ Permet une lecture facile aux moteurs de recherche dans la mesure où chaque site n’a qu’une seule langue ▧ Coût élevé : multiplication des noms de domaines et gestion (chaque site doit être référencé de manière indépendante ▧ L’acquisition des différents noms de domaine dans les pays peut être difficile car la disponibilité des différentes TLD (Top Level Domain) n’est pas assurée ▧ Peut poser problème pour les pays qui ont plusieurs langues (Suisse, Belgique, Canada) Avantages Inconvénients Exemples :
2.2. Structure d’un site multilingue
La balise “ Link href lang ” ▧ Indique les différentes versions linguistiques d’une même page : indispensable pour classer et filtrer les pages par langues -> analyseurs lexicaux et syntaxiques ▧ Indique la destination et la cible géographique des différentes variantes linguistiques. ▧ Syntaxe : link rel="alternate"; hreflang="code langue" href="URL"
Cette balise est utile quand : 1)Un site web est traduit en différentes langues : Il convient d’ajouter dans la balise du site principal ( un élément link renvoyant vers la version espagnole par exemple du site à l'adresse comme ceci : link: ; rel="alternate"; hreflang="es" Cette balise indique donc aux moteurs de recherche qu’il y a deux variantes de cette page
2) Un site possède des versions dans une même langue mais pour des pays différents (le français pour la France, la Belgique, le Canada et la Suisse). Les balises suivantes pourront alors être intégrées respectivement dans chaque site : Google saura alors la langue, mais également le pays spécifique visé et ciblé par chaque version du site : indexation dans la bonne combinaison index pays x index linguistique
Utilisation d’un sitemap ▧ Recommandé pour indiquer les pages d’un site disponible dans une autre langue compréhensible par les robots d'indexation ▧ Fournissent les attributs rel="alternate" hreflang="x", permettent d'afficher l'URL correspondant à la langue ou à la région de l'internaute ▧ Permet donc aux moteurs de recherche d'explorer le site plus intelligemment
Exemple : <urlset xmlns=" xmlns:xhtml=" <xhtml:link rel="alternate" hreflang="de" href=" /> <xhtml:link rel="alternate" hreflang="de-ch" href=" /> <xhtml:link rel="alternate" hreflang="en" href=" /> Ce sitemap nous indique que la page / a des pages équivalentes pour les internautes germanophones du monde entier ( /deutsch/) et de Suisse ( eiz-deutsch/).
Détection de la langue ▧ Problématique majeure : attribuer la bonne langue au bon pays ▧ Mettre en place un système d’orientation du site pour répondre à l’internaute dans sa langue, c’est- à-dire un système de détection des langues
Détecter la langue automatiquement -> méthode rationnelle et la plus efficace -> indiquer la langue primaire du document au navigateur web par une metadonnée -> on utilisera soit : Content-Language : it (dans l’en-tête http) Soit : (dans l’en-tête HTML) Moteur de recherche identifiera la langue d’une page
Sitemap Structure d’un site multlilingue Attribut langue Encodage détection langue Localisé et optimisé pour le référencement !
3. Référencement et site localisé
1) Hébergement géolocalisé ▧ Situation géographique d’un site influe le ranking Google ▧ Hébergement local influence positive sur le référencement ▧ Version allemande à destination de l’Allemagne sera sur un serveur avec une adresse IP allemande ▧ Autre solution: recours à un CDN (Content Delivery Network) qui permet de mettre en cache le site web pour le restituer localement de façon performante Définition CDN : réplique certaines données d’un site sur des serveurs relais, situés à proximité des internautes, de façon à améliorer les temps de chargement et donc de réponse. Chaque internaute, au moment de la lecture du contenu, accède au serveur relais le plus proche de lui et non au serveur d’origine
Hébergement géolocalisé Source :
2) GWT & Google Analytics Google Webmastertools ▧ va permettre de contrôler la façon dont Google va indexer le contenu du site ▧ mettre en place le ciblage géographique par pays (geotargeting) : Configuration > Paramètres > Zone géographique ciblée, puis sélection du pays adéquat.
2) GWT & Google Analytics 2 solutions possibles : ▧ utiliser un seul compte Analytics pour suivre l’ensemble des sites localisés. Méthode acceptable si le site comporte peu de langues. Dans le cas contraire la lisibilité et la pertinence des statistiques peuvent être remises en question. ▧ créer un tag (un compte) par site, solution plus pratique et efficace pour suivre le trafic des versions localisées. Consulter chaque compte un à un, peut être fastidieux. Cependant méthode la plus recommandée. Google Analytics
3) Duplicate content Sites multirégionaux : écrits similaires ou identiques sous des URL différentes : Google sanctionne sites au contenu dupliqué Problème complexe dans 2 cas : ▧ interface est uniquement traduit (dans ce cas les contenus seront similaires dans toutes les autres versions) ▧ pages sont subtilement localisées pour les adapter à un public local (changement mot, monnaie, prix)
Duplicate content ▧ Google doit considérer ces pages comme des pages différentes et les indexer au bon endroit. ▧ d’où l’importance de la balise hreflang qui spécifie qu’un groupe de pages représente des variantes linguistiques de la même page et indiquer à Google dans quel index linguistique les classer et les indexer et ne pas les considérer comme doublons.
Merci ! Des questions ?