La face cachée des systèmes de recherche Martin Bouchard, président Janvier 2003.

Slides:



Advertisements
Présentations similaires
Bien visible sur internet 
Advertisements

Le web 2.0 L'Internet deuxième génération ? Moussay Jérôme - Master 2LCE1/16.
Concevoir un site dans une optique de référencement Sébastien Billard Consultant référencement.
La recherche documentaire
Introduction au méta tag Cours PHP/MySQL – Année Spéciale – IUT AMIENS
« Les Mercredis du développement » Introduction Office « 12 » Présenté par Bernard Fedotoff Microsoft Regional Director Agilcom.
Participez dès aujourdhui au répertoire des SSII sur technologies Microsoft Guide pour la mise à jour du profil Société pour être visible sur
Synthèses de la législation européenne: une introduction 2009.
Chercher pour trouver Nous quittons l'ère où on courait après l'information pour entrer dans celle où l'information nous court après"Nous quittons l'ère.
Présentation BAOBAZ pour le Bargento du 2 février Magento -> SEO -> SEM -> SEO -> Magento.
Concevoir un site dans une optique de référencement.
Référencement dun site Internet Les annuaires Les moteurs Positionnement.
Réunion dinterlocuteurs documentation Mardi 31 janvier 2006 SDTICE - DUI Programme « Qualité, veille et diffusion » Jean-François PILLOU Chef de programme.
Les outils du TAL Par RIGAUD Anaïs RALLIER Armelle SANTIAGO Gwendoline
Le référencement des pages web
Le référencement des sites internet par les principaux moteurs de recherche Adrien Rimélé Alice Laurent 25 septembre
Analyse des moteurs de recherche Paul de Theux. Sommaire Google: leader presque incontesté Fonctionnement Syntaxe Limites.
Nouvelles Pratiques des catalogues. Rendre les données plus utiles sur le web. Publier des pages HTML sur lesquelles les utilisateurs et les moteurs de.
> a patent search service supplied by Patents & Technology Surveys Ltd PROFESSIONAL ONLINE PATENT INFORMATION SERVICE.
Chapitre 4 : la gestion électronique des documents
Le Référencement en Savoie Historique
XML-Family Web Services Description Language W.S.D.L.
Aide à la Recherche Bibliographique sur le WEB Hatem BEN ROMDHANE (URSAM) ENIT Janvier 2003.
Présenté par Maxime Boivin Aude Dufresne Les filtres à la communication sur Internet
Comment trouver sur Internet?
Les étapes de la recherche documentaire
Annuaires et moteurs de recherche d’information sur Internet
LE REFERENCEMENT NATUREL S.E.O. (Search Engine Optimisation)
Centre d’Excellence en Technologies de l’Information et de la Communication Moteurs de recherche Aspects techniques et retours d’expérience Christophe.
Médiathèque de Sélestat - 5 février 2005 Olivier Andrieu Comment ne pas être visible sur les moteurs de recherche.
Ordre du jour Copernic, portrait de lentreprise Copernic Enterprise Search Description du produit Fonctionnement Spécificités techniques Options offertes.
Comment optimiser la visibilité de vos contenus sur les principaux moteurs de recherches ? Rédaction de contenus SEO friendly Publication on-line.
Atelier « Créations de sites » : Les techniques de réalisation de sites EPN :...
Les Plans de Site Sitemaps Sommaire I Définition II Comment les utiliser BENINCASA Pauline 1.
Gouvernement du Québec Présentation par : Alain Thibault : PDG Efoé Wallace : Directeur du développement.
Cours 2 Recherche d'informations Espace vectoriel des sacs de mots.
Natalie Meystre Maciej Macowicz Conférence des Webmasters 22 mars 2005 Moteurs de recherche, meta-moteurs.
La recherche sur le Web Améliorer sa performance Compétences informationnelles – Activité 13 - Documentation Module 3: les moteurs académiques: Google.
VOUS ALLEZ ASSISTER A UNE DEMONSTRATION DU FONCTIONNEMENT DE LA BASE DE DONNEES DIPOUEST OUBLIEZ SOURIS ET CLAVIER ET LAISSEZ-VOUS GUIDER.
Moteurs de recherche Modex Web Modex Web 441 professeur Go
1 Référencement (phase 2) Rappel SEO (acquis) Analytics (suivi daudience) SEM (liens sponsorisés)
Les techniques des moteurs de recherche
Stage Veille sur Internet
Réaliser et diffuser un projet intégrant les TIC
Les moteurs de recherche Paul de Theux. Sommaire Google: leader presque incontesté Fonctionnement Syntaxe Limites.
Content Management System CMS. Pourquoi ? Obligation de ressaisir des contenus publiés à plusieurs endroits Pas d’outils de gestion de qualité de l’information.
Référencement naturel
SSPT – CHOPIN module 2 Système de gestion de contenu de sites web Par Liette Pothier, Chargée de projet Nancy Dodier, technicienne en informatique.
Tous droits réservés 04 octobre 2005© présente Les Moteurs de Recherche.
L’ ACCESSIBILITE « C’est mettre le Web et ses services à la disposition de tous les individus, quels que soient leur matériel ou logiciel, leur infrastructure.
Les grandes étapes de la recherche
LA RECHERCHE DOCUMENTAIRE
Concevoir un site web de A a Z Cours 3. Aujourd’hui Découper sa page en tranche pour une intégration graphique optimale avec Photoshop L’intégration des.
Campus-Booster ID : **XXXXX Copyright © SUPINFO. All rights reserved Le développement Web.
Page 1Dernière mise à jour: 17 avril 2015 Service de l'enseignement des technologies de l'information, © HEC Montréal, Tous droits réservés.
Recherche d’information
Site Web IUT 2 V3.0 Réunion WEB 24 mars 2005 Présentation du site Formations à la publication Les étapes suivantes Questions / remarques.
AJAX.
Karine Vallin - Dorian Baysset
Moteurs et métamoteurs de recherche
ORGANISATION DE L’ENSEIGNEMENT Informatique et Sciences du Numérique.
Dreamweaver Séance 1.
1 Présentation de DREAMWEAVER (1) Gaël TREMEAU GI05 Printemps 2006.
Formation.
INF2005– Programmation web– A. Obaid Les métadonnées.
1 er séance SI28 A2004 YIN Lei Emmanuel Eugene. Plan de l’exposé  Introduction au HTML  Le HTML dans le bloc-notes (notepad)  Présentation de Dreamweaver.
APP-TSWD Apprentissage Par Problèmes Techniques des Sites Web Dynamiques Licence Professionnelle FNEPI Valérie Bellynck, Benjamin Brichet-Billet, Mazen.
Internet et la recherche documentaire Comment utiliser Internet de façon pertinente ?
Simple, efficace et opérationnelle pour les PME 5 minutes pour découvrir ses.
Compétences informationnelles Choisir ses sources Connaître les outils de repérage.
Transcription de la présentation:

La face cachée des systèmes de recherche Martin Bouchard, président Janvier 2003

Historique Premier moteur de recherche Architext (Lycos) documents indexés Deuxième génération Inktomi Altavista 10 millions de documents indexés Troisième génération Google Fast (AlltTheWeb.com) >1 milliard de documents indexés

Infrastructure

Quelques concepts importants Précision Couverture (recall) « Fraîcheur »

Importance de la précision Dans le contexte dun site Web ou dune entreprise, la précision est, de loin, lélément le plus important dans le choix dun moteur de recherche.

Méthodes détablissement de la pertinence Fréquences des mots clés Popularité des pages Langage naturel « Feedback » des utilisateurs Analyse linguistique du contenu

Importance de la « fraîcheur » Les utilisateurs veulent de linformation à jour. Linformation désuète a peu de valeur. Façons daméliorer celle-ci: Lindexation à fréquence variable Lindexation « active » Lindexation « forcée » Les requêtes temporelles

Quest-ce que les gens recherchent? Sites ou micro-sites importants Documents spécifiques Informations spécifiques Personnes ou des postes Un service en ligne Données de recherche

Méta-données Les métas donnés contiennent de linformation qui améliorent grandement la précision. Il est important de pouvoir les indexer ex.: auteur, date, sujet, catégorie Déjà, plusieurs logiciels génèrent ces informations. (ex. Microsoft Word) Il faut être en mesure de générer des requêtes sur les méta-données

Problématique des méta-données Peuvent êtres utilisées à des fins de spamming sur le Net Pas assez fréquemment utilisées (25%) Inconsistance des données Duplication (documents modèles)

Lutilisateur dun moteur de recherche Effectue des requêtes de faible qualité Courtes (2,35 mots, en moyenne) Termes imprécis Syntaxe simpliste (80% des cas sans opérateur) 85% ne consultent que la première page de résultats 78% des requêtes erronées ne sont pas modifiées Études intéressantes: CHI, Hypertext, SIGIR, etc.

Divers trucs pour améliorer lindexation du contenu Utiliser des titres et des résumés descriptifs Utiliser les méta-données Utiliser XML Créer vos propres modèles de donnés

Divers trucs pour améliorer lindexation du contenu (suite) Utiliser des URLs et noms de fichiers significatifs La structure du site à un impact pour plusieurs indexeurs (et aide les usagers) : vs

Divers trucs pour améliorer lindexation du contenu (suite) Les pages dynamiques sont difficiles à indexer (ASP, JSP, CGI, pages gen. BD, pages personnalisées) Solution: Utiliser un indexeur compatible avec ce type de page Créer un profil utilisateur par défaut Faire attention aux fichier témoin (cookies) obligatoires -> le trou noir des moteurs de recherche

Divers trucs pour améliorer lindexation du contenu (suite) Les pages HTML incluant des liens référencés en JavaScript sont souvent non indexées Solution: Inclure une balise qui fournit un lien HREF

Divers trucs pour améliorer lindexation du contenu (suite) Certains indexeurs ne gèrent pas la balise META REFRESH Solution: Inclure un liens normal HREF à la nouvelle page

Divers trucs pour améliorer lindexation du contenu (suite) Certains indexeurs ne « verront » pas les liens contenus dans un cadre (frame) Solution: Inclure un lien dans une section Inclure la nouvelle page dans la page du plan du site

Critères de sélection dun moteur de recherche Solution flexible et personnalisable Outil dadministration flexible et puissant Performance et extensibilité (scalability) Facile à utiliser pour lusager final Mise à jour des index en temps réel Algorithmes de pertinence à la fine pointe de la technologie Compatibilité avec du contenu multilingue Gestion des « doublons » API flexible et documenté Qualité des résultats de recherche

Périodes de question