Approfondissement des moteurs de recherche : “SORTIR” DE GOOGLE ...

Slides:



Advertisements
Présentations similaires
Le web 2.0 L'Internet deuxième génération ? Moussay Jérôme - Master 2LCE1/16.
Advertisements

La recherche documentaire
La Rochelle, 2 et 3 février I - ACCEDER A EDUBASE HG 1 – Les accès sur Educnet pour les enseignants 2 – Laccès pour linterlocuteur et le webmestre.
Quelle stratégie adopter pour la recherche en Entreprise ?
Projet Présentation du projet
Atelier Wiki 1.Introduction 2.Définition 3.Fonctionnement 4.Ecrire sur un wiki 5.En pratique 6.Glossaire 7.Ressources.
Référencement et recherche sur le web
« ARCHEODOC, un portail dynamique pour la recherche d’information en archéologie » Véronique HUMBERT (Lattes) Blandine.
Veille informationnelle et outils du Web 2.0
Web 2.0 et métiers de la documentation Jacques PIOT - CRDP Midi-Pyrénées mars Stage PAF.
Les outils du TAL Par RIGAUD Anaïs RALLIER Armelle SANTIAGO Gwendoline
Module 1.Découverte de Netvibes Un portail personnalisé
ETAPES DE LA RECHERCHE DOCUMENTAIRE
Module 1, TD 2 : Outils de recherche du web
POUR LES ANIMATEURS EPN
Longue Traîne en Liens Sponsorisés.
> a patent search service supplied by Patents & Technology Surveys Ltd PROFESSIONAL ONLINE PATENT INFORMATION SERVICE.
Christian Ollivier IUFM / Université de La Réunion
Portefeuille de compétences et suivi de stage
LITTERATURE SCIENTIFIQUE STRATÉGIES DE RECHERCHE PMSS
Groupe de travail Veille collective
Le Référencement en Savoie Historique
1 Bibdoc 37 – Regards croisés Bibliothèques virtuelles, usages réels 7 avril 2009 – Tours « Les usages des bibliothèques virtuelles » Jean-Philippe Accart.
Aide à la Recherche Bibliographique sur le WEB Hatem BEN ROMDHANE (URSAM) ENIT Janvier 2003.
Comment trouver sur Internet?
CDI Lycée Marguerite Yourcenar La recherche d’information
réseaux, partage Les outils collectifs au service de la construction du savoir Vendredi 24/11/06 – 9h30 – 12h45.
LA PLUS GRANDE PLATEFORME VIDEO DU MONDE
Annuaires et moteurs de recherche d’information sur Internet
La veille informationnelle : principes et pratique
LE REFERENCEMENT NATUREL S.E.O. (Search Engine Optimisation)
Médiathèque de Sélestat - 5 février 2005 Olivier Andrieu Comment ne pas être visible sur les moteurs de recherche.
Ordre du jour Copernic, portrait de lentreprise Copernic Enterprise Search Description du produit Fonctionnement Spécificités techniques Options offertes.
Panorama des évolutions de la recherche d’information sur Internet
MARKETING Présentation du CDI et d’outils pour la démarche de recherche documentaire et de veille informationnelle TSTG A. PEDRIZETTI. Professeure documentaliste.
Découverte des possibilités d’un moteur 3D
La face cachée des systèmes de recherche Martin Bouchard, président Janvier 2003.
Recherche par mots-clés vs recherche en langue naturelle.
Projet ACE Robotique Soutenance Groupe 69 Meyer Jonas Lehée Guillaume
Les techniques des moteurs de recherche
18/03/091 L’information sur Internet Typologie et outils pour rechercher sur le net.
La veille numérique : un outil pour s'informer intelligemment &
Stage Veille sur Internet
L’activité de référencement dans une Web agency – Stage de 4 mois –
Les moteurs de recherche Paul de Theux. Sommaire Google: leader presque incontesté Fonctionnement Syntaxe Limites.
La veille technologique au service de l’innovation CCI 28, le 14 avril 2009 Estelle SAPIN Chargée de mission Agence Régionale d’Informations Stratégiques.
UFD 62. EC2 : cours n° 3 Gestion Electronique des Documents Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de recherche KIWI – LORIA
Et trouver ce que l’on cherche Rechercher sur Internet.
Référencement naturel
Formation ADBS – septembre 2014 – 1 Approfondir son expertise en recherche d'information 3-4 & 5 septembre 2014.
Tous droits réservés 04 octobre 2005© présente Les Moteurs de Recherche.
Les weblogs Gabriel Gallezot Urfist PacaC Présentation réalisée à partir des supports
LA RECHERCHE DOCUMENTAIRE
11 Ch. 4 Veille et web Présentation 2. L’apport du web 2.0 à la veille 3. Les limites 4. Une méthodologie propre au web 2.0.
Développement d’application Web.  Internet  WWW  Client/Serveur  HTTP.
Recherche d’information
Techniques documentaires et veille stratégique Anne Pajard, avril 2008
Thibault ROY Université de Caen / Basse-Normandie Laboratoire GREYC – Equipe ISLanD Apport d’outils d’informatique documentaire à l’analyse de forums de.
Équipe ISLanD Laboratoire GREYC Université de Caen / Basse-Normandie Des outils pour chercher sur la Toile Fête de la Science 2005.
TEXT MINING Fouille de textes
Karine Vallin - Dorian Baysset
Moteurs et métamoteurs de recherche
Un site Phare !. Pourquoi fut créé Technorati ? Technorati a été créé pour indexer en temps réel les nouveaux blogs dans une base de données consultable.
L’information commerciale, ressource stratégique.
CMS : SPIP Formation PBC – Septembre SPIP = Système de publication Internet SPIP = Système de publication Internet SPIP = CMS = Content Management.
La veille Joëlle LE MOIGNE /2015 Formation BTS Industriels 1 Image :
Intervention ReRIP – 26 mars 2008 – Mathilde Guiné Le Réseau Tela Botanica Un réseau d’acteurs au service de la botanique francophone Le projet "Outils-réseaux"
Bibliothèque Centrale de l’École Polytechnique Session pratique Recherches documentaires en sciences dures PSC 2013 septembre/octobre 2013 Denis Roura,
©Armelle Thomas - Février Méthodologies de la recherche d’information sur Internet Le tour de la question ADBS - Les jeudi de l’Internet pratique.
Compétences informationnelles Choisir ses sources Connaître les outils de repérage.
Transcription de la présentation:

Approfondissement des moteurs de recherche : “SORTIR” DE GOOGLE ... Stage URFIST de Rennes 10 mars 2009 Marie-Laure Malingre Alexandre Serres

PRESENTATION du stage Intro. : pourquoi sortir de Google ? 1/ Des ressources pour se former et s’informer 2/ Fonctionnement et typologies des moteurs de recherche 3/ Explorations de différents types de moteurs URFIST de Rennes, 2009

En introduction 4 raisons (au moins !) de sortir de Google : Briser le monopole « googléen » : Cf le Baromètre de S2M Résister à la « googlisation » des usages : Nécessaire diversification des usages, des pratiques, des outils… Adapter les outils aux besoins : Intérêt des outils spécialisés Suivre l’innovation technique des moteurs : Nombreux outils très innovants Google parfois surpassé par d’autres outils… URFIST de Rennes, 2009

1/ Des ressources pour se former et s’informer Difficultés de la veille sur les outils de recherche : Rapidité des innovations Surabondance des sources Mais remèdes dans les outils eux-mêmes : Fils RSS, portail Netvibes, blogs… Deux ressources de l’URFIST de Rennes : Sélection de ressources sur les outils de recherche Le portail Netvibes de l’URFIST de Rennes URFIST de Rennes, 2009

2.1 Fonctionnement des moteurs de recherche URFIST de Rennes, 2009 Source : R. Viseur, CETIC

2.1 Fonctionnement… : la collecte des données Le crawl = parcours de la toile par les moteurs pour aspirer les pages de sites Plusieurs modalités d’exploration du web : soumission manuelle par les webmestres, référencement payant sélection des meilleurs sites explorations aléatoires Etendue, profondeur de la collecte : Parcours des liens (horizontaux/ verticaux) différences entre les moteurs dans l’exploration des sites importance de la taille des fichiers : nbre d’octets pris en compte Paramétrages du robot : Nature des fichiers collectés : recul du « web invisible » Délai de prise en charge (soumission manuelle) : de 1 jour à 6 semaines Rythme de surveillance : « rafraîchissement » de l’index (de 2 à 8 semaines) Variable en fonction du type d’information Evolution : du batch crawling au crawler incrémental URFIST de Rennes, 2009

2.1 Fonctionnement… : l’indexation des données Deux grandes méthodes d'analyse (combinées) dans l'indexation automatisée : analyse linguistique : fondée sur la reconnaissance des mots analyse statistique : fondée sur la fréquence des mots 4 niveaux d'analyse linguistique du texte intégral: niveau morphologique : reconnaissance du mot niveau lexical : réduction du mot à sa forme canonique > lemmatisation niveau syntaxique : utilisation de la grammaire niveau sémantique : reconnaissance des concepts URFIST de Rennes, 2009

2.1 Fonctionnement… : l’indexation des données Principale méthode d’indexation automatisée : traitement statistique des mots Indexation fondée sur calcul de fréquence d’apparition des mots dans un texte : les occurrences Postulat : si l'indice de fréquence d'un mot est supérieur à son indice moyen, il doit s'agir d'un mot-clé pertinent, décrivant bien le sujet du texte. Principale méthode d’indexation sur le web URFIST de Rennes, 2009

2.1 L’indexation sémantique Niveau d ’analyse : reconnaissance des concepts, identification du sens des mots Principes : sémantique lexicale : analyse du sens des mots, reconnaissance des synonymes... sémantique grammaticale : identification et analyse des relations sémantiques entre les mots, regroupement des termes de sens proche (classes sémantiques)… utilisation des co-occurrences pour représentation des concepts Assez rare sur le web, présente surtout sur des corpus limités : Développement des classifications automatiques Indexation automatique des matériaux de presse Moteur sémantique : Portail Culture.fr, Collections URFIST de Rennes, 2009

2.1 Fonctionnement… : la gestion des requêtes et des résultats Partie visible du moteur de recherche ; trois grandes fonctions : gestion des requêtes : fonctions de recherche en mode simple et avancé, différentes options de filtrage, affinement... gestion des résultats : quels critères de classement ? question des critères de pertinence gestion de la présentation des résultats : Listes, cartographie, aperçu graphique… URFIST de Rennes, 2009

2.1 Fonctionnement… : la gestion des requêtes Fonction la plus répandue : nombreuses possibilités de filtrage géographique du web : mondial, francophone linguistique : choix de la langue des ressources des types de ressources : images, audio… des ressources internet : web, forum, messagerie, weblogs des formats : HTML, PDF, DOC, PPT, XLS, RTF… des dates : nombreuses options des champs : titre, URL, host, domaine… thématique : choix du domaine de recherche URFIST de Rennes, 2009

2.1 Fonctionnement… : la gestion des résultats Enjeux du « relevance ranking », du classement des résultats selon leur pertinence Deux grandes méthodes, imbriquées, de classement : tri par indice de pertinence : calculs statistiques sur la fréquence des termes… tri par popularité : indice de popularité Troisième voie : tri par catégorisation : calcul dynamique de catégories, ou clusters URFIST de Rennes, 2009

2.1 Fonctionnement… la gestion des résultats : l’indice de pertinence Principes : classement des résultats fondé sur la fréquence d’apparition et la localisation des termes de la requête dans une page web affichage des résultats à partir du calcul d’un score pour chaque réponse : Ex. : Requête sur le marché des DVD en France : +marché +DVD +France > retourne les documents contenant tous les mots de la requête >> documents contenant le plus de fois les mots de la requête classés en premier Utilisation : première méthode de classement utilisée sur le web, la plus répandue ; Problèmes : détournement par le spamdexing URFIST de Rennes, 2009

2.1 Fonctionnement… la gestion des résultats : l’indice de popularité Principes, origines : Utilisation de la nature hypertextuelle du web : prise en compte des liens entre sites, considérés comme des liens de parenté sémantique calcul de la notoriété d’un site en fonction du nombre de liens pointant vers le site Utilisation : indice de popularité lancé par Google en 98 originalité et succès de Google et de son PageRank Avantages de l’indice de popularité : renforcement de la pertinence réduction du spamdexing URFIST de Rennes, 2009

2.1 Fonctionnement… la gestion des résultats : la catégorisation automatique Technologies plus complexes ; domaine d’innovations avancées des moteurs et métamoteurs : cf Exalead, Grokker, certains métamoteurs (Clusty) Principes : organisation en temps réel d’un lot de résultats pour donner possibilité d’affiner ou étendre la requête répartition des documents dans des catégories Intérêt pour la recherche : aide à la sélection d’un mot-résultat aide à l’élimination des corrélations inintéressantes, suggestion d’idées et de pistes nouvelles enjeu essentiel : mise en ordre du « chaos informationnel URFIST de Rennes, 2009

2.2 Typologies des moteurs de recherche Difficultés des typologies Trois grandes catégories de critères : L’offre des ressources : Moteurs généralistes / spécialisés Diversité des spécialisations L’implication des internautes : Moteurs participatifs : collaboratifs, personnalisables… La présentation des résultats : Moteurs linéaires, visuels, cartographiques… Imbrication des critères Difficultés du critère de l’indexation URFIST de Rennes, 2009

2.2 Typologies des moteurs de recherche : l’offre des ressources Critère : type de ressources collectées Distinction principale : Moteurs généralistes : G., Yahoo, Exalead, Ask, Live Search… caractéristique historique des grands moteurs : collecte et indexation de tous les types de ressources Moteurs spécialisés : Tendance lourde des moteurs : Modules spécialisés à l’intérieur des moteurs généralistes Infinité des types de spécialisations Explosion du nombre d’outils URFIST de Rennes, 2009

2.2 Typologies… L’offre des ressources : diversité des spécialisations Choix retenu pour l’exploration : 3 critères de spécialisations : Selon les ressources internet : Moteurs de blogs, de forums, de listes de diffusion, de FAQ, de wikis, de fils RSS… Selon la nature du contenu : Moteurs scientifiques, d’actualité, de personnes, de produits… Selon la nature du média : Moteurs d’images, de vidéos, de podcasts, de photos.. Autres critères possibles : langue, géographie, domaine thématique… URFIST de Rennes, 2009

2.2 Typologies… : l’implication des internautes Difficultés de caractérisation du critère, très récent : Intégration des aspects « web 2.0 » dans les moteurs Critère principal : aspect « social » des moteurs de recherche Degré, nature, modalités… d’implication des internautes dans le moteur de recherche Deux types de moteurs présentés : Moteurs collaboratifs : Wikia Moteurs personnalisables : Rollyo Tendance de développement des moteurs importante : enjeux économiques, image des outils… URFIST de Rennes, 2009

2.2 Typologies… : la présentation des résultats Innovations les plus spectaculaires à venir : les interfaces, la présentation des données Distinctions possibles : Moteurs linéaires, classiques Moteurs cartographiques, à clusters Moteurs visuels Moteurs parlants ? … URFIST de Rennes, 2009

2.2 Typologies… : l’indexation des données ? Critère : mode d’indexation des données Typologie possible selon les différents niveaux d’indexation linguistique : Moteurs d’indexation : Morphologique Lexicale Syntaxique Sémantique Typologie difficile à utiliser en pratique Imbrication des modalités d’indexation Enjeux des moteurs sémantiques URFIST de Rennes, 2009

3/ Explorations des différentes catégories de moteurs Des moteurs pour trouver d’autres moteurs 3.1 Moteurs généralistes : Exalead, Yahoo 3.2 Moteurs « participatifs » : Wikia 3.3 Moteurs spécialisés : Selon différents types de ressources 3.4 Moteurs sémantiques 3.5 Moteurs visuels, cartographiques… URFIST de Rennes, 2009

3.1 Exploration des moteurs : Les moteurs généralistes : Exalead Créé par François Bourdoncle (ingénieur de l’Ecole des Mines) en 1999. Moteur très innovant Entreprise française en plein développement Plateforme technologique et de services pour entreprises : 2ème place en France Moteur grand public, mais audience limitée : 1 million de visiteurs uniques / mois Orientation technique : aider l'usager dans la recherche d'information Intégration de la serendipité Exalead partie prenante du projet Quaero URFIST de Rennes, 2009

3.1 Exploration des moteurs : Les moteurs généralistes : Exalead Un moteur innovant dans le traitement et la présentation des résultats : Processus de catégorisation (a posteriori) Analyse statistico-sémantique des pages de résultats, conduisant à l’identification des mots et expressions les plus fréquents Aperçu graphique du contenu de la page / prévisualisation Nombreuses possibilités d'affinement de la requête : Rubriques associées Limitation par zones géographiques Différents types de fichiers Recherches spécialisées : actualité, RSS... URFIST de Rennes, 2009

3.1 Exploration des moteurs : Les moteurs généralistes : Exalead Principales innovations et applications : Affinement de la recherche dans les blogs et forums.. Filtre “visages” (module Images) : partenariat avec LTU Technologies ; exemple Partenariat avec l’INIST Nouveau module de recherche sur Wikipedia Module de recherche de vidéos Intégration des tags dans la recherche Création d'un blog (ExaBlog) de l'entreprise Création de Baagz, plate-forme communautaire Offre gratuite du moteur de bureau Exalead Desktop Offre payante de CloudView (nuage informationnel) URFIST de Rennes, 2009

3.1 Exploration des moteurs : Les moteurs généralistes Yahoo Search Moteur né en février 2004, après l’annuaire et le portail Fait partie du trio de tête des moteurs de recherche 15 à 20 milliards de pages indexées (cf. O. Andrieu) Concurrence permanente avec Google et Microsoft Politique de développement de niches de recherche Yahoo Search et le web 2.0 > Comblement du retard sur le secteur du web 2 personnalisation et partage avec “Mon Web 2.0” recherche sur les flux RSS, etc. Double orientation stratégique de Yahoo : Intégrer à ses services des fonctions de réseau social Favoriser le développement d’applications tierces pour ses produits = “open strategy” URFIST de Rennes, 2009

3.1 Exploration des moteurs : Les moteurs généralistes Yahoo Search Quelques développements récents de Yahoo et projets en cours BOSS : Build your Own Search Engine / Moteurs thématiques avec « Vertical Lens » Nouvelle page d’accueil Possibilité de créer de petits réseaux sociaux dans les services Yahoo et mise à jour des services Lancement de Yahoo Buzz Barre d’outils Yahoo : suggestion de mots pour la requête Yahoo! Search Assist : mots clés et images (Yahoo Images) dans les suggestions Paramétrage de Modules de résultats Version américaine de Yahoo! Glue en test > Recherche universelle Sécurisation de la recherche avec Search Scan Projet Bloc-note Search Pad : historicisation des recherches + commentaires Projet OneConnect/OneSearch Possibilité de créer de petits réseaux sociaux dans les services Yahoo et mise à jour des services Passerelles Mail / Flickr / Wordpress / applications tierces Ouverture du code de son outil Browser Plus Mon Yahoo > Add Content pour ajouter des applications Yahoo Musique et Yahoo TV Yahoo continue donc ses expérimentations et présente quelques nouveautés originales, comme ce Newsglobe. Cette application en ligne, qui se base sur les différents flux RSS de Yahoo !, propose donc une planète en trois dimensions, sur laquelle différentes actualités localisées apparaissent. Pour chaque région du globe, un marqueur rouge apparaît, signalant que le globe propose des actualités à propos de cet endroit. En outre, plus le marqueur est grand, plus il y a d’actualités à afficher. S’il ne s’avère pas indispensable ni particulièrement pratique, ce Newsglobe reste néanmoins une manière très originale et agréable de se tenir au courant des actualités dans le monde entier. La simple phrase « sit back, relax, and enjoy the show » (asseyez-vous, relaxez-vous, et appréciez le spectacle) du mode automatique résume à elle seule le côté original de cette manière de se tenir informé. Il ne manque donc plus qu’un moyen de personnaliser les flux RSS utilisés par cette application pour en faire un outil vraiment appréciable. Yahoo! vient de lancer Yahoo! Live, un nouveau service qui permet aux utilisateurs de diffuser de la vidéo en direct sur son portail Internet. Ce service est à l'image de ce qui est déjà offert sur Justin.tv, à mi-chemin entre un YouTube en direct et les vidéo-chats privés. URFIST de Rennes, 2009

3.2 Moteurs «participatifs » : moteurs personnalisables Des moteurs “sur mesure” / recherche verticale Choix par l’internaute du périmètre des recherches : ensemble donné de sites web, thématique précise, type d’informations Compte gratuit Système de veille Des plateformes ouvertes / API de recherche Création de moteurs à la demande Personnalisation dans la page de résultats (ajouts, tri, présentation) URFIST de Rennes, 2009

3.2 Moteurs «participatifs » : moteurs personnalisables Concurrence des “3 grands”: Google CSE : Google Custom Search Engine Live Search : Live Search macros Yahoo : Interface utilisateurs Alpha Pour les développeurs : Yahoo : Yahoo! Search Boss Mais aussi d’autres acteurs : Rollyo : http://www.rollyo.com/ Buildasearch : http://buildasearch.com/ Les Swickis d’Eurekster : http://www.eurekster.com/ URFIST de Rennes, 2009

3.2 Moteurs «participatifs » : moteurs « contributifs » Principes : Enrichissement de la recherche par les internautes Exemples : Wikia Search : lancé le 7 janvier 2008 par Jimmy Wales (Wikia Inc.) Alternative communautaire aux moteurs généralistes Sur le modèle de Wikipédia Introduit la pondération des documents web par des internautes qualifiés et la méthode d’indexation ouverte (par le biais de mini-articles) Yoono Basé sur les recommandations des internautes URFIST de Rennes, 2009

3.3.1 Moteurs spécialisés : selon les ressources internet Pour trouver ou chercher dans : Des listes de diffusion : Francopholistes Des forums : Yahoo Groups Des FAQ : QueryCat Des blogs : Technorati, Sphere Des wikis : Qwika   Des fils RSS : RSSfeeds Des réseaux sociaux : YoName Des plates-formes de partage de signets :Thagoo  Pour chercher dans les ressources web 2.0 : Un métamoteur de fils RSS : MetaRSS URFIST de Rennes, 2009

3.3.2 Moteurs spécialisés selon la nature du contenu : moteurs d’actualités Modules ou services proposés par les outils de recherche Agrégation de multiples sources d’actualité : Presse, blogs, sites web… Revues de presse automatisées Services gratuits : alertes… Nombreux moteurs d’actualité : Précurseur : Google News Modules spécialisés : Yahoo News, Concurrence aiguë, enjeux économiques importants Problèmes et conflits juridiques URFIST de Rennes, 2009

3.3.2 Moteurs spécialisés selon la nature du contenu : moteurs d’actualités Anglophones : Yahoo News Alltheweb News Rocket News Digg Topix : 2004 Agrégateur d’actualités localisées Voir Bases Francophones : Yahoo France Actualités DeepIndex News Widepress Voir Archimag URFIST de Rennes, 2009

3.3.2 Moteurs spécialisés selon la nature du contenu : moteurs d’actualités Un exemple : Wikio indexe sources de presse et blogs ; annonce 64312 blogs et sites d’actualités indexés (dont plus de 55800 blogs) modules spécialisés sur les Actualités, les blogs, le shopping, et « Live » : suivi de l’actualité en temps réel (de l’indexation…) agrégation des billets et nouvelles, selon plus de 30 000 catégories  Technologie d’indexation sémantique classement des blogs « influents » par catégories, selon le nombre de rétroliens ; voir http://www.wikio.fr/blogs/top/science Nombreuses innovations technologiques : cf les Wikio Labs voir notamment Backlink Factory  URFIST de Rennes, 2009

3.3.2 Moteurs spécialisés selon la nature du contenu : moteurs scientifiques Moteurs spécialisés sur les ressources scientifiques Plusieurs types, plusieurs statuts… Moteurs de recherche scientifiques : Google Scholar : toutes disciplines Scirus : sciences exactes Academic Index : toutes disciplines CiteSeer.IST : sciences physiques et de l’ingénieur In-extenso.org : SHS Moissonneurs OAI : OAIster : toutes disciplines Michael : culture, arts, patrimoine URFIST de Rennes, 2009

3.3.2 Autres moteurs spécialisés selon la nature du contenu Pour trouver : Des informations sur les entreprises : Accoona Des informations sur les produits : Kelkoo Des informations sur des personnes : Spock, 123People Des offres d’emploi : Moovement.fr Des sites, des villes, des organisations géolocalisées : Geolocalisation URFIST de Rennes, 2009

3.3.3 Moteurs spécialisés : selon la nature du « média » Pour trouver : Des images : Les modules images des moteurs : Exalead Images, Yahoo Images … Picsearch Des vidéos : Modules vidéos des moteurs généralistes : Exalead Vidéos Blinkx Recherche en texte intégral sur des émissions de télé et de radio grâce à un système de reconnaissance vocale Des podcasts : Casteropod : Exemple de podcast de formation Des musiques : Seeqpod URFIST de Rennes, 2009

3.4 Les moteurs de recherche sémantique Emergence de nouvelles catégories de moteurs : Hakia : Lancé en 2006 moteur de requêtes en langage naturel mélange d'analyse sémantique, d'ontologie, de logique floue et d'intelligence artificielle Powerset : Mai 2008 ; racheté par Microsoft en juillet 08 Recherche sémantique sur Wikipedia Analyse des phrases contenant les mots d’une requête Propositions de nombreux mots-clés URFIST de Rennes, 2009

3.5 Présentation des résultats : moteurs visuels, cartographiques SearchMe Version de test d’un moteur de recherche visuel reposant sur la technologie flash Visualisation directe par feuilletage des sites répondant à la requête (captures d’écran) Aperçus graphiques sur Exalead Vignettes et aperçus des sites en parallèle à la liste des résultats Moteurs cartographiques : Grokker Regroupement visuel des résultats en un seul plan graphique Catégories contextuelles Liens entre les sites URFIST de Rennes, 2009