Google, un moteur de recherche comme les autres ? Laurent CHERKI Brice DUTHEIL Guillaume GERME Google, un moteur de recherche comme les autres ?
Introduction Fondateurs Larry Page Sergey Brin
Introduction Statistiques Google en Europe en 2004 Google, le premier moteur de recherche en France 60% des parts de marché selon xiti (entreprise qui Statistiques Google en Europe en 2004
Introduction Google, un moteur comme les autres ?
Plan Principes et idées fondatrices. Google, une recette originale. Google, « googol » Google, « large-scale search engine » Google, efficace Google, une recette originale. Google, architecture Aspiration. Indexation PageRank Fonctionnement Limites Infrastructure Avenir et concurrence. Un marché disputé Les pistes de recherches
Principes et idées fondatrices Google, « googol » La mission : Garantir à ses utilisateurs les solutions de recherche les plus confortables, les plus complètes et les plus précises Google ? Néologisme sur le mot googol googol = 10100 Les fondateurs ont des le debut pris la conscience que la tache allait s’effectuer sur une nombre important de document. Le nom de google vient de googol qui veut dire 10puissance100 de quoi de document introduction à la diapo suivante recherche sur l’ensemble du web
Principes et idées fondatrices Google, « large-scale search engine » Pas d’intervention humaine Recherche sur une base de donnée Utilisation des algorithmes Yahoo Cout => pas d’intervention humaine Utilisation
Principes et idées fondatrices Google, efficace Résultats de qualité. Recherche rapide on ne peut pas payer sa place Comment qualifier les resultats d’une recherche seulement les 10 premiers resultats sont regardés par un internaute Le nombre de requete est tres important donc les temps de réponses doit être le plus court possible
Google, une recette originale L’ architecture de Google
Google, une recette originale L’aspiration But : télécharger le web Composée de : Crawler « Repository » Tache difficile et sensible Limite : Multiplication des pages Le silence Sites fantômes
Google, une recette originale L’indexation But : analyse et trie des documents Composée de : « Indexer » « Sorter » « Barrel » Construction d’un double index « forward index » « inverted index » Transition sur la qualité des documents PageRank
Google, une recette originale Le PageRank Qu’est ce que le PageRank ? le Concept, le principe de fonctionnement La formule.
Google, une recette originale Le PageRank Expression mathématiques Avec comme variables : P : page P d : facteur d’absorption PageRank(Ti) : PageRank de la page Ti C(Ti) : nombre de liens sortants de la page Ti
Google, une recette originale Le PageRank Limite : Méthode qui devient trop connue Ne tient pas compte de la vraie structure du web Ne prend pas en compte d’information sémantique
Google, une recette originale L’infrastructure Cluster : Composé de : plusieurs dizaines de milliers d’ordinateur bas de gamme Principe : Répartition de la charge Intérêt : Réduction des coûts Haute tolérance de panne
Avenir et concurrence Un marché disputé Search « Clustered Search » ex: ,
2 1 1 3 Avenir et concurrence Les pistes de recherche Recherche sur l’ordinateur 2 1 Moteurs spécialisés 1 Diversification des moyens d’accès 3 1. Utilisation de la techno google plus sur le web
2 1 1 3 2 Avenir et concurrence Les pistes de recherche Recherche sur l’ordinateur 2 1 Moteurs spécialisés 1 Diversification des moyens d’accès 3 2 1. Utilisation de la techno google plus sur le web
2 1 1 3 2 3 Avenir et concurrence Les pistes de recherche Recherche sur l’ordinateur 2 1 Moteurs spécialisés 1 Diversification des moyens d’accès 3 2 1. Utilisation de la techno google plus sur le web 3 SMS
En conclusion nous pouvons maintenant répondre à la problématique posée : Est il un moteur de recherche comme les autres ?
Conclusion Laurent CHERKI - Brice DUTHEIL- Guillaume GERME