COMMENT FONCTIONNE GOOGLE
QUE FAIT UN MOTEUR DE RECHERCHE? Contrairement à une base de données structurée dont on peut facilement extraire des informations, le WEB est une immense collection de textes de toutes natures qui évolue en permanence.
Le moteur de recherche copie préalablement les pages sur des milliers dordinateurs ( pour Google!) et les trie par ordre alphabétique (selon les mots clé). Lors dune requête relative à un mot clé, le moteur répond par la liste des pages contenant ce mot clé. Mais il y en a des dizaines de milliers en général.
LE CLASSEMENT PAR ORDRE DE PERTINENCE Cest ici quintervient linnovation de Larry PAGE (fondateur avec Serguei BRIN de Google) connue sous le nom de PAGERANK. Lidée est de répondre à la requête en citant les pages par ordre de pertinence.
Le WEB est un graphe Le Web a une structure due au fait que les pages se citent mutuellement. cest le principe de lhypertexte : les pages se citent mutuellement par les fameux liens. On va donc partir de lidée que plus une page est citée, plus elle est pertinente. On verra à la fin que ce principe a des limites.
Voilà en miniature comment se présente le graphe:
Mise en place dun degré de pertinence 1)Comptage « naïf » Il est clair quune page importante reçoit de nombreux liens. Naïvement, on peut croire que si une page reçoit beaucoup de liens, elle est importante et on définit son importance par:
Le modèle final
Avec p=0,15, on obtient assez rapidement la limite à 0,01 près
En guise de conclusion Au départ Google se voulait un outil descriptif. Si une page est importante, elle doit apparaître en tête du classement. Mais le succès de Google la transformé en outil normatif: si une page apparaît en tête, alors elle est considérée par la communauté comme importante!