La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

M2-RT - F.-G. Carpentier - 20111 Référencement et recherche sur le web N.B. Plan du document et exemples tirés de : Defosse M.-F.. et al., La recherche.

Présentations similaires


Présentation au sujet: "M2-RT - F.-G. Carpentier - 20111 Référencement et recherche sur le web N.B. Plan du document et exemples tirés de : Defosse M.-F.. et al., La recherche."— Transcription de la présentation:

1 M2-RT - F.-G. Carpentier - 20111 Référencement et recherche sur le web N.B. Plan du document et exemples tirés de : Defosse M.-F.. et al., La recherche dinformation, Formation au C2i, http://w2.c2imes.org/PDF/B2.pdf http://w2.c2imes.org/PDF/B2.pdf http://w2.c2imes.org/page_B2.html

2 M2-RT - F.-G. Carpentier - 20112 Quelques « adresses internet » http://www.univ-brest.fr http://bossa.univ-st-etienne.fr:8080 http://geai.univ-brest.fr/~carpenti/ http://geai.univ-brest.fr/recherche/index.html#publis https://www.secure.bnpparibas.net/ ftp://ftp.nai.com

3 M2-RT - F.-G. Carpentier - 20113 Schéma général dune URI URI : Uniform Resource Identifier URL : Uniform Resource Locator Schéma général : Scheme://nom:mot de passe@ machine.domaine.suffixe:port/ chemin/fichier?parametre=valeur

4 M2-RT - F.-G. Carpentier - 20114 Scheme : protocole utilisé. Exemples : http : hypertext transfer protocol https : http sécurisé ftp : file transfert protocole telnet : telnet Liste non exhaustive. Essayer par exemple, dans Mozilla Firefox : about:plugins ou about:config Syntaxe dun URI - Partie I

5 M2-RT - F.-G. Carpentier - 20115 www.univ-brest.fr www : nom (ou alias) de la machine serveur N.B. De nombreux sites Web ont un nom commençant par www. Mais ce nest quune convention… univ-brest.fr : domaine.fr : suffixe du domaine (top level domain) Exemples :.be,.uk,.eu,.net,.org,.com,.edu Syntaxe dun URI - Partie 2

6 M2-RT - F.-G. Carpentier - 20116 Top level domains - sur deux lettres : pays (ccTLD) Ex :.be,.uk,.fr -autres : domaines th é matiques (gTLD) Ex. :.com,.edu,.gov,.info, etc - voir : http://www.iana.org/domains/root/db/ Syntaxe dun URI - Partie 3

7 M2-RT - F.-G. Carpentier - 20117 Ex: http://bossa.univ-st-etienne.fr:8080http://bossa.univ-st-etienne.fr:8080 Un serveur Web utilise en général le port 80. Autrement dit, on pourrait insérer :80 dans la plupart des URI. Mais, en utilisant dautres ports, on peut disposer de plusieurs serveurs sur une même machine. Syntaxe dun URI - Partie 4

8 M2-RT - F.-G. Carpentier - 20118 Chemin et fichier : Hiérarchie de répertoires et nom du fichier demandé Cas particuliers et remarques : geai.univ-brest.fr/~carpenti : site personnel de lutilisateur carpenti Technologie utilisée : geai.univ-brest.fr/secretariats.html : page html geai.univ-brest.fr/~carpenti/statistiques/table1.php : page en php www.rpfrance.eu/spip.php?rubrique=2 : site utilisant le CMS SPIP geai.univ-brest.fr/~carpenti geai.univ-brest.fr/secretariats.html geai.univ-brest.fr/~carpenti/statistiques/table1.php www.rpfrance.eu/spip.php?rubrique=2 Syntaxe dun URI - Partie 5

9 M2-RT - F.-G. Carpentier - 20119 Moteurs et annuaires Annuaires bases de données gérées manuellement par des documentalistes Moteurs de recherche bases de données alimentées par des robots logiciels Méta-moteurs interrogent en parallèle différents moteurs et compilent les résultats Objectif commun : permettre la recherche dinformations

10 M2-RT - F.-G. Carpentier - 201110 Annuaires Ce sont des bases de données renseignées manuellement. Les auteurs proposent leur site au référencement Un documentaliste apprécie lintérêt du site, rédige un descriptif, classe le site dans une catégorie... Avantages : bonne qualité générale des informations fournies Inconvénients : en général taille assez réduite

11 M2-RT - F.-G. Carpentier - 201111 Exemples dannuaires Open Directory Project : www.dmoz.orgwww.dmoz.org Les vrais annuaires deviennent de plus en plus rares. On peut citer :

12 M2-RT - F.-G. Carpentier - 201112 Exemple: recherche sur ODP (1) La Recherche par Navigation Appeler la page http://www.dmoz.org En descendant dans l'arborescence, trouver dans la rubrique impressionnisme : - la rubrique des peintres impressionnistes, -une liste de sites consacrés à l'impressionnisme. Sol.: Art - Art History - Periods and movements - Impressionism Il est clair que cette recherche par navigation conduit à des résultats généraux apportant des informations sur le contexte du thème cherché.

13 M2-RT - F.-G. Carpentier - 201113 Exemple: recherche sur Yahoo! (2) La Recherche par mots-clés Les mots-clés sont entrés dans la boîte de recherche et la recherche sera faite dans la rubrique concernée ( et non sur l'ensemble du Web ). Recherche simple Entrer dans la boîte de recherche le nom d'un peintre impressionniste connu (par ex. Renoir). Observer les résultats. Recherche avancée Cliquer sur le lien : Advanced Search Lancer une recherche sur la requête : Renoir OR Monet Observer les résultats.

14 M2-RT - F.-G. Carpentier - 201114 Moteurs de recherche Un robot logiciel (spider, crawler) parcourt le Web à la recherche de nouvelles pages à indexer Le contenu des pages trouvées est indexé dans une base de données Avantages : nombreuses pages indexées Inconvénients : fonctionnement peu intelligent.

15 M2-RT - F.-G. Carpentier - 201115 Exemples de moteurs AllTheWeb (Yahoo) : www.alltheweb.comwww.alltheweb.com Altavista (Yahoo) : www.altavista.com, www.altavista.frwww.altavista.comwww.altavista.fr Ask.com France : fr.ask.comfr.ask.com Excite : www.excite.com, www.excite.frwww.excite.comwww.excite.fr Exalead : www.exalead.frwww.exalead.fr Francité : www.francite.comwww.francite.com Google : www.google.com, www.google.frwww.google.comwww.google.fr Hotbot : www.hotbot.lycos.com, www.hotbot.frwww.hotbot.lycos.comwww.hotbot.fr Bing : www.bing.comwww.bing.com Yahoo! Search : fr.search.yahoo.comfr.search.yahoo.com

16 M2-RT - F.-G. Carpentier - 201116 Meta-moteurs Interrogent en parallèle plusieurs moteurs de recherche Suppriment (en principe) les doublons dans les réponses obtenues Renvoient à lutilisateur une compilation des résultats Metacrawler : www.metacrawler.comwww.metacrawler.com Dogpile : www.dogpile.comwww.dogpile.com Exemples de meta-moteurs

17 M2-RT - F.-G. Carpentier - 201117 Nouveaux outils de recherche Renouveler le concept de moteur de recherche Traitement plus « conceptuel » des requêtes Wolfram Alpha : www.wolframalpha.comwww.wolframalpha.com Exemple

18 M2-RT - F.-G. Carpentier - 201118 Meta-moteur particulier Ixquick : http://www.ixquick.com/fra/ http://www.ixquick.com/fra/ Pr é serve l anonymat de la recherche (et é ventuellement permet une consultation anonyme des pages s é lectionn é es)

19 M2-RT - F.-G. Carpentier - 201119 Limites de la démarche Moteurs de recherche et annuaires permettent-ils laccès à lensemble du Web ? Réponse : pas du tout. Certains auteurs estiment même que 90 % de linformation présente sur le Web leur échappe Parmi les obstacles à lindexation : - les images, les vid é os - les documents de formats autres que HTML - les bases de données et le Web dynamique

20 M2-RT - F.-G. Carpentier - 201120 Référencement dun site Position du problème : nous avons réalisé un site, qui est mis en ligne chez un hébergeur. Avons-nous une chance de voir le site apparaître dans les réponses dun moteur de recherche ? Réponse : non, pratiquement aucune, si nous ne demandons pas le référencement du site, mais il existe une abondante litt é rature et des entreprises sp é cialis é es dans le r é f é rencement.

21 M2-RT - F.-G. Carpentier - 201121 Référencement sur un annuaire Tous les moteurs et les annuaires proposent des formulaires permettant de demander linscription du site. Pour les annuaires, les indications à fournir sont simples : - adresse (url) du site - résumé du contenu - « catégorie » souhaitée Exemple : référencement sur ODP : afficher la page www.dmoz.orgwww.dmoz.org, puis cliquer sur « Suggest URL ».

22 M2-RT - F.-G. Carpentier - 201122 Référencement sur un moteur de recherche En principe, pour lindexation sur un moteur de recherche, il suffit dindiquer la page daccueil du site. Le spider explorera ensuite les différentes pages en suivant, de façon récursive, tous les liens rencontrés. « SEO » et « SEM » : Le référencement « de base » est gratuit, mais il est aussi possible de payer... Exemple : r é f é rencement sur Google : cliquer sur « A A propos de Google propos de Google »

23 M2-RT - F.-G. Carpentier - 201123 Problèmes liés au référencement Il ne suffit pas de demander le référencement…. Problèmes de délais : parfois plusieurs mois pour que notre demande soit prise en compte De même, pour les moteurs de recherche, délai important entre deux visites « blacklisting » volontaire. Voir à ce sujet : http://cyber.law.harvard.edu/filtering/google/results1.html

24 M2-RT - F.-G. Carpentier - 201124 Rester référencé… Jai proposé mon site au référencement… - suis-je sûr de le voir accepté ? - restera-t-il référencé ? - où apparaîtra-t-il dans les réponses des moteurs ?

25 M2-RT - F.-G. Carpentier - 201125 La stratégie Google Google évalue la « popularité » dun site daprès le nombre de liens pointant vers ce site : page rank Le calcul du page rank sest affin é au cours du temps : prise en compte é galement du page rank des pages pointant vers le site. Pour é viter les strat é gies visant à gonfler artificiellement le page rank d un site : trust rank.

26 M2-RT - F.-G. Carpentier - 201126 Scoring En principe, indexation en « texte intégral » En fait : - exploration tronquant les pages trop longues - poids différents donnés aux différentes parties du document (titres, parties marquées par des balises, etc) - problème des images : renseigner correctement les attributs ALT=….

27 M2-RT - F.-G. Carpentier - 201127 Guider les robots indexeurs Balises meta : Normalisation Dublin Core { "@context": "http://schema.org", "@type": "ImageObject", "contentUrl": "http://images.slideplayer.fr/1/492467/slides/slide_27.jpg", "name": "M2-RT - F.-G.", "description": "Carpentier - 201127 Guider les robots indexeurs Balises meta : Normalisation Dublin Core

28 M2-RT - F.-G. Carpentier - 201128 Piloter le robot indexeur Le fichier robots.txt. Exemple : User-agent: * Disallow: /manual User-agent: susedig Disallow: Les balises meta robots

29 M2-RT - F.-G. Carpentier - 201129 Recherche dinformations Utiliser les moteurs et les annuaires pour rechercher de linformation - les outils ont des capacités variées, mais sont complémentaires - ne pas se limiter à un seul moteur - utiliser les possibilités de recherche « étendue »

30 M2-RT - F.-G. Carpentier - 201130 Syntaxe de recherche sur Google - par défaut, un ET entre les différents termes spécifiés - non-prise en compte des mots « vides », sauf sils sont précédés de « + » - guillemets permettant de spécifier une expression - caractères accentués ignorés - ciblage de la recherche : opérateurs link: et site: - pas de jokers

31 M2-RT - F.-G. Carpentier - 201131 Syntaxe utilisée par Yahoo! Search http://fr.search.yahoo.com/web/advanced?ei=UTF-8&p= - Opérateurs booléens : AND (implicite), OR, NOT (ou -) - Pas de prise en compte des diacritiques, des majuscules - Singulier / pluriel, etc pris en compte - Expressions : guillemets - Indicateurs de « niveau de recherche » : intitle: inurl: site: Voir aussi : http://siteexplorer.search.yahoo.com/http://siteexplorer.search.yahoo.com/ - inlinks:

32 M2-RT - F.-G. Carpentier - 201132 Recherche simple sur Google Penser à configurer les options : menu « Param è tres de recherche » : En particulier : langue, saisie semi-automatique, etc

33 M2-RT - F.-G. Carpentier - 201133 Exemple: recherche simple sur Google (1) Rechercher des cours d'Internet ( enseignant l'Internet ) sur les pages Web écrites en français... La recherche simple Soit le modèle de recherche suivant : a/ Exprimer clairement l'objet de la recherche : je veux trouver des cours d'Internet b/ Extraire les mots-clés correspondants : Internet ( ou Web ) cours ( ou guide ou tutoriel ) leçons ( ou exercices ) c/ Ecrire des requêtes possibles internet guide leçons internet tutoriel exercices etc... Attention à l'orthographe, bien que Google supporte les fautes d'orthographe !

34 M2-RT - F.-G. Carpentier - 201134 Exemple: recherche simple sur Google (2) En appliquant ce modèle, effectuer avec Google les recherches suivantes: - Rechercher des écrivains ou des poètes. - Pour chacun des poètes ci-dessous, retrouver une page portant les informations suivantes : - Arthur Rimbaud : son portrait ( ou sa caricature ), sa biographie. - Guillaume Apollinaire : son portrait, sa biographie. - Georges Brassens : son portrait, sa biographie.

35 M2-RT - F.-G. Carpentier - 201135 Exemple: recherche simple sur Google (3) - Recherche sur des artistes ou des oeuvres d'art. - Rechercher des pages significatives sur le peintre français Antoine Watteau, sa biographie. - Rechercher directement l'oeuvre suivante : " Pèlerinage à l'île de Cythère "

36 M2-RT - F.-G. Carpentier - 201136 Exemple: recherche simple sur Google (3) - Rechercher la chanson comportant le morceau de phrase suivant : « Les gens qui voient de travers » - Retrouver le poème portant le bout de phrase : " Voie lactée ô soeur lumineuse "

37 M2-RT - F.-G. Carpentier - 201137 Exemple: recherche simple sur Google (4) Recherche rapide de media, institutions, entreprises, etc... (Plutôt que d'essayer des URLs approximatives, on lancera une recherche simple sur le nom cherché : on obtiendra toujours la page cherchée dans les 2 ou 3 premiers résultats). Trouver les pages d'accueil suivantes : En France : l'Université de Toulouse Le Mirail, la mairie de Toulouse, la mairie de Paris, la mairie de Biarritz, le gouvernement, l'académie française, le constructeur Peugeot, le musée du Louvre etc... Le Monde, Le Figaro, Libération, Le Point, L'Express etc... A l'étranger : le MIT, la CIA, le FBI, la NASA, la Maison Blanche, le musée du Prado de Madrid, le musée des Offices de Florence en Italie, le New York Times, die Welt, the Times, the Guardian, El Pais, Il Corriere della Sera etc...

38 M2-RT - F.-G. Carpentier - 201138 Recherche avancée avec Google: lancienne interface

39 M2-RT - F.-G. Carpentier - 201139 Recherche avancée avec Google: la nouvelle interface

40 M2-RT - F.-G. Carpentier - 201140 Préciser sa recherche avec Google Exemple : vous cherchez des informations sur l î le de Java - Que renvoie le mot-cl é « Java » ? - Comment pr é ciser la recherche ? Et si on cherche des information sur la danse du même nom, sur le langage de programmation Java ?

41 M2-RT - F.-G. Carpentier - 201141 Exemple: recherche avancée sur Google (5) Faire varier les champs de recherche : Chercher : - "cours internet" dans les pages, - "cours internet" dans les titres, - cours internet dans les titres. Comparer les résultats.

42 M2-RT - F.-G. Carpentier - 201142 La recherche dimages Même principe que la recherche de documents textuels, mais problèmes liés à lindexation. Google utilise en général : - soit le nom du fichier - soit le contenu de la balise « alt » dans le code HTML de la page :

43 M2-RT - F.-G. Carpentier - 201143 La recherche dimages (2) Exercice : Cherchez les portraits dun personnage connu en utilisant loption « images » de Google Affichez le site affichant lun deux Recherchez lindice à partir duquel Google a pu référencer cette image. Pour cela, vous devrez sans doute afficher le code source de la page.

44 M2-RT - F.-G. Carpentier - 201144 Recherche comparée sur Yahoo! et Google Recherche sur une donnée institutionnelle Rechercher avec Yahoo! les informations sur les présidents de la république française ( on s'intéressera aux sites qui sont strictement dans l'annuaire ). Rechercher avec Google ces mêmes informations ( on s'intéressera aux pages trouvées directement avec Google ).

45 M2-RT - F.-G. Carpentier - 201145 Recherche comparée sur Yahoo! et Google Recherche d'une donnée historique Rechercher avec Yahoo! des informations brèves sur 4 Châteaux de la Loire. Rechercher avec Google ces mêmes informations. Recherche d'une donnée de type culture populaire Rechercher avec Yahoo! les chansons sur Paris, paroles, auteurs, compositeurs ( on s'intéressera aux pages qui sont sélectionnées directement par les requêtes ). Rechercher avec Google ces mêmes informations.

46 M2-RT - F.-G. Carpentier - 201146 Moteur de recherche Exalead Adresse : http://www.exalead.fr - Se veut une alternative à Google - Des possibilit é s é tendues pour affiner la recherche. Par exemple :http://www.exalead.fr * Types de sites * Recherche phon é tique * Orthographe approch é e

47 M2-RT - F.-G. Carpentier - 201147 Recherche de publications scientifiques Le SUDOC (Système Universitaire de documentation) est le catalogue collectif des universités françaises. Adresse : http://corail.sudoc.abes.frhttp://corail.sudoc.abes.fr Le catalogue de la BU de lUBO : Adresse : http://portail-scd.univ-brest.fr/http://portail-scd.univ-brest.fr/ Google Scholar : Adresse : http://scholar.google.comhttp://scholar.google.com

48 M2-RT - F.-G. Carpentier - 201148 Exemple de recherche sur SUDOC (1) Comparez le nombre de résultats retournés après les recherches : - vie rurale - "vie rurale " Solution : les termes sans guillemets retournent plus de 6200 réponses (le système prendra les termes " vie " et " rurale " indépendamment), alors que l'expression entre guillemets en retourne 1700 (le système ne prenant que les deux termes réunis).

49 M2-RT - F.-G. Carpentier - 201149 Exemple de recherche sur SUDOC (2) Rechercher les ouvrages de la collection " Que sais-je " sur la vie rurale Vous devriez obtenir 6 résultats C'est dans l'écran de recherche avancée qu'on peut limiter la recherche à certains types de documents : thèses, titres de revues ; vous devez décocher tous les types de documents, en cliquant sur le lien " aucun ", et cocher la case du type de document sur lequel vous souhaitez faire votre recherche.

50 M2-RT - F.-G. Carpentier - 201150 Exemple de recherche sur SUDOC (3) Vous recherchez un article de 1892 paru dans " The Sewanee Review". Où le trouverez-vous ? Solution : à la BIU Centrale de la Sorbonne et dans les collections patrimoniales de la BNF. De nombreuses bibliothèques françaises possèdent cette revue, mais pas depuis l'origine.

51 M2-RT - F.-G. Carpentier - 201151 Exemple de recherche sur SUDOC (4)

52 M2-RT - F.-G. Carpentier - 201152 Enregistrement Enregistrer une page Avec Mozilla Firefox : « Web Page - Complete » : avec les images et la page de style é ventuelles, rassemblées dans un répertoire

53 M2-RT - F.-G. Carpentier - 201153 Enregistrement (2) Récupérer une image, télécharger un fichier.doc,.pdf, etc Cliquez avec le bouton droit de la souris sur limage, ou le lien vers le fichier Dans le menu contextuel qui apparaît, sélectionnez la commande « Enregistrer limage sous... », « Enregistrez le lien sous... »

54 M2-RT - F.-G. Carpentier - 201154 Impression Imprimer une page Page HTML simple : en général sans problème (sauf caractères blancs sur fond foncé) Page comportant des cadres (frames) : de préférence, affichez le cadre désiré dans une fenêtre, puis imprimez-la. Exemple à partir de : http://geai.univ- brest.fr/~carpenti/tdm-index.html, puis de laffichage des « Tables é lectroniques »http://geai.univ- brest.fr/~carpenti/tdm-index.html

55 M2-RT - F.-G. Carpentier - 201155 Impression (2) Imprimer une page (suite) Page comportant des tableaux : le comportement dépend de la manière dont le code de la page a été écrit. Pensez au format « paysage »... Page dun site « dynamique » utilisant Javascript, etc : lauteur na-t-il pas prévu un bouton « imprimer » ou « version imprimable »

56 M2-RT - F.-G. Carpentier - 201156 Gérer les fenêtres Utiliser plusieurs fenêtres, ou plusieurs onglets au cours de la navigation Cliquez avec le bouton droit de la souris sur le lien vers la page cible. Dans le menu contextuel qui apparaît, sélectionnez la commande « Ouvrir le lien dans une nouvelle fenêtre», « Ouvrir le lien dans un nouvel onglet » Remarque : Certains liens sont configurés pour ouvrir la page cible dans une nouvelle fenêtre.

57 M2-RT - F.-G. Carpentier - 201157 Favoris, bookmarks, etc Conserver ladresse des sites intéressants Les navigateurs possèdent un menu « Ajouter aux signets », « Add to bookmarks », « Ajouter aux favoris » Il existe également des menus permettant de gérer ces signets : renommer, supprimer, structurer de façon hiérarchique...

58 M2-RT - F.-G. Carpentier - 201158 Bibliographie SAMIER H., SANDOVAL V., la recherche intelligente sur lInternet, Hermès DEFOSSE M.-F. et al., La recherche dinformation, Formation au C2i, http://www.c2imes.org/PDF/B2.pdfhttp://www.c2imes.org/PDF/B2.pdf


Télécharger ppt "M2-RT - F.-G. Carpentier - 20111 Référencement et recherche sur le web N.B. Plan du document et exemples tirés de : Defosse M.-F.. et al., La recherche."

Présentations similaires


Annonces Google