La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

©Armelle Thomas - Février 2006 1 Méthodologies de la recherche d’information sur Internet Le tour de la question ADBS - Les jeudi de l’Internet pratique.

Présentations similaires


Présentation au sujet: "©Armelle Thomas - Février 2006 1 Méthodologies de la recherche d’information sur Internet Le tour de la question ADBS - Les jeudi de l’Internet pratique."— Transcription de la présentation:

1 ©Armelle Thomas - Février 2006 1 Méthodologies de la recherche d’information sur Internet Le tour de la question ADBS - Les jeudi de l’Internet pratique 9 février 2006 

2 ©Armelle Thomas - Février 2006 2 Pourquoi faut-il jongler ?  Abondance de l’information  Hétérogénéité  Fragmentation  Manque de structuration  Renouvellement continuel  Multilinguisme  Manque de fiabilité  La nature même d’Internet  Des besoins fort variés  Une illusion d’exhaustivité…

3 ©Armelle Thomas - Février 2006 3 Les « 10 règles d’or » 1. Savoir questionner 2. Savoir utiliser les outils de navigation et de recherche 3. Savoir choisir les bons mots-clés 4. Savoir sélectionner les bons points de repère 5. Savoir analyser 6. Savoir poser des balises 7. Savoir se limiter dans le temps 8. Savoir rester clair sur ses objectifs 9. Savoir conjuguer recherche outils et navigation 10. Savoir être agile et « rebondir »

4 ©Armelle Thomas - Février 2006 4 Fil conducteur… 1. De la recherche d’info à la recherche de sources 2. L’identification rapide de sources 3. La recherche sur des ensembles homogènes de sources 4. Rechercher en comparant les résultats sur les grands moteurs 5. La recherche « orientée résultats » 6. La recherche sur les outils de clustering 7. L’exploration du web invisible

5 ©Armelle Thomas - Février 2006 5 Deux grandes approches méthodologiques à combiner harmonieusement. Approche mots-clés : du mot à la « chose »  Recherche par mots-clés sur le texte intégral des pages web par moteurs ou méta-moteurs  La plus répandue…..  Impose, soit en amont un travail sur les mots-clés pour bien préciser sa recherche, soit l’utilisation « en aval » de l’environnement terminologique trouvé dans les premières réponses pertinentes.  Qualité inégale, succès plus facile sur des recherches « factuelles »… Approche « sources et exploration »  Identification des sources d’information les plus pertinentes par rapport à la requête, chercher sur ou à partir de ces sources  Beaucoup moins répandue, implique souvent une réflexion préalable dont la majorité des internautes veut se passer (passer au concept..)  Pour des recherches pros, indispensables à mener en parallèle de l’approche mots-clés

6 ©Armelle Thomas - Février 2006 6 Fil conducteur… 1. De la recherche d’info à la recherche de sources 2. L’identification rapide de sources 3. La recherche sur des ensembles homogènes de sources 4. Rechercher en comparant les résultats sur les grands moteurs 5. La recherche « orientée résultats » 6. La recherche sur les outils de clustering 7. L’exploration du web invisible

7 ©Armelle Thomas - Février 2006 7 De la recherche d’information au « sourcing »… USAGE :  Dans le cadre d’une recherche (logique « sources »)  Dans le cadre de la constitution d’un bookmarks  Dans le cadre de la mise en œuvre d’une veille (ou simple surveillance de son secteur) N.B : La recherche documentaire et la recherche d’information passe par une « rencontre » avec une source ou par une recherche de sources Le sourcing est une étape primordiale et incontournable d’une veille internet.

8 ©Armelle Thomas - Février 2006 8 Les étapes-amont indispensables 1. Définir le(s) champ(s) de recherche 2. Définir l’univers sémantique 3. Recenser le type de sources utiles

9 ©Armelle Thomas - Février 2006 9 Les techniques spécifiques utilisables pour la recherche de sources Trouver des portails / sites fédérateurs Trouver des listes de liens Trouver des sites « pointant » sur une source déjà connue Trouver des sites « similaires » à une source connue

10 ©Armelle Thomas - Février 2006 10 Fil conducteur… 1. De la recherche d’info à la recherche de sources 2. L’identification rapide de sources 3. La recherche sur des ensembles homogènes de sources 4. Rechercher en comparant les résultats sur les grands moteurs 5. La recherche « orientée résultats » 6. La recherche sur les outils de clustering 7. L’exploration du web invisible

11 ©Armelle Thomas - Février 2006 11 La recherche par types d’éditeurs USAGE : Explorer rapidement le web par grandes typologies d’éditeurs au niveau national ou international : organismes publics, associations, universités :  Connaître les principaux acteurs impliqués  Mettre en évidence les thématiques et/ou points de vue privilégiés Rapidement….

12 ©Armelle Thomas - Février 2006 12 Deux techniques clés applicables Utiliser les TLD (top level domains) Utiliser les moteurs spécialisés adéquats (voire se le créer, cf Rollyo.com)

13 ©Armelle Thomas - Février 2006 13 Fil conducteur… 1. De la recherche d’info à la recherche de sources 2. L’identification rapide de sources 3. La recherche sur des ensembles homogènes de sources 4. Rechercher en comparant les résultats sur les grands moteurs 5. La recherche « orientée résultats » 6. La recherche sur les outils de clustering 7. L’exploration du web invisible

14 ©Armelle Thomas - Février 2006 14 La recherche par comparaison USAGE : Se donner une alternative aux résultats de son moteur préféré sans changer sa stratégie (mots-clés identiques) : « ouvrir » un peu les possibilités en un seul coup de dé…  Les méta-moteurs ont investi ce créneau, retrouvant là une « seconde jeunesse »  Moins de 2 % des résultats de la première page de résultats seraient communs aux « quatre grands », et 11 % à deux moteurs (cf étude Dogpile, juillet 2005) Parer aux aléas des algorithmes de pertinence

15 ©Armelle Thomas - Février 2006 15 A essayer : Dogpile, Jux 2….  Dogpile : www.dogpile.comwww.dogpile.com Et encore http://comparesearchengines.dogpile.com/ http://comparesearchengines.dogpile.com/  Jux2 : www.jux2.comwww.jux2.com  Releton www.releton.comwww.releton.com  Thumbshots.com Ranking : http://ranking.thumbshots.com/ (pour une comparaison visuelle sur les 100 premiers résultats)http://ranking.thumbshots.com/

16 ©Armelle Thomas - Février 2006 16 Fil conducteur… 1. De la recherche d’info à la recherche de sources 2. L’identification rapide de sources 3. La recherche sur des ensembles homogènes de sources 4. Rechercher en comparant les résultats sur les grands moteurs 5. La recherche « orientée résultats » 6. La recherche sur les outils de clustering 7. L’exploration du web invisible

17 ©Armelle Thomas - Février 2006 17 Une autre réflexion sur les mots-clés USAGE : Quand d’autres techniques ont échoué, renvoient sur des pistes payantes, pour trouver rapidement le contenu souhaité, ou compléter une information dont on connaît déjà certains aspects  Chercher « ce que le résultat doit être »  Des mots-clés pour définir non pas le titre de ma recherche, mais ce que doivent contenir les réponses à ma question. Merci à http://supercoach.over-blog.com/article-964137.html….

18 ©Armelle Thomas - Février 2006 18 Fil conducteur… 1. De la recherche d’info à la recherche de sources 2. L’identification rapide de sources 3. La recherche sur des ensembles homogènes de sources 4. Rechercher en comparant les résultats sur les grands moteurs 5. La recherche « orientée résultats » 6. La recherche sur les outils de clustering 7. L’exploration du web invisible

19 ©Armelle Thomas - Février 2006 19 Se laisser guider par les outils de clustering USAGE : Quand on travaille sur un concept assez large, ou ambigû, quand on veut savoir les axes / idées privilégiées sur le web, quand on ne veut pas « se fatiguer » à préciser sa question !  Connaître l’environnement sémantique de ma question  Eliminer de ma question les concepts inutiles  Découvrir des idées nouvelles par rapport à ma question.. Des technos en forte émergence…

20 ©Armelle Thomas - Février 2006 20 Se laisser guider par les outils de clustering…  Les annuaires « classiques » : « indexation » manuelle : les sites sont sélectionnés, décrits et classés dans des catégories hiérarchiques par des individus : Recherche dans le plan de classement ou par mot-clé sur les intitulés des catégories, les titres des sites et résumés.  Les moteurs « classiques » : Après collecte du contenu des pages, indexation automatique en texte intégral des pages des sites web. Recherche par mots-clés « en texte intégral » et présentation linéaire des résultats en appliquant un tri de pertinence. Ces moteurs, après collecte et indexation automatique, répondent aux requêtes des usagers en structurant dynamiquement le corpus de résultats et/ou en en donnant une représentation graphique (carte)…

21 ©Armelle Thomas - Février 2006 21 Via la technique des mots associés (utilisation des statistiques) Après identification des mots signifiants, et constitution d’une matrice de co-occurrence Des clusters, c’est à dire des catégories de mots homogènes, vont être créés : Les clusters se forment dynamiquement à l’issue de chaque requête de l’utilisateur Passer des stats au sens…

22 ©Armelle Thomas - Février 2006 22 Moteurs ou méta-moteurs L’outil organise donc de manière instantanée l’ensemble des documents en fonction des associations de mots-clés contenus. C’est la CLASSIFICATION ou technologie de clustering # de la CATEGORISATION où on connaît en amont les catégories (elles sont prédéterminées) Exemples :  Exalead : www.exalead.comwww.exalead.com  Vivisimo : www.clusty.comwww.clusty.com

23 ©Armelle Thomas - Février 2006 23 Fil conducteur… 1. De la recherche d’info à la recherche de sources 2. L’identification rapide de sources 3. La recherche sur des ensembles homogènes de sources 4. Rechercher en comparant les résultats sur les grands moteurs 5. La recherche « orientée résultats » 6. La recherche sur les outils de clustering 7. L’exploration du web invisible

24 ©Armelle Thomas - Février 2006 24 La recherche « hors moteurs » USAGE : Pour compléter une recherche classique moteurs, pour obtenir des résultats mieux « qualifiés », pour aller plus vite dans certains types de questionnements…. en exploitant ensemble des pages non localisables et/ou non indexables par les moteurs de recherche web.  Accéder au contenu de bases de données diversifiées  Exploiter le contenu des pages « à identification », ou « confidentielles »  Découvrir des pages peu ou mal indexées (isolées, ou d’un format « original ». 250 fois plus important que le web « visible » ?…

25 ©Armelle Thomas - Février 2006 25 Les techniques spécifiques utilisables pour la recherche de bases de donnes Utiliser des répertoires spécialisés (gds domaines) : culture, médecine, sciences humaines, bdd biblio.. Utiliser des répertoires de bases de données (Dadi, invisible-web.net, Complete planet, Gosh Me…à Technique moteurs : mot-clé + « base de données » (et variantes) Trouver des bases de données « similaires » à une base connue


Télécharger ppt "©Armelle Thomas - Février 2006 1 Méthodologies de la recherche d’information sur Internet Le tour de la question ADBS - Les jeudi de l’Internet pratique."

Présentations similaires


Annonces Google