La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Internet et ses services

Présentations similaires


Présentation au sujet: "Internet et ses services"— Transcription de la présentation:

1 Internet et ses services
La recherche d’information TRICHET Francky

2 Une référence ! Le site portail d’Aide aux Etudiants à la Recherche Scientifique AERIS Un excellent cours, une bonne liste d’outils et des exercices.

3 La Recherche sur Internet
La recherche d'informations sur Internet demande deux compétences : d'abord déterminer le bon outil en fonction de l'information demandée, ensuite utiliser correctement cet outil. Différentes méthodes de recherche d’information : par types de services (News, Listes, Actualités) par consultation d’annuaires généralistes ou thématiques par utilisation de moteurs de recherche par utilisation de méta-moteurs de recherche

4 Outils présentés Annuaires et moteurs (généralistes et thématiques)
Méta-moteurs (en ligne et hors ligne) Outils TAO (Traduction Assistée par Ordinateurs) Traducteurs en ligne, dictionnaires, encyclopédies Points particuliers Recherche Images/Vidéos/Sons et le Peer2Peer Recherche de logiciels (Freeware/Shareware) Recherche d’itinéraires Recherche de personnes et d’organisations Les aspirateurs de sites

5 Moteurs Versus Annuaires
Annuaire : un catalogue de sites organisés par thèmes Inscription nécessaire : les Webmasters doivent montrer « patte blanche » Exemples : Yahoo, Nomade, etc. Moteur : un système d ’indexation automatique des sites Web Il n ’y a pas d ’inscription : le référencement est ainsi automatique ! Exemples : Google, Lycos, etc.

6 Les moteurs de recherche
Principes : Les moteurs de recherche sont des bases de données constituées automatiquement grâce à des logiciels robots qui scrutent à intervalles réguliers les serveurs (Web, FTP ou autres selon le produit) déclarés sur Internet. Ils indexent mot à mot les documents localisés permettant ainsi des interrogations par sujet. Selon le moteur de recherche utilisé, l'indexation porte sur : le titre, l'entête des documents ou quelques lignes, les documents complets.

7 Les composants d ’un moteur
L’aspirateur : parcours le web en suivant les liens hypertextes (algorithme de sélection des pages) L’indexeur : analyse les pages reçues par l ’aspirateur pour mettre à jour une base de données (mots-clés => pages) Le guichetier : réponds aux requêtes formulées par les utilisateurs un aspirateur scrute entre 30 et 50 pages par seconde ; avec 1 milliard de pages, il faut 115 jours pour couvrir tout le web !!!

8 Problèmes des moteurs (1)
L ’aspirateur prend uniquement en compte le texte et pas la vidéo, le son et les images. Problèmes des pages isolées pages qui citent et qui ne sont pas citées (sources) pas qui ne citent pas mais qui sont citées (cibles) pas qui ne citent pas et qui ne sont pas citées (déconnectées) le cœur des pages interconnectées est évalué à 20 % du web (les métriques du web)

9 Problèmes des moteurs (2)
L ’indexation est uniquement statistique et non sémantique/linguistique l ’expression « couler une bielle » ne sera pas rattachée à un problème de panne de voiture la proximité spatiale pour les images n’est pas nécessairement efficace (ex avec « google find image » sur mammifère) Les modules de l ’indexeur le gardien qui filtre les pages pour y découvrir d ’éventuelles expressions inopportunes (racisme, porno, etc.) le module de calcul des mots-clés : attribution d ’un poids (en fonction de l ’importance du mot dans la page) pour chaque mot-clé puis mise à jour de la base (mot->pages)

10 Problèmes des moteurs (3)
Le web invisible Le Web invisible correspond à l’ensemble des documents (textes, vidéos, images...) qui n’est pas indexé par les outils de recherche (moteurs, annuaires...). Ces données peuvent être soient de nature non indexable (animations), non référencées (volontairement ou non), ou dynamiques.

11 Les arnaques des Webmasters
Le Spam indexing : ajouter des mots supplémentaires dans les pages afin de forcer l ’indexeur à le considérer comme important exploitation de la faiblesse statistique des indexeurs ! ces mots sont invisibles pour l ’utilisateur final car ils possèdent la même couleur que le fond de la page (écriture vert sur vert = vert) Exemple de « Google Bombing » : miserable failure (pauvre type) converge George Bush !!

12 Les arnaques des Webmasters
Les pages alias (duplication de la même page avec mise en valeur de mots-clés différents), satellites et fantômes (lien hypertexte automatique vers le site visé)

13 Les meilleurs moteurs (source Médiamétrie-eStat)
Google (http://www.google.com) est fondé sur une technologie PageRank plus une page est citée, plus est elle classée en priorité plus une page, proposée comme résultat à une requête, est empruntée, plus elle est classée en priorité pour les requêtes suivantes mémorisation des choix des utilisateurs précédents Yahoo, Voilà, Altavista AllTheWeb, reacteur.com, a9.com, teoma.com, singingfish.com

14 Les meilleurs moteurs Les services de Google en détails
Google Fight : un usage détourné et rigolo de Google Google Docs : le web en tant que serveur d’application iGoogle : le netvibes de google A la recherche de vidéos :

15 Recherche de fichiers sur sites FTP
File Mine (http://www.filemine.com/) On donne un terme et on précise le système d'exploitation ou choisit dans une catégorie. Chaque logiciel a reçu une appréciation : Nouveau, Bijou ... Shareware.com (http://shareware.com/) Dans une base de plus de fichiers, ce service propose : un mode de recherche simple (quick search), un mode avancé (power search). Après avoir indiqué le système d'exploitation concerné, on donne quelques termes combinés par Et et SAUF si nécessaire. On peut limiter par date. La recherche se fait dans le texte de description qui accompagne tout logiciel et dans le nom du produit.

16 Recherche de fichiers sur sites FTP

17 Recherche d’adresses électroniques
Voilà (http://www.pagesjaunes.fr / WhoWhere (http://www.whowhere.com) InfoSpace (http://www.infospace.com/) Ce service propose différentes recherches pour retrouver adresses et numéros de téléphone classées par catégories : business, sociétés et sites Web dans le monde, personnalités gouvernementales et aussi les amis.

18 Recherche de coordonnées d’entreprises
Un méta-annuaire d’entreprises : Des annuaires Un annuaire des entreprises « internet » :

19 Recherche de coordonnées d’entreprises
Quelques annuaires web du Grand Ouest Le portail économique de la région

20 La recherche de Listes et News
Excellent annuaire des listes de diffusion francophones (www.cru.fr) avec outils de recherche Autre pointeur : Reference.com (http://www.reference.com/) Service complet facilitant l'identification et l'interrogation de plus de newsgroups, listes de discussion et forums web. Les forums web sont une nouvelle façon de collaborer en réseau. Pour l'interrogation, on peut choisir entre un formulaire simple et une recherche avancée. Exemple de recherche : Tester avec LEA nantes

21 La recherche dans l’actualité Presse
Google Actualités Version française lancée en juillet 2003, fournit des liens vers des articles en français ainsi que des photos provenant de sources d’informations du monde entier et notamment de France, de pays francophones comme la Belgique, le Canada, la Suisse et l’Afrique. Les sources d'informations utilisées sont issues de la presse écrite (nationale et régionale), presse web, TV et radio. Libération - Le Monde - L'Humanité- Le Parisien -Le Figaro - Le Télégramme de Brest - Les DNA - La Voix du Nord - Ouest France - Le Nouvel Obs - L'Express - TV5 - France 2 - DH Net - Radio France...

22 La recherche dans l’actualité Presse
DeepIndex News Ce moteur français propose depuis novembre 2002 un moteur de recherche d'actualités. Il balaie URL quotidiennement (chaque heure pour certains sites) pour rapporter environ articles de la presse francophone. Intéressant car pour l'instant, l'essentiel des moteurs de recherches de news privilégiaient les actualités anglophones. DeepIndex News recherche en effet parmi les dépêches de la presse française, belge, suisse et canadienne. Liste de sites de presse indexés (en constante évolution)

23 La recherche dans l’actualité Presse
Les portails d’informations multi-domaines … reprends les dernières dépêches AFP Annuaire de la presse internationale

24 Les moteurs de recherche géographiques
Principes : L'interface présente une liste ou une carte sur laquelle il faut cliquer la zone géographique désirée. La recherche se fait alors de proche en proche, sur des cartes ou des listes de plus en plus fines, jusqu'à arriver à une liste de services présents dans une zone géographique. Ces moteurs sont utiles si vous cherchez un serveur dans un pays qui n'a pas encore trop de de serveurs Web (sinon cela devient vite lassant). Exemples Virtual Tourist -

25 Les annuaires thématiques
YAHOO - Les thèmes généraux proposés sont : Arts, Commerce et Economie, Ordinateurs et Internet, Education, Loisirs, Politique, Santé, Actualité, Sports et Jeux, Bibliothèques et Librairies, Géographie, Science, Sciences Sociales, Société et Culture. C'est l'endroit idéal pour entreprendre une recherche « sans savoir vraiment ce que l'on recherche » : la ballade.

26 Les moteurs de recherche par mots-clés
Principes : (1) saisie d ’un ensemble de mots clés caractéristiques du centre d ’intérêt visé ; (2) lancement de la requête ; (3) analyse des résultats fournis par le moteur utilisé. Quelques moteurs AltaVista (http://www.altavista.com) Lycos (http://www.fr.lycos.de/) Google (http://www.google.com) Yahoo (http://www.yahoo.fr), qui est aussi un annuaire !

27 Quelques conseils (1) Soyez précis ! Utilisez des mots précis qui décrivent l'objet de votre recherche, plutôt que des catégories ou des termes génériques. Si vous êtes intéressé par les Chihuahuas, vous devriez effectuer une recherche sur ce mot plutôt que sur le mot Chien. Guillemets : Dans certains cas, il est possible d'ajouter des caractères à vos mots ou expressions afin de définir avec précision l'objet de votre recherche. Ainsi, le fait de placer plusieurs mots entre guillemets indique au moteur de recherche de ne répertorier que les sites qui contiennent ces mots dans l'ordre où ils sont été saisis.

28 Quelques conseils (2) Signes + et - : Si vous faites précéder un mot du signe plus (+), vous indiquez que ce mot ou groupe de mots doit apparaître dans les résultats de la recherche (Hôtels +San +Francisco, par exemple). De même, le signe moins (-) indique que le mot ou groupe de mots devra être exclu des résultats de la recherche (Voitures -Ford). Opérateurs booléens : Les opérateurs booléens sont AND, OR, AND NOT et les parenthèses. Pour fonctionner correctement, ces opérateurs doivent apparaître en MAJUSCULES. De plus, ils doivent être précédés et suivis d'un caractère d'espacement. AND : indique que les documents recherchés doivent contenir tous les mots reliés par l'opérateur AND. Exemple : chien AND Chihuahua AND élevage. OR : indique que les documents recherchés doivent contenir au moins un des mots reliés par l'opérateur OR. Exemple : chien OR chihuahua.

29 Quelques conseils (3) Parenthèses : Les parenthèses sont utilisées pour grouper des portions de requêtes booléennes, ce qui permet d'effectuer des recherches plus complexes. Ainsi, pour rechercher des documents contenant le mot fruit et soit le mot banane, soit le mot pomme, entrez fruit AND (banane OR pomme). Recherche sur le titre : Cette fonctionnalité vous permet de limiter votre recherche au titre des documents Web. Ainsi, si vous entrez title:Mars ou t:Mars, le moteur de recherche ne récupérera que les documents dont le titre contient le mot Mars. Autres critères (date, langue, type de documents, etc.) : consultez l’espace  « Recherche avancée » des moteurs

30 Exemple de requêtes Requête Résultats

31 Interprétation de requêtes
Exemple de requêtes (Google) berger allemand : pages berger ET allemand (équivalent à +Berger +allemand) berger OR allemand : « berger allemand » : pages les deux et dans cet ordre à utiliser pour vérifier la correction orthographique Ex : « l'homme s'émouvoit » ou « l’homme s’émeut »

32 Les méta-moteurs (1) Principes : Les méta-moteurs interrogent en une fois différents outils de recherche pour fournir la réponse la plus exhaustive à une question : vers une sous-traitance de la requête ! Avantages : Recherche plus exhaustive qu’avec un seul outil Analyse des résultats plus fine (suppression des doublons) Inconvénients : On ne bénéficie pas des particularités de chaque outil Temps de recherche souvent plus long

33 Les méta-moteurs (2) Deux types de Méta-Moteurs (MM) :
MM disponibles uniquement à partir d'un serveur (MM en ligne) : SavvySearch, MetaCrawler, etc. MM livrés comme logiciel client à installer sur son poste de travail : Copernic, BullsEye, Sherlock (pour Mac OS 8,5), etc. Les Méta-Moteurs en ligne présentent un intérêt limité : dégrossir une question, identifier un outil, etc. Les Méta-Moteurs installés sur son poste de travail permettent eux d'envisager un travail de veille avec la gestion de profils et l'établissement de calendriers …vers les agents d’intelligence économique

34 Exemple de Méta-Moteur : Copernic

35 Un nouveau Méta-Moteur : eo.st
Un nouveau méta-moteur (en ligne) de recherche Un nouveau moteur (souhaitant détrôner Google) Un annuaire de méta-moteurs :

36 Les autres outils de recherche
Les moteurs sur sites (base de données online) le moteur de la Bibliothèque Nationale : la bibliothèque municipale de Nantes : pour le cinéma Les moteurs spécialisés dans un domaine donné (indexation de plusieurs sites relevant d’un même domaine) : recherche de documents gouvernementaux américain Les annuaires spécialisés les sites juridiques : radios, TV et WebCams on the web :

37 Et les nouveaux types de moteurs
Vers une nouvelle génération de moteur de recherche Aide à la visualisation des résultats de recherche par cartographie Utilisation des propriétés des réseaux sémantiques Un premier pas vers le Web Sémantique

38 Des pistes à suivre… Pour en savoir plus sur les outils de recherche
: un méta-annuaire des outils de recherche (annuaire, moteur généralistes, moteurs thématique, méta-moteur, etc.) : Excellent site dédié à la veille économique – Mise à jour régulière des nouveautés proposés par les outils de recherche – Un guide des bibliothèques en ligne, des outils de traduction - Excellent site dédié à la veille sur les outils de recherche. Visitez également les partenaires du réseau abondance :

39 Recherche d’outils TAO
Outils d’Aide à la Traduction Traducteurs en ligne (texte direct ou URL) Systran propose un outil de traduction en ligne avec plus de 36 paires de langues ! LA REFERENCE. L’outil de traduction des moteurs de recherche Exemple d’Altavista : Exemple de Voila :

40 Recherche d’outils TAO
Outils d’Aide à la Traduction Traducteurs en ligne (texte direct ou URL) Solution Gist-in-time Un Gist est une traduction générée par ordinateur. Le Gisting a pour but de résumer instantanément des textes électroniques, rédigés dans une langue étrangère au lecteur, et ce, vers sa langue préférée. Solution Reverso (http://www.reverso.net/textonly/default.asp) Solution FreeTranslation (http://www.reverso.net/textonly/default.asp) Solution WorldLingo (http://www.worldlingo.com/)

41 Recherche d’outils TAO
Outils d’Aide à la Traduction Traducteurs en ligne (texte direct ou URL) Tester simultanément plusieurs outils de traductions en ligne. Un portail très complet et mis à jour régulièrement. Le site officiel de la Direction générale de la Traduction de la Commission européenne.

42 Recherche d’outils TAO
Outils d’Aide à la Traduction Traducteurs en ligne (texte direct ou URL) Traduction Anglais/français de ¾ phrases réalisées par des professionnels : Un bon dossier sur les traducteurs en ligne

43 Recherche d’outils TAO
Outils d’Aide à la Traduction Traducteurs à installer (et souvent payants) Et pour le dictionnaire Trados est le plus connu !!!

44 Recherche d’outils TAO
Dictionnaires en ligne La référence toutes langues confondues : YourDictionary Propose des dictionnaires en ligne et des glossaires. Cela va des langues nationales les plus courantes aux langues régionales et dialectes (galicien, créole, breton, basque...). Lexicool : un annuaire et de dictionnaires et glossaires bilingues. Dictionnaires généraux mais aussi thématiques : alimentation, aéronautique, musique, construction, électronique, informatique, etc. Vous pouvez ainsi trouver un dictionnaire français/anglais spécialisé dans le vocabulaire des vins.

45 Recherche d’outils TAO
Dictionnaires en ligne ForeignWord : plus de 260 dictionnaires de langues en ligne (plus de 70 langues sources et 74 langues cibles) Travlang propose de très nombreux dictionnaires classiques en ligne également des paires de langues plus rares comme allemand-portugais, italien-suédois, tchèque-anglais

46 Recherche d’outils TAO
Dictionnaires en ligne Le grand dictionnaire terminologique donne accès à près de 3 millions de termes français et anglais du vocabulaire industriel, scientifique et commercial, dans 200 domaines d’activité. Autre dictionnaire Français/Anglais

47 Recherche d’outils TAO
Dictionnaires/glossaires à télécharger Babylon : Des centaines de dictionnaires bilingues couvrant de très nombreuses langues (arabe, bosniaque, estonien, hébreu, kurde, tibétain...) et glossaires thématiques ou encyclopédiques. FreeLang : Plus de 135 dictionnaires bilingues à télécharger : français/basque, tamoul, corse, danois, espagnol, anglais, danois, hindi, hongrois, iranien, ourdou.... Xanadou

48 Recherche d’outils TAO
Encyclopédies en ligne Wikipedia : l’encyclopédie libre ! (Voila) (Hachette) (Larousse) Un exemple d’encyclopédie thématique sur le fromage

49 Recherche Images/Vidéos
(Rubrique Image / Vidéo) (Rubrique Image / Vidéo)… idem avec google, yahoo... Des banques d’images

50 Le « Peer to Peer » (P2P) Le Peer2Peer et le droit
Technique permettant d’échanger librement des ressources (sons, vidéos, etc.) Popularisation suite à la mort de Napster survenue suite aux attaques des majors du disque défendant le droit à la propriété sur les œuvres Un retour à la philosophie initiale d’Internet Pas de centralisation des ressources mais une simple redirection d’adresses de ressources Exemples de logiciels gratuits dédiés au P2P WinMX : Kazza : Le Peer2Peer et le droit Des dossiers à consulter sur :

51 Recherche de MP3/DivX Les logiciels de partage de fichiers (peer-to-peer) Ces modules à télécharger permettent d'échanger des fichiers MP3, DivX ou autres avec tous les internautes connectés au même moment avec le même logiciel (P2P : peer-to-peer = poste à poste, d'égal à égal). L'intérêt est donc d'utiliser un logiciel de "file sharing" populaire fédérant une importante communauté d'utilisateurs rendant ainsi le volume de fichiers à partager plus important et les chances de trouver le MP3 rêvé plus grandes. Napster est mort, Audiogalaxy est moribond, mais l'héritage perdure....pour l'instant. Kazaa, eDonkey2000, iMesh, Winmx, Gnutella  

52 Recherche d’itinéraires/plans
pour les itinéraires inter-urbains pour les grandes villes d’europes.... pour Paris

53 Des aspirateurs de sites
Objectif : aspirer un site de façon à pouvoir le consulter « hors-ligne » Moyen : outil type « aspirateur » qui copie intégralement tout le site sur votre disque dur Attention à la taille aspirée !! Exemples : SmartBud, HTTrack Aspirateur de mails : un premier outil de prospection Exemple : Aspiro Mail

54 E-learning Différents niveaux d’outils Cours téléchargeable en ligne
Peu d’interactivité, pas de personnalisation / apprenant Cours accompagné d’un système d’évaluation Niveau minimum d’interactivité (QCM, réponse fermée) Pas de personnalisation / apprenant Tuteurs intelligents (EIAO : Enseignement Intelligemment Assisté par Ordinateur) Suivi de la progression pédagogique Capacité d’analyse des réponses de l’apprenant

55 E-learning Définition d’un nouveau concept
Campus numériques ou Universités virtuelles Créer une architecture permettant d’organiser l’espace d’apprentissage en imitant la réalité Espace cafet représenté par une zone de chats en direct où l’on peut discuter librement avec les présents « virtuellement » Espace Amphi cours où l’on retrouve des cours consultables en ligne Espace Salle Travaux Pratiques….

56 E-learning Pour en savoir plus
Le site de l'Union Européenne consacré au e-Learning : Le site d'information sur les technologies du Ministère de l'Education Nationale : Le site de l'European Institute for e-Learning : A VOIR ! Un exemple de site d’autoformation multi-domaines : Beaucoup de cours sont gratuits, par l’exemple « Comprendre l’anglais du net »

57 E-learning Un excellent site personnel visant à constituer un annuaire des sites d’aide à l’apprentissages des langues

58 Des pistes de recherche…
Outil de recherche sur internet : guide pratique et méthodologique pour un public « Lettres, Langages et Sciences Humaines » Un excellent site : Recherche à partir de « bibliothèques virtuelles » La Bibliothèque Nationale de France : La recherche en littérature (LE portail francais) :

59 Des pistes de recherche…
Les conseils du groupe CERISE (Conseils aux Etudiants pour une Recherche d'Information Spécialisée Efficace) - <http://www.ccr.jussieu.fr/urfist/cerise/> Cerise se veut un guide d'initiation aux méthodologies de l'information documentaire, à disposition de tous sur Internet. Une sélection volontairement limitée des adresses les plus intéressantes pour l'étude de la littérature du XXe siècle : Testez le moteur de recherche dédié aux revues, livres, actes de colloques en sciences humaines. Consultez le portail en sciences humaines :

60 Des pistes de recherche…
Comparez les prix à l'aide de . Idem avec Testez aussi Tester un portail de ventes aux enchères : Rechercher une vue de la Grande Plage à Biarritz à partir des webcams : Guider une WebCam Nantaise :

61 Des pistes de recherche…
Rechercher le shareware cuteFTP du portail : Pour les versions d'évaluation, consultez le site : Autre portail dédié au partage de logiciels : Explorer le portail Envoyer un courrier anonyme : Jouer sur Internet :

62 Des pistes de recherche…
Un exemple de site dédié au e_knowledge : Achetez votre parcelle de lune : Achetez un nom de domaine : Un site curieux : Explorez la première Net-télévision de l’Ouest : Un excellent portail vidéo : Consultez les dernières actualités des TIC : Essayez le générateur de PDF :

63 Des pistes de recherche…
Evaluer votre rapidité de navigation : Evaluer un accélérateur Web : Naviscope à partir de Surfer anonyme et protéger vous des cookies : Un dernier exemple de recherche type « critère géographique » :

64 COMPACTER et COMPRESSER
Une petite parenthèse Tous les ans, les étudiants me posent les mêmes questions sur la différence entre COMPACTER et COMPRESSER Voici la réponse !!

65 Compacter et compresser
Créer une archive visant à regrouper, sous un même fichier, un ensemble de fichiers Compresser Réduire la taille d ’un fichier en utilisant des algorithmes de compression But : faciliter le transfert de fichiers en unifiant un ensemble en 1 seul fichier et en réduisant la taille (sans perdre d ’informations)

66 Compacter et compresser
Formats d’archives les plus répandus : Le format ZIP est le plus répandu. Les fichiers Zip peuvent être répartis sur plusieurs disquettes ; ils permettent à la fois la compression et le compactage. RAR, TAR, Z, GZ, TAZ, et TGZ sont des formats répandus sur les sites Internet basés sur Unix. TAR signifie « Tape Archive » Le format TAR ne permet pas la compression. Il sert uniquement à regrouper les fichiers. Commande : tar -cvf (-xvf) sous Unix. GZ et Z sont des archives au format gzip qui ne peuvent pas contenir plusieurs fichiers. Commande : gzip (gunzip) sous Unix.

67 Le logiciel Winzip Logiciel gratuit dans sa version light
Utilisez par exemple Tucows pour récupérer une version light (http://www.tucows.com/) Winzip permet de gérer (création, extraction) des archives qui sont automatiquement compressées. Création d ’une archive puis ajout des fichiers visés génération d ’un fichier d ’extension .ZIP Ouverture d ’une archive puis extraction des fichiers contenus génération de n fichiers d’extension diverses (.DOC, .XLS,.JPG)

68 Le logiciel Winzip Taux de compression : - important pour
des fichiers de types textes - faible pour des images


Télécharger ppt "Internet et ses services"

Présentations similaires


Annonces Google