ANNEHEIM Geoffrey21/03/2009. 2 2 Protocole de communication Socket TCP/IP Afin que MyCrawler fonctionne de façon optimale, une configuration de deux machines.

Slides:



Advertisements
Présentations similaires
Les protocoles réseau.
Advertisements

Module 5 : Implémentation de l'impression
Le monde i-mode Epreuve Oral – 16/03/05 Master STIC / CAM API et environnement de développement Bakogiannis Anastasios ( )
GESTION D’IMPRISSION SOUS WINDOWS & LINUX
Aperçu des architectures des systèmes d’information web
Internet : serveurs Web
VLC UMVF Fiche Veille Statut Logiciel gratuit, open source
Serveur jeu Le serveur fait partie d'un logiciel de jeu en ligne multi joueur en architecture client serveur. Il répond à des demandes.
Une solution personnalisable et extensible
Internet.
- Couche 7 - Couche application. Sommaire 1)Introduction 1)DNS 1)FTP et TFTP 1)HTTP 1)SNMP 1)SMTP 1)Telnet.
Le serveur NAS Network Attached Storage, (NAS) désigne un périphérique de stockage relié à un réseau dont la principale fonction est le stockage de données.
Module 10 : Gestion et analyse de l'accès réseau
Vue d'ensemble Présentation multimédia : Rôle du routage dans l'infrastructure réseau Activation et configuration du service Routage et accès distant Configuration.
Module 2 : Allocation de l'adressage IP à l'aide du protocole DHCP
2-Generalites FTP:Protocole De transfert de fichiers sur un réseau TCP/IP. Permet de copier des fichiers depuis ou vers un autre ordinateur du reseaux,d'administrer.
Le File Transfer Protocol
Collège Anatole France – Cadillac Mise à jour: Questions sur cette charte à envoyer à: CHARTE INFORMATIQUE SIMPLIFIEE.
FIN. Lycée Général et Technologique Simone de BEAUVOIR Quest-ce quInternet? On compare souvent Internet à une « autoroute » FIN.
16/10/10 Préparé par: Ing. Rodrigue Osirus (+509) , *** Site web dynamique.
GTCB Kahila Boulbaba BTS IRIS Session Sommaire Description du projet Présentation Moyen mis en œuvre Interaction entre les éléments Répartition.
Révision Avant lintra – Architecture de lordinateur, les composants, le fonctionnement, codage – Système dexploitation: organisation des données (fichier),
La technologie des réseaux
Glide OS. INTRODUCTION : Ce bureau comporte : Un client de messagerie. Un agenda. Un éditeur photos. Un traitement de texte. Un outil de création de site.
Introduction aux réseaux
SSL (Secure Sockets Layer) (couche de sockets sécurisée)
SECURITE DU SYSTEME D’INFORMATION (SSI)
Lycée Général et Technologique du Rempart - Marseille.
Module 1 : Préparation de l'administration d'un serveur
1 Sécurité Informatique : Proxy Présenter par : Mounir GRARI.
Analyse des protocoles de la couche application
Applications Chapitre B17 et C18
Labview Programmation réseau Communication par sockets
Lycée Louis Vincent Séance 1
INTRANET au service du système d’information
Les relations clients - serveurs
Présentation de NAVIGATEURS INTERNET
Services fournis par le SI et technologies associées
SE CONNECTER SUR UN SITE INTERNET
Module 8 : Maintenance des logiciels à l'aide des services SUS
Olivier Nocent Programmation Web Olivier Nocent
Réunion de collaboration du 9-10 Juillet 2008 J.L. Béney 1 Logiciel At  Client-Serveur Tcp/ip de la station autonome  Influence de l'architecture matérielle.
Travail de diplôme José Garrido Professeur : Philippe Freddi Explorer Internet en toute sécurité Surf Safe SPY INTERNET.
Structures de données avancées : Concepts réseaux et protocole de communication. D. E ZEGOUR Institut National d ’Informatique.
Expose sur « logiciel teamviewer »
Développement d’application client/serveur
Internet : serveurs Web  Clients et serveurs : le navigateur  Sites Web et urls  Fichier source d’une page  Langage HTML 1.
CEG3585/CEG3555 Tutorat 2 Hi ver 2013.
Pr ZEGOUR DJAMEL EDDINE Ecole Supérieure d’Informatique (ESI)
Universal Plug and Play. Idée Connecter tout: PCs, appareils intelligents, et appareils domestiques Computer partout: Universal Plug and Play connectivité.
Architecture d’une application WEB Statique:
Cas M2L Projet ADISPO.
LE FTP.
Cours n°4M1.ist-ie (S. Sidhom) UE 203 Promo. M1 IST-IE 2006/07 Conception d’un système d'information sur Internet Architecture trois-tiers : technologies.
Ingénierie des réseaux
Internet et le Web Internet existe sans le web....
V- Identification des ordinateurs sur le réseau
Introduction General Chapitre 1 : Cadre général
Architecture Client/Serveur
OCS Inventory BENCHIKH.
LE SERVEUR PROXY Un serveur proxy (traduction française de «proxy server», appelé aussi «serveur mandataire») est à l'origine une machine faisant fonction.
GTCB Kahila Boulbaba BTS IRIS Session Sommaire Description du projet Présentation Moyen mis en œuvre Interaction entre les éléments Répartition.
Internet Le Réseau des Réseaux Découverte & utilisation.
Sextant RFS Consultants – Octobre Sextant Le logiciel d’assistance administrative indispensable à toute structure de plus d’une personne. Le premier.
Chapitre8 Configuration de l'adressage TCP/IP et de la résolution de noms Module S41.
Travailler dans un environnement numérique évolutif Domaine D1.
1 P ROTOCOLE DHCP Dynamic Host Configuration Protocol.
DUT 1ère année Génie Biologique Paul-Antoine Bisgambiglia Année
Module : APS et technologie Groupe 1. - Définition de l’application - Fonctionnalités - Les utilisations de l’application.
Révisions pour l’exam L2 Informatique Obligatoire.
Transcription de la présentation:

ANNEHEIM Geoffrey21/03/2009

2 2 Protocole de communication Socket TCP/IP Afin que MyCrawler fonctionne de façon optimale, une configuration de deux machines au minimum est nécessaire. Le réseau de MyCrawler est constitué de machines clientes se connectant à des machines serveurs. Seul les clients peuvent crawler des Urls néanmoins un client peut proposer sa puissance de calcul au serveur afin de le soulager de tâches lourdes telles que l’indexation de pages ou encore le calcul des nœuds du graphe de la communauté crawlée. Des serveurs peuvent communiquer entre eux afin d’élargir le réseau. Les échanges d’informations entre les machines du réseau se font à travers le protocole de communication TCP/IP via des sockets. Afin que MyCrawler fonctionne de façon optimale, une configuration de deux machines au minimum est nécessaire. Le réseau de MyCrawler est constitué de machines clientes se connectant à des machines serveurs. Seul les clients peuvent crawler des Urls néanmoins un client peut proposer sa puissance de calcul au serveur afin de le soulager de tâches lourdes telles que l’indexation de pages ou encore le calcul des nœuds du graphe de la communauté crawlée. Des serveurs peuvent communiquer entre eux afin d’élargir le réseau. Les échanges d’informations entre les machines du réseau se font à travers le protocole de communication TCP/IP via des sockets. Les informations contenues dans ce document sont la propriété exclusive de son/ses auteur(s). Toute utilisation sans accord préalable est interdite.

3 3 Système d’exploitation (Windows, Linux, Mac OS) Socket TCP/IP Table IPs des clients Espace de stockage Black list (Sites inutiles à Crawler) Black list (Sites inutiles à Crawler) White list Graphe des pages Web File des Urls visitées par les clients Espace d’Urls Table IPs des serveurs Protocole de communication Calcul position de l’Url Prise de décision Attribution des Urls à crawler aux clients Collecte les données du client sur le serveur Prise en compte des événements clients (perte du réseau, tâche terminée, …) Couche applicatif Interface utilisateur Configuration Liste des clients Liste des serveurs Urls en attente à crawler Graphe des pages Web Black list (liste noire des Urls) Observateur d’événements Composants logiciels Indexe des pages Web Indexeur (Lucene) Requêtes moteur de recherche Requêtes moteur de recherche (communication serveur à serveur) Répartition des tâches (fonction capacités de calcul des clients) Urls crawlées et indexées Pour une explication détaillée de chacun des blocs, veuillez vous référer au document de spécification logicielle. Les informations contenues dans ce document sont la propriété exclusive de son/ses auteur(s). Toute utilisation sans accord préalable est interdite. Ces fonctionnalités seront développées si l’état d’avancement du projet nous le permet.

4 4 Système d’exploitation (Windows, Linux, Mac OS) Socket TCP/IP Espace de stockage Graphe des pages Web Composant de stockage (messages serveur) Adresse IP serveur Protocole de communication Calcul position de l’Url Prise de décision Prise en compte des événements émis par le serveur Couche applicatif Interface utilisateur Configuration Composants logiciels Pour une explication détaillée de chacun des blocs, veuillez vous référer au document de spécification logicielle. Les informations contenues dans ce document sont la propriété exclusive de son/ses auteur(s). Toute utilisation sans accord préalable est interdite. Ces fonctionnalités seront développées si l’état d’avancement du projet nous le permet. Liste des Urls crawlées Protocole HTTP Composant de téléchargement des pages Web Coordination des pages à visiter Urls à crawler Black list Crawler Analyse de contenu Emission de données au serveur Collecte de données via le serveur Requêtes moteur de recherche Composant de calcul d’un graphe Liste des clients connectés au serveur Calcul position d’une Url dans un graphe fournie par le serveur Accepte ou rejette une page en fonction de son contenu Observateur d’événements Urls en attente à crawler Graphe des pages Web Black list (liste noire des Urls) Requêtes moteur de recherche Urls crawlées