Projet Ours. Sommaire Présentation du périmètre fonctionnel Architecture générale HBase Client Workers Exploitation.

Slides:



Advertisements
Présentations similaires
Exposés logiciels, systèmes et réseaux
Advertisements

DataLab® Toute la connaissance client en quelques minutes
Création de bases de données
Cassandra 2.0 La nouvelle génération de Big Data.
No SQL. Sommaire 1. Présentation a) Qu’est ce que le NoSQL b) Un SGBD NoSQL 2. Bornes 3. Outils de veille 4. Article.
Cours n°4M1.ist-ie (S. Sidhom) UE 203 Promo. M1 IST-IE 2006/07 Conception d’un système d'information sur Internet Architecture trois-tiers : technologies.
Les bases de données Séance 8 Jointures.
Le langage SQL.
Bases de données non relationnelles/NoSQL
Technology for Business rue Saint-Honoré PARIS.
Analyse, élaboration et exploitation d’une Base de Données
I. Framework : Généralités II. Hibernate III. CakePHP Plan de l’exposé : 1.
Présentation de EAS Un logiciel distribuéé exclusivement par Brain2tech SARL.
1 Comment préparer un plan Document No. 2.1 Gestion des activités conjointes de lutte contre la tuberculose et le VIH: cours de formation pour responsables.
Cours de Mme Dominique Meganck - ICC - IFC MICROSOFT ACCESS Un système de gestion de bases de données...
Présentation de Warehouse Un logiciel distribué exclusivement par Brain2tech SARL.
: le tutoriel d’autoformation à la recherche documentaire en Santé Je gère ma bibliographie  Je collecte les informations bibliographiques
Java et les bases de données Etat de l’art 14 juin 2012.
SQLSaturday Paris 2015 SQL Server sur Azure dans tous ses états ! Benjamin Talmard Stéphane Goudeau Microsoft DX.
Développement d’application avec base de données Semaine 3 : Modifications avec Entité Framework Automne 2015.
Bases de données : modèlisation et SGBD Séance 3.
Présentation Embarquer une librairie de ressource indexée dans Moodle.
Gestion des Déploiements Applicatifs Orchestrer les opérations WAS SERENA SOFTWARE INC. Sylvain CAILLIAU 01/11.
1 Les bases de données Séance 7 Les fonctions avancées : Opérateurs ensemblistes, Sous-requêtes et transactions.
Le contrat de pro… Qu’est ce que c’est ? C’est un contrat de travail, CDD ou CDI en alternance qui intègre des périodes de travail en entreprise et de.
COMMUNE DE SAINT-PIERRE EN FAUCIGNY Révision du Plan Local d’Urbanisme REUNION DU 2 AVRIL 2009 REUNION DU 2 AVRIL 2009 QU’EST-CE QU’UN PLAN LOCAL D’URBANISME.
Tutoriel n°4 : Administration Technique Formation : profil Administrateur.
Opérations courantes Guillaume PHILIPPON. Sommaire Mise à jour des QWG Gestion des utilisateurs Ajout/Suppression d’un programme Préparation des « OS.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Session “Site Administrator” Pierre Girard.
GPA – 19 novembre Groupe de pilotage des applications 21 janvier 2010 F. Rougerie – Onema / DCIE.
Qu’attendez-vous de votre infrastructure et comment la simplifier Sylvain Siou, Directeur Technique Sud-EMEA
FACTORY systemes Module 5 Page 5-1 Les outils clients Wonderware FORMATION InSQL 7.0.
Sécurité des SI Par Cronne Matthew / Ogryzek Robert / Frontin Teddy / Lambert Kevin.
Migration Plan adressage EPLE Migration Plan d'adressage EPLE.
Elaborer et orchestrer une politique RH en matière de gestion des compétences 26 mars 2015.
Utilisation du Répertoire sectoriels des emploi/métiers à l’ANAPEC et Plan d’action du RMEM.
Les méthodes de tests Les grands principes pour réaliser des tests efficaces.
Atelier d’échange d’expériences et de capitalisation sur des projets d’électrification rurale en cours Schémas organisationnels Mardi 10 décembre 2002.
© 2016 IBM Corporation 1 IBM Datacap Nouveautés de la version 9 Stéphane Montri ECM Technical Sales
Chapitre 6 Déploiement et gestion des logiciels à l'aide d'une stratégie de groupe Module S44.
CC – Janvier 2016 – V1.0 PORTAIL EUDONET – ECS SUPPORT FONCTIONNALITÉS, CAPTURES D’ECRANS
RÉNOVATION BTS Comptabilité et Gestion 2015 CB2C : un exemple de situation professionnelle Christine Forest Stéphane Bessière Daniel Perrin Toinin.
Master 2 Entrepreneuriat International Option Gestion des Risques L’APPRECIATION DES PLUS OU MOINS VALUES LATTENTES, LES ECARTS DE CONSOLIDATION ET D’ACQUISITIONS.
SEMINAIRE DES ACTEURS DE LA FORMATION Dialogue Web Formation LOGNES 16 et 17 décembre 2013.
1 Initiation aux bases de données et à la programmation événementielle VBA sous ACCESS Cours N° 7 Support de cours rédigé par Bernard COFFIN Université.
SQLSaturday Paris 2015 SSDT-DB pour les sceptiques! Cédric L. Charlier.
Master sciences et techniques de géomatique environnementale
Déploiement de la solution de supervision FAN au sein de société CBI et de ses filiales au Maroc et en Afrique.
#ConventionCRiP De la supervision du SI LMG à l’IT Performance Management Patrick BERTHOLON Responsable exploitation et solutions techniques DSIP/Opérations.
Quel est l’intérêt d’un moteur de recherche de CV pour le recrutement ? Master MIAGE Tuteur : Michel Plasse Danicel Alexandre Entreprise de stage Maitre.
Pédagogie UCC VTT La fiche de séance
Formation des Chefs d’établissement 2012 SAFCO-Mission TICE-IUFM Formation ENT Préparer la rentrée scolaire.
Système Intégré de Gestion de l’Etat Civil PROJET SIGIEC 1.
1 Rappel des objectifs d’Optiflux Objectifs Optimisation des flux financiers et des flux technico-comptables associés Accélération et fiabilisation des.
Formation des Chefs d’établissement Vague 3 Janvier/Février 2011 SAFCO-Mission TICE-IUFM Formation ENT Préparer la rentrée scolaire.
Développement d’application avec base de données Semaine 2: Requête avec l’Entity Data Model Automne 2015.
Pilotage Opérationnel
Colloque LCG France14-15 mars SURVEILLANCE ET GESTION D’INCIDENTS Cécile Barbier (LAPP)
Contexte et Historique L’Editeur de référentiels compétences Le Système cible L’Intégration ePortfolio Services d'un ePortfolio interagissant au sein de.
Mise en correspondance des logins entre PRONOTE et ATRIUM Démarche pas à pas V5 –
Hadoop distributions Hadoop Hadoop est un framework Java libre destiné à faciliter la création d'applications distribuées.
Développement d’application avec base de données Semaine 1 : Présentation d’Entity Framework Automne 2015.
1 Module de formation « ERP » Sommaire Master Spécialisé en Management des Technologies de l’Information EPITA M. Patrick SZYCHTER Mai 2006.
Slide player Présentation n°1. Système n°1 Avantages Inconvénients Système n°2 Avantages Inconvénients.
Slide player Présentation n°2. Système n°1 Avantages Inconvénients Système n°2 Avantages Inconvénients.
Séminaire EOLE Dijon octobre 2010
La contraception chimique
Integrated Business intelligence
Transcription de la présentation:

Projet Ours

Sommaire Présentation du périmètre fonctionnel Architecture générale HBase Client Workers Exploitation

Périmètre fonctionnel 1- Centraliser toutes les offres (LG, CIAO, DOYOO) dans un unique repository. 2- Contextualiser des offres (Compléter les attributs des offres, Historique 10j). 3- Réduire le temps des mises à jour des offres en live (DELTA). 4- Consulter et mettre à jour les offres (ex : catégorisation).

HBase HBase: NoSQL (Not Only SQL) Inspiré de BigTable de Google Orienté colonnes (Clé-valeur, document, graph), comme Cassandra, Hypertable IdTimestampTitreDescriptionUrlBrand… PortableDell Portable Gamernouvelle url TéléphoneSamsung amazon 4 Column family « data » Region Server 2 Region Server 1

HBase Avantages: –Pas de schéma fixe –Partition automatique –Scalable horizontalement –Tolérant à la panne –Gestion native d’un TTL Inconvénients –Requêtage complexe –Model de données « plat » i.e. non hiérarchique (RMDS)

HBase Schéma: –Première version simple –Uniquement les champs leguide0.txt –« Modification » du schéma au fur et à mesure de l’intégration des workers

Client HBase Master HBase Region Servers File System Client ZooKeeper Quorum

Client HBase Master HBase Region Servers HBase Master Backup ZooKeeper Quorum HDFS NameNode HDFS DataNode Client

HBase Master HBase Region Servers ZooKeeper Local File System Client

Référentiel des offres Clé: élément le plus important -> identifiant unique – - - Types de filtres: –Row –Column Family –Column Qualifier –Timestamp –Value

Référentiel des offres - - Toutes les offres d’un marchand dans un pays: –Filtre de type Row -> Scan(RowFilter("fr " )) Toutes les offres d’un marchand: –Filtre de type Row -> Scan(SubStringFilter(" ")) Toutes les offres d’un marchand qui ont été modifiées: –Filtre de type Row + Value -> Scan(RowFilter("fr " ) and SingleColomnValueFilter("update", {"UPDATE", "ADD", "REMOVE"} )) L’offre il y a 8 jours: –Filtre de type Row + Timestamp -> Scan(RowFilter("fr " ) and TimestampFilter(« 8 days ago »)

Workers HBase MapReduce != HDFS MapReduce –Utilisent une table comme source –Permettent de filtrer les données (Scan) Catégorisation/Brand/Clicks… –Compléter les données de la base des offres via BDD ou un export Génération de stats pour le BI, indexation pour l’équipe search (génération des micros index en map-reduce)…

Workers Gestion des workers: –Ex: Intégration (Launch) -> requête de workers pour lancer le delta –Ex: Scheduler -> CRON pour lancer une catégorisation Application Ex:intégration Scheduler Ex: catégorisation Workers Manager HBase

Déploiement de la distribution Cloudera –Distribution « brute » d’Apache présentes des conflits de versions –Stabilité: patchs réguliers, versions contrôlées –Packages prêt à l’emploi: rpm… –Quelques fonctionnalités manquantes –Outils Cloudera Manager: supervision, déploiement simplifié, métriques… Exploitation

Hardware –Master: (NameNode, Secondary NameNode, JobTracker et Hbase Master) -> 17GB –Slave (DataNode, TaskTrackers, Hbase RegionServers) -> 24GB Exploitation

Questions?