La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Projet Ours. Sommaire Présentation du périmètre fonctionnel Architecture générale HBase Client Workers Exploitation.

Présentations similaires


Présentation au sujet: "Projet Ours. Sommaire Présentation du périmètre fonctionnel Architecture générale HBase Client Workers Exploitation."— Transcription de la présentation:

1 Projet Ours

2 Sommaire Présentation du périmètre fonctionnel Architecture générale HBase Client Workers Exploitation

3 Périmètre fonctionnel 1- Centraliser toutes les offres (LG, CIAO, DOYOO) dans un unique repository. 2- Contextualiser des offres (Compléter les attributs des offres, Historique 10j). 3- Réduire le temps des mises à jour des offres en live (DELTA). 4- Consulter et mettre à jour les offres (ex : catégorisation).

4

5 HBase HBase: NoSQL (Not Only SQL) Inspiré de BigTable de Google Orienté colonnes (Clé-valeur, document, graph), comme Cassandra, Hypertable IdTimestampTitreDescriptionUrlBrand… 1123456PortableDell 145678Portable Gamernouvelle url 2 3123466TéléphoneSamsung 145679amazon 4 Column family « data » Region Server 2 Region Server 1

6 HBase Avantages: –Pas de schéma fixe –Partition automatique –Scalable horizontalement –Tolérant à la panne –Gestion native d’un TTL Inconvénients –Requêtage complexe –Model de données « plat » i.e. non hiérarchique (RMDS)

7 HBase Schéma: –Première version simple –Uniquement les champs leguide0.txt –« Modification » du schéma au fur et à mesure de l’intégration des workers

8 Client HBase Master HBase Region Servers File System Client ZooKeeper Quorum

9 Client HBase Master HBase Region Servers HBase Master Backup ZooKeeper Quorum HDFS NameNode HDFS DataNode Client

10 HBase Master HBase Region Servers ZooKeeper Local File System Client

11 Référentiel des offres Clé: élément le plus important -> identifiant unique – - - Types de filtres: –Row –Column Family –Column Qualifier –Timestamp –Value

12 Référentiel des offres - - Toutes les offres d’un marchand dans un pays: –Filtre de type Row -> Scan(RowFilter("fr-000158" )) Toutes les offres d’un marchand: –Filtre de type Row -> Scan(SubStringFilter("-000158-")) Toutes les offres d’un marchand qui ont été modifiées: –Filtre de type Row + Value -> Scan(RowFilter("fr-000158" ) and SingleColomnValueFilter("update", {"UPDATE", "ADD", "REMOVE"} )) L’offre il y a 8 jours: –Filtre de type Row + Timestamp -> Scan(RowFilter("fr-000158-15" ) and TimestampFilter(« 8 days ago »)

13 Workers HBase MapReduce != HDFS MapReduce –Utilisent une table comme source –Permettent de filtrer les données (Scan) Catégorisation/Brand/Clicks… –Compléter les données de la base des offres via BDD ou un export Génération de stats pour le BI, indexation pour l’équipe search (génération des micros index en map-reduce)…

14 Workers Gestion des workers: –Ex: Intégration (Launch) -> requête de workers pour lancer le delta –Ex: Scheduler -> CRON pour lancer une catégorisation Application Ex:intégration Scheduler Ex: catégorisation Workers Manager HBase

15 Déploiement de la distribution Cloudera –Distribution « brute » d’Apache présentes des conflits de versions –Stabilité: patchs réguliers, versions contrôlées –Packages prêt à l’emploi: rpm… –Quelques fonctionnalités manquantes –Outils Cloudera Manager: supervision, déploiement simplifié, métriques… Exploitation

16 Hardware –Master: (NameNode, Secondary NameNode, JobTracker et Hbase Master) -> 17GB –Slave (DataNode, TaskTrackers, Hbase RegionServers) -> 24GB Exploitation

17 Questions?


Télécharger ppt "Projet Ours. Sommaire Présentation du périmètre fonctionnel Architecture générale HBase Client Workers Exploitation."

Présentations similaires


Annonces Google