Hadoop distributions Hadoop https://fr.wikipedia.org/wiki/Hadoop Hadoop est un framework Java libre destiné à faciliter la création d'applications distribuées.

Slides:



Advertisements
Présentations similaires
Exposés logiciels, systèmes et réseaux
Advertisements

Microsoft Office Groove Le contexte Une utilisation des postes de travail en très grande évolution chez les professionnels. Des lieux de travail.
Une solution personnalisable et extensible
Les outils d’intégration continue
J2EE vs .NET Réaliser par : SEIF ENNACER BADRA && CHETOUI RIM.
Plus simple à utiliser Une interface d’administration entièrement remaniée rend plus facile l'apprentissage de Drupal.
HEPIX N. Neyroud 1.
Historique L’évolution des architectures du début à nos jours.
Constitution d'un système de preuve de propriété d'un logiciel/progiciel et Valorisation d'un patrimoine IT AGORANOV 20 octobre 2015 Henri de Hauteclocque.
Projet Ours. Sommaire Présentation du périmètre fonctionnel Architecture générale HBase Client Workers Exploitation.
L’Online Executive Master in Management Organisé par Proposé en partenariat par.
De quoi parle t’on. Pour aller plus loin
Learning Management System Système de Gestion d’apprentissage Ahmed ALMAKARI- Université Ibn Zohr-Agadir- Maroc.
I. Framework : Généralités II. Hibernate III. CakePHP Plan de l’exposé : 1.
Présentation de EAS Un logiciel distribuéé exclusivement par Brain2tech SARL.
C LIENT ZÉRO MAIS PUISSANCE D ' ADMINISTRATION MAXIMUM L'expression « administration client zéro » est trompeuse. Elle pourrait laisser croire, à tort,
JI Les systèmes d’autorisation et d’authentification dans AMI Fabian Lambert.
Sciences et technologies des services (STS) Présentation du programme Grenoble – 29 avril 2015 Baccalauréat technologique - série STHR Baccalauréat technologique.
FACTORY systemes Module 1 Section 2 Page 1-7 Introduction InSQL FORMATION InSQL 7.1.
«Numérique et intervention sociale, un monde en mutation» 19 et 20 novembre 2015 Faire prendre conscience de la nécessité d'accompagner le changement induit.
Séminaire SoSySec 25 mars 2016page 1 Processus de développement de système contraint par des préconisations de sécurité d'un SI urbanisé Jacques Simonin.
Présentation PGI (Progiciels de Gestion Intégrée) VEGNI Cyril, Enseignant l’Université d’Angers, Directeur de Projet GUERY Sébastien, Enseignant à l’Université.
PPE2 La maison des ligues BEAUPEUX CharlySOUCHET Laurent GENDREAUD QuentinGAUTHIER AntoineDERIEN Alexandre.
Microsoft Dynamics CRM 3.0 Mobile. Microsoft Dynamics CRM Mobile 3.0 La version Française de Microsoft CRM Mobile est enfin disponible ! Retrouvez également.
Mediator 9 - Un outil de développement multimédia 3AC Techno/Informatique.
Exposé en Knowledge Management Préparé par Lô Ahmadou Lamine Rachid Abdi Sagal.
Freeplane Free mind mapping and knowledge ree mind mapping and knowledge Freeplane Free mind mapping and knowledge ree mind mapping and knowledge.
Outil d’Aide au Développement et à l’Organisation des Clubs.
Vers la gestion globale des risques au travers de l’ISO : 2009 CLUSEL Sophie OMNES Air France – KLM Novembre 2011.
Développement d’application avec base de données Semaine 8 : WPF avec Entité Framework Automne 2015.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Session “Site Administrator” Pierre Girard.
Chapitre 4 Gestion des disques Module S41. Plan du cours 1. Utilisation de l'outil Gestion des disques 2. Utilisation des disques de base 3. Utilisation.
PARCOURS DE Professionnalisation
Module S42 Chapitre 1  Présentation de l'administration des comptes et des ressources.
FACTORY systemes Module 5 Page 5-1 Les outils clients Wonderware FORMATION InSQL 7.0.
Différents RSE Caractéristiques et Evaluation 1 Smile – Open Source Solutions.
© 2016 IBM Corporation 1 IBM Datacap Nouveautés de la version 9 Stéphane Montri ECM Technical Sales
Chapitre 6 Déploiement et gestion des logiciels à l'aide d'une stratégie de groupe Module S44.
StratusLab is co-funded by the European Community’s Seventh Framework Programme (Capacities) Grant Agreement INFSO-RI La technologie « cloud » M.
> 1 Pôle INSIDE GIGE mars Un pôle d’innovation regroupant le BRGM et l’Onema Formalisé en 2014, pour répondre aux enjeux du système d’information.
STRATEGIE GOUVERNEMENTALE DE DEVELOPPEMENT DES ACTIVITES PORTUAIRES Par SOULE TAIROU Adam.
SEMINAIRE DES ACTEURS DE LA FORMATION Dialogue Web Formation LOGNES 16 et 17 décembre 2013.
1 AVEC LE RÉSEAU NATIONAL HAUT DÉBIT Votre entreprise n’a plus de limites.
Supervision EC-Net AX Serveurs Web EC-BOS AX. ARCHITECTURE Les solutions EC-Net AX EC-Net AX Supervisor EC-Net AX EnerVue EC-Net AX Security  EC-Net.
1 Projet d'établissement Action 10.2 Créer un portail intranet dédié aux agents de l’Inrap Présentation des choix technologiques de l’Inrap.
Human Task Service (2008) Oscar Barrios et François Charoy Human Task Service Service de tâches dans un système de gestion de workflow Oscar Barrios
Master sciences et techniques de géomatique environnementale
© 2006 ERPI – Reproduction autoriséeJacques Lavallée et Danielle Perras, Université de Sherbrooke 44 ChapitreChapitre Vers une meilleure prise de décisions.
Quel est l’intérêt d’un moteur de recherche de CV pour le recrutement ? Master MIAGE Tuteur : Michel Plasse Danicel Alexandre Entreprise de stage Maitre.
Synthèse des différents types de tarification. POLITIQUE TARIFICATION.PPT Les grands principes de la tarification  Il existe trois grandes catégories.
1 PRESENTATION DU PROJET NTIC - SERMM. 2 SERMM Fondée en personnes, 6,9 M€ Spécialisée dans l’usinage, la soudure de pièces en métaux difficiles.
PROJET FIN D’ÉTUDE 4 ÈME ANNÉE OPTION : INGÉNIERIE DES SYSTÈMES AUTOMATISÉ ET CONTRÔLE QUALITÉ « SYSTÈME DE CONTRÔLE ET DE COMMANDE D’ACCÈS À DISTANCE.
LOGICIELS PAYANTS VERSUS LOGICIELS LIBRES MICROSOFT VERSUS OPEN OFFICE UN CAS.
RAPPORT DE STAGE DEVELOPPEMENT APPLICATION INTERNET « Domiweb » Maître de stage Hélène CEVAËR LOGICA Brest Immeuble Grand Large Quai de la Douane
Chapitre 9 Gestion des maîtres d'opérations
Les applications O.Legrand G. Seront. Les applications Chaque application a son Linux.
Tier 2 au LAPP. Plan Historique Objectifs Infrastructures Status/métriques Avenir Conclusion.
INSCRIPTIONS SPORTIVES
Veille technologique Les objets connectés.
Université Ferhat Abbas –Sétif 1 Centre des Systèmes et Réseaux d’Information Et de Communication, de Télé-enseignement et D’Enseignement à Distance Rapport.
Stratégie vers la communauté de recherche en informatique V. Breton.
Colloque LCG France14-15 mars SURVEILLANCE ET GESTION D’INCIDENTS Cécile Barbier (LAPP)
© 2007 Autodesk1 Nouveautés de Revit Architecture 2008.
Feuille de Route C. Loomis (CNRS/LAL) Réunion Utilisateurs StratusLab (4 avril 2013)
Eric Fede : Obernai Intégration des services grille dans l'exploitation des systèmes informatiques du laboratoire.
Stratégie d'entreprise. La stratégie d'entreprise- consiste à faire des choix d'allocation de ressources (financières, humaines, technologiques, etc.)
CREAM & ICE Réunion SA1-France 11 mars 2008
FENIX Aperçu GLOBALE DU Système
Transcription de la présentation:

Hadoop distributions Hadoop Hadoop est un framework Java libre destiné à faciliter la création d'applications distribuées et scalables. Le HDFS est un système de fichiers distribué, extensible et portable développé par Hadoop. Écrit en Java, il a été conçu pour stocker de très gros volumes de données sur un grand nombre de machines équipées de disques durs banalisés. Une architecture de machines HDFS (aussi appelée cluster HDFS) repose sur deux types de composants majeurs : NameNode (nœud de noms) : ce composant gère l'espace de noms, l'arborescence du système de fichiers et les métadonnées des fichiers et des répertoires. DataNode (nœud de données) : ce composant stocke et restitue les blocs de données.

Hadoop distributions Pourquoi une distribution? Hadoop est en aucun cas une solution de type ‘box’, l’intervention de multiples composants issus du monde open source rend son installation et son exploitation délicates. Les entreprises ont besoin d'une solution de gestion de données qui soit robuste, mais facile à intégrer avec l'infrastructure existante. L' architecture flexible et modulaire de haddoop permet d'ajouter de nouvelles fonctionnalités pour l'accomplissement de tâches diverses. Des distributeurs ont peaufiné le code afin de modifier ou d'améliorer les fonctionnalités. Certains ont été en mesure de résoudre des inconvénients inhérents de Hadoop. Hadoop est en aucun cas une solution out-of -the-box. Afin de construire une entreprise véritablement infos entraînée, où les décisions sont fondées sur des données et non pas deviner œuvres, les entreprises auraient besoin d'une solution de gestion de données qui offre non seulement robuste gouvernance des données, mais aussi est facilement gérable et intègre parfaitement avec l'infrastructure existante de l'entreprise. Hadoop est notamment distribuée par quatre acteurs qui packagent la solution, proposent des services de formation et un support commercial, mais également des fonctions supplémentaires. Ces distributeurs ainsi ont une réelle plus-value à apporter à leurs clients. Ces distributeurs sont : Cloudera, la première distribution historique d'Hadoop qui intègre les packages classiques et certains développements propriétaires comme Impala. Cloudera Hortonworks MapR Technologies - MapR a développé un système de fichier pour Hadoop palliant les limites du HDFS MapR IBM BigInsights for Hadoop, 100% open source Apache Hadoop, propose des extensions analytiques et d'intégration dans le SI(IBM) d'entreprise. IBM

Hadoop distributions Cloudera distribution Points clefs: Portail d’administration Cloudera Manager (Propriétaire) Couche unifiée d’accès aux données Impala (Open Source) Les entreprise voulaient une gestion et outil de surveillance pour Hadoop, Cloudera créa 'Cloudera Manager'. Les entreprise voulaient un moteur SQL plus rapide pour Hadoop, Cloudera créa 'Impala'. Cloudera a plus de 200 des clients grands comptes, dont des déploiements de plus de mille nœuds soutenant plus d'un pétaoctet de données.

Hadoop distributions Hortonworks distribution Points clefs: Fort partenariat avec les gros du métier (Google) Investissements massifs sur le gestionnaire de ressources YARN 100% de leurs développement est Open Source Hortonworks distribue Hcatalog, contenant un meta-dictionnaire des objets disponibles sur Hadoop. Tous les outils sont toujours intégrés dans leurs versions les plus récentes. Les tests sont faits directement sur les machines de Google. Participent au projet Ambari, visant a simplifier l’administration des serverus Hadoop. YARN = Yet Another Resource Negocitator.

Hadoop distributions MapR distribution Points clefs : Base NOSQL MapR-DB (Propriétaire) Utilisation de la technologie NFS (Propriétaire) et non HDFS Integration des outils gravitant autour de Hadoop MapR est la seule distribution à installer en natif Apache Spark. MapR est impliqué dans l’élaboration de la base AADHAAR, plus grosse base d’identification biométrique au monde (1,2 Miliard d’identités, base utilisée pour les transactions banquaire en inde, interrogée en temps réel).

Hadoop distributions Distribution comparison