ETL - Pentaho Data Integration

Slides:



Advertisements
Présentations similaires
Introduction au e-commerce
Advertisements

Master Professionnelle Sciences et Techniques 2 juillet
Personnalisation des sites SharePoint avec SharePoint Designer 2007
Microsoft Office Groove Le contexte Une utilisation des postes de travail en très grande évolution chez les professionnels. Des lieux de travail.
- Couche 7 - Couche application. Sommaire 1)Introduction 1)DNS 1)FTP et TFTP 1)HTTP 1)SNMP 1)SMTP 1)Telnet.
INTRODUCTION INTRODUCTION ERGONOMIE Tri par cartes Formulaires Interface Installation Lanceur Documentation TECHNOLOGIES XML + XSL CSS Formulaires génériques.
Mise en œuvre de l’informatique décisionnelle
Support d'aide au commentaire de textes
Projet Webase. I. La définition du projet 1. Lexistant : Webase 4 2. Cahier des charges 3. La répartition des données 4. Le modèle de données 5. Le choix.
SOLUTIONS LOGICIELLES Identification, Impression côté serveur, Logiciel de Suivi & de Mobilité TEKLYNX CENTRAL Solutions logicielles clés en main.
Ce que la CRM ACT peut vous apporter
Business Intelligence CLSO – 24 février Jean-Pierre Riehl
VI. Analyse des solutions techniques
Les outils d’intégration continue
Croissance du secteur entreprise à résidence en milliards de dollars Source : 1 IBM/Conseil canadien du commerce de détail 1999 et International Data.
DECOUVREZ LA NOUVELLE LIGNE 30 WINDOWS V9
Dynamisez la gestion de votre atelier CNC.
OpenSoft « Inventer, c’est penser à côté »
Mise en place de quotas d’impression
26 juin 2009LEFEVRE Christophe1 Module raw et connexions distantes.
Android est une plateforme mobile open source et entièrement paramétrable. Elle a été créée afin de mettre à disposition des développeurs toutes les fonctionnalités.
Projet Darties Groupe 2 15/12/2010.
DEFIS Groupe SRA.
Réalisée par :Samira RAHALI
Plan du Cours Définition de la BI Objectif de la BI Fonctionnement d’une plateforme BI Technologies de la BI Composantes de la BI Les caractéristiques.
Chap 4 Les bases de données et le modèle relationnel
Crystal Reports COPYRIGHT © 2007 BUSINESS OBJECTS SA. TOUS DROITS RÉSERVÉS. DIAPOSITIVE 2 Informatique - Déclaration de positionnement Crystal Reports.
GIM' Compta Votre Démarche dInformatisation. GIM Compta 2 Notre Démarche Vous accompagner dans votre démarche dinformatisation, Vous proposer une offre.
VI. Analyse des solutions techniques
LES SUPPORTS INDIVIDUELS D AIDE A LA DECISION UNE PRESENTATION DE : DIALLO, OUSMANE B.
1.
Sommaire Euro Web : 2 activités ActiveMobility en quelques mots Nos solutions métier Focus sur l'application MobiliSales Le reporting.
XLAB : Formation Initiale Paramétrage Commande – Service Fait – Factures Missions Echanges et sauvegardes Outils et bases de données.
Supports de formation au SQ Unifié
ENGIMA.
Progiciel de Gestion Intégré
Un logiciel développé avec et pour les professionnels des institutions / EMS.
PROJET AssetFrame IT ASSET MANAGEMENT Demo.
SOLUTION DE VIDEOSURVEILLANCE SUR IP
MEMOIRE INDUSTRIEL ESIEA
avec la participation de
Qui sommes nous ? ERIidan Etudes et Réalisation d'Innovations Informatique et D'Activités Nouvelles 20 personnes à votre écoute Maîtrise Hard Soft et.
© all-in-web janvier 2014.
Master 1 - SIGLIS SID Pentaho Stéphane Tallard Notes.
Oracle Data Integrator (ODI) – TD01
Soutenance projet Darties Architecture technique ETL - Restitution Groupe 2 : Diapositive 1 / X.
Améliorer la performance des organisations en apportant à toutes les équipes la meilleure compréhension de leur activité pour des décisions plus rapides.
Contrôles automatiques et paramètrables de flux
4/13/2017 3:41 PM Intégration Visio SharePoint 2010 Application à la création de Workflows Genève -15 Avril 2010 Michel LAPLANE MVP Visio - WGroupe.
Soutenance de projet Mise en place d’une solution de reporting.
Présentation ESTRABOX
Présentation de la gestion centralisée Siège – unités EM - RES3000.
SNMP Simple Network Management Protocol
Travail Collaboratif / SharePoint Pourquoi :  en finir avec le simple partage de fichiers..  en finir avec l’envoi des documents en pièces jointes 
Rapport de Stage : Les Web Services ou la communication
Module 2 : Planification de l'installation de SQL Server
LES SIMULATEURS RÉSEAU
XLAB Version 7.5 Direction des systèmes d’information Bureau Budget, Finances, et Comptabilité Vendredi 5 octobre 2007.
Introduction Rappels : Accès serveurs Unix Ensimag via ssh et sftp
31/05/2007Projet Master 11 Présentation ludique de la recherche opérationnelle à la fête de la science Année universitaire 2006/2007 Sylvain FIX Julien.
9 février 2010 Enrique Ruiz Mateos Architecte avant-vente Microsoft
Observatoire des pratiques Groupe TUICE 2014 Présentation de… Un espace numérique de travail… A partir d’un compte Google.
Soutenance rapport n°2 Victor Fernandez DUT informatique APP S2
Installation du PGI – CEGID
CEGID et environnement réseau Groupe PGI Académie de Grenoble.
CATALOGUE DES FORMATIONS Business Objects 2015 Formateur : KAMAL Laiss.
PROJET DE SESSION PRÉSENTÉ PAR : Rosemarie McHugh DANS LE CADRE DU COURS : SCG Réalisation d’applications en SIG 16 avril 2007.
Cloud et Petites entreprises. Stockage de données.
Implémentation d’une interface pour l’exécution d’ETL à distance Projet de développement logiciel dans le cadre du cours SCG : « Réalisation d’Applications.
Transcription de la présentation:

ETL - Pentaho Data Integration Brice LEGRAND – A13

Introduction Pentaho Data Integration, alias Kettle Version Communautaire (CE) : gratuite Version entreprise (EE) : payante Peu de différences entre ces deux versions : Quelques fonctionnalités avancées Support Aspects de sécurité Travail collaboratif Documentation Etc…

Introduction S’intègre parfaitement dans la suite Pentaho : Exemple : Report Designer pour le reporting Business Analytics pour l’intelligence artificielle Exemple : Flux de données récupérés en temps réel par l’ETL et qui donnent lieu à du reporting en temps sur ces données. Fonctionne sur une machine java Pas d’installation (dézippage du dossier) Solution portable et indépendante du système d’exploitation

Pentaho Data Integration CE 4 modules : Spoon : Interface graphique pour construire l’ETL Carte : Permet d’utiliser kettle sur un serveur distant Pan : Exécution des transformations en ligne de commande Kitchen : Exécution des jobs en ligne de commande

Pentaho Data Integration CE Deux possibilités de gestion des jobs et transformations : Par fichiers plats au format XML, en local En base de donnée pour permettre l’accès à plusieurs contributeurs

Spoon Petit rappel : Transformation : Job : Effectue les traitements sur les données Job : Vérifie la présence d’un fichier Assure la synchronisation des transformations Interroge un serveur Envoi un mail etc…

Spoon – Quelques étapes Tri de ligne Dédoublonnage Jointure Altération structure de flux Extraction depuis fichier Calcul

Aspects avancés Mode débogage : permet de visualiser les données en cours de traitement donne des informations sur les exceptions java rencontrées si erreur Clic droit sur l’étape, Prévisualiser

Aspects avancés Traitements avancés des données en JavaScript

Dans quel cas utiliser cet ETL Contexte du datawarehouse Traitement et regroupement de données en général Entreprise PME ou particuliers : coûts faibles ou nuls et maitrisés.

Pour aller plus loin :