La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Les enjeux du « big data »

Présentations similaires


Présentation au sujet: "Les enjeux du « big data »"— Transcription de la présentation:

1 Les enjeux du « big data »
Jean-Marc Rietsch, Ingénieur Civil des Mines Expert en dématique* et en archivage électronique, spécialiste des aspects risque et économie Chargé de cours à Mines ParisTech Président de FEDISA (Fédération Européenne de l’ILM du Stockage et de l’Archivage) * Contraction de dématérialisation et d’informatique, la dématique correspond à l’action de dématérialiser au sens large, elle traite ainsi la numérisation de documents papiers, la dématérialisation des échanges et des processus métier en y incluant la composante légale.

2 Augmentation des volumes
29 To d’informations publiés par seconde 2,5 Eo(1018) / jour 1 Zo (1021) / an Origines diverses: sites médias sociaux, blogs, images numériques, vidéos, signaux GPS, informations climatiques, transactions bancaires, … Individuellement valeur très limitée, mais croisées et analysées elles valent de l’or! 1 Ko  une page de livre, 1 Mo  un livre de 1000 pages 1 Go  une bibliothèque personnelles 1 To  1 million d’ouvrages, bibliothèque nationale

3 Big data Impacte beaucoup de domaines
E-commerce (le + apparent pour l’instant) Sécurité (exemple cambriolage) Finance Assurance (prédiction de sinistres) Santé (soins personnalisés, médecine prédictive) Recherche (voir + avant) Economie Agriculture (semence la + adaptée) Météorologie (prédiction) Formation (ouverte à tous) Politique (élections, …)

4 Big data  Un problème de volumétrie ? Que faire de ces données ?
Surveiller leur exploitation ? Des changements de comportements à avoir et à vivre? Nous avons du mal à penser globalement l’ensemble des transformations possibles.

5 Un peu d’histoire / numérique
Entreprise Numérique Cellulaire Prise de Conscience & Eco Efficacité ECO Responsabilité Citoyenne ENVIRONNEMENT Entreprise Matricielle Lois Règlements Doc électronique Identité numérique : personnes documents Services de Confiance JURIDIQUE Entreprise Industrielle NF Z42-013V1 ISO 14721 ISO 15489 RM ETSI TS ETSI ISO 30300 ISO 27001 Consolidation Cohérence NORMES KM Datawarehouse - Extract - Transform - Load Business Intelligence ILM Datamining Big data Connaissance ORGANISATION Mainframes DAS SAN NAS DAS Grid Storage CAS – MAID Virtualisation Cloud (SaaS) Centrale Numérique & Énergie IT TECHNOLOGIE 1970 1980 1990 2000 2010 2020

6 Problème de volumétrie ?
Retour à la pierre ! Quartz, 40 Mo/i2 contre 35 pour un CD. Lisible par microscopique optique mais fragile aux chocs. Nouveauté en matière optique le HVD pour Holographic versatile disc est une technologie de disque optique qui peut contenir jusqu’à 3,9 To d’information soit CDs ou 830 DVD ou encore 60 Blue-ray ! Les évolutions du magnétique Seagate a atteint 1To/i2 et on annonce des disques de 3,5 pouces avec jusqu’à 60 To ! La révolution côté vivant ? 6 Mo dans 337 picogramme (10-12) d’ADN. Les chercheurs annoncent 2 po dans un seul gramme.

7 Deux grandes stratégies
Active: on migre régulièrement, par exemple tous les 5 ans pour du disque et tous les 10 ans pour de la bande Passive: on choisit un support pérenne, plus coûteux au départ, exemple DVD en verre L’actif n’est pas moins cher !

8 Difficultés du BD, les 4 V Volume Variété et hétérogénéité Vélocité
Véracité Droits d’accès

9 Analyser des données Rechercher des données et les acquérir
Homogénéiser les données / # sources Détecter les doublons et les erreurs Interagir avec des humains pour + de données et résoudre les contradictions Faciliter le travail des analyste avec outils de visualisation Analyses statistiques automatiques Développer des applications et services

10 Besoin de nouvelles compétences
Data scientist, à la fois : Ingénieur informatique Mathématicien capable à partir d’une série de données: D’extraire des tendances De communiquer

11 Contrôle des accès Anonymisation Chiffrement Des lois universelles 
Trouver le bon compromis entre l’exploitation positive et le respect de la confidentialité des individus!

12 Changement de comportement, exemple / recherche
Autrefois / cahiers de laboratoire, désormais le rôle des scientifiques est de concevoir des algorithmes: Construire des théories à partir des observations Calculer des prédictions à partir d’une théorie Vérifier la conformité du modèle / réalité et non / ensemble des prédictions

13 Importance du SI Alain Juillet : « la sécurisation de l’information et son organisation ne constituent pas une fin en soi mais correspondent à l’étape indispensable avant de pouvoir transformer les données en connaissance… »

14 Le SI devient outil de production de valeur
Support de l’ensemble des processus métiers Ouverture vers un plus grand nombre d’utilisateurs Progression des capacités de stockage et de traitement Adaptation de l’organisation des SI Le SI passe d’une logique de collecte des données à une logique de production d’informations... de valeur!

15 Gouvernance de l’information
© IBM

16 Les défis à relever/numérique
Maîtriser l'explosion des volumes d'informations échangés, Gérer de plus en plus de flux aux origines diverses, Sécuriser l’ensemble au sens large, S’adapter de façon rationnelle, efficace et pérenne à la multiplication des formats de contenu, Analyser et exploiter l’information. Créer de la valeur, de la connaissance

17 Opportunités du big data
De nouveaux métiers : 4,4 millions d’emplois d’ici 2015 Gains de productivité (source Mc Kinsey): + 0,7% santé, +0,5% administration, +1% commerce De nouvelles organisations à mettre en place (exemple nouvelle forme d’élections, à associer à l’open data !) Sensibiliser l’utilisateur à rester vigilant : effacer les cookies, désactiver l’option de géolocalisation de son smartphone, lâcher par moment les réseaux sociaux !

18 Merci pour votre attention


Télécharger ppt "Les enjeux du « big data »"

Présentations similaires


Annonces Google