Big data : vers une nouvelle science des risques ?

Slides:



Advertisements
Présentations similaires
Isabelle Franchistéguy-Couloume CREG-UPPA IUT de Bayonne - Pays Basque
Advertisements

Gestion et Ingénierie des SystèmEs Hospitaliers 2010
LE LOGO ECO EMBALLAGE.
Marchés de la Biométrie
Sociologie de linnovation Cas GDF-Suez. Présentation de la société GDF-Suez collaborateurs Chiffre daffaires 2008 :83,1 milliards deuros Coté
DEPISTER POUR MIEUX TRAITER n La prévention consiste à éviter le contact entre notre organisme et des substances nocives dites « oncogènes », (du grec.
Atelier ENT 1er degré - 22 janvier Réunion académique des animateurs informatiques 22 janvier 2007 ATELIER ENT Besoins du 1 er degré pour chaque.
EQUIPEMENTS SPORTIFS ET SECURITE QUELLE PREVENTION DES RISQUES ? Atelier n°1 Rencontres territoriales Du 24 Mai 2007.
Christophe BATIER Utilisation de lapplication SPIRAL/Facebook Retour dexpérience à lUniversité Lyon1.
Évolutions technologiques et sociologiques Novembre 2009 Nouveaux webs, nouveaux comportements?
Les collectivités locales et la protection des données personnelles
1 La mesure MESURE & QUALITE De la mesure …. La mesure 2 Sommaire 1. Problématique 2. Démarche 3. Zéro défaut 4. Résolution des non-conformités.
L’EQUIPE PLURIDISCIPLINAIRE EN SOINS PALLIATIFS
Programme de 5ème Géographie
S’ INSTALLER EN SECTEUR LIBERAL ?
Veille et recherche d'informations pédagogiques du CIP UNIVERSITE PARIS DAUPHINE 26 mars 2013 Véronique MESGUICH Co-présidente de lADBS.
Le système scolaire québécois Un résumé non officiel Marc-André Éthier Février 2009.
Département fédéral de lintérieur DFI Office fédéral de la santé publique OFSP Unité de direction Politique de la santé Le rôle de la concurrence orientée.
Quelles tâches, activités, projets, impliquant les mathématiques, conserver ou proposer en AP ? Un exemple autour de la recherche dune question ouverte.
Droits et Reproductions Réservés – Association Frenchymymy
Quizz Etes-vous certain de tout savoir sur notre Sécurité Sociale ? Nombreuses sont les critiques, les préjugés et les fausses vérités à propos des allocataires.
[Titre de la recherche] [Qui sommes-nous?]. Pourquoi ce sujet ? [Motivations ayant menées au choix du sujet]
La gestion des contenus d'apprentissage par les compétences
Les enfants en situation précaire, pourquoi sont-ils dans la rue ?
LA LOLF A L IA 44 en UNE ANNEE DE DECOUVERTES.
Dispositif daccompagnement Soins palliatifs Fegems Un peu dhistoire… Novembre 2009.
Environnement et situation de l’assurance maladie au Bénin
ATELIER RÉGIONAL DE CAPITALISATION DES EXPÉRIENCES EN ADAPTATION AU CHANGEMENT CLIMATIQUE Maputo, 7-11 mai 2012.
M.E.S : Manufacturing Execution System
Pourquoi et comment enseigner la géographie en cycle 3 ? « Aucun individu ne peut se passer de géographie puisqu'il vit sur la planète terre, qu'il doit.
Chapitre 2 Le travail en équipe
CAP Assistant Technique en Milieux Familial et Collectif
Henri Willox Lycée Albert Camus Conakry, Guinée
1 20 juin 2013 LAccueil à Géoazur J. Trévisan, S. Bertetic, V. Mercier-Valéro, J. Ambre, L. Orsoni, A. Dano, O. Laurain Géoazur – UMR 7329 – UNS – CNRS.
Denis Hauchard Professeur de pâtisserie au CFA d’Avignon présente
La création de la Fondation Suisse pour lOrphelin (FSO-SWS)
Retour dexpérience dun étudiant Pourquoi un cours de fondements théoriques du développement durable doit être enseigné dans tout parcours déducation supérieure.
MRP.
F MOBILIATION SOCIALE EN SANTÉ PUBLIQUE ET DÉVELOPPEMENT DES COMMUNAUTÉS.
Synthèse des travaux. Clarifier les concepts et la terminologie Faire du contrôle interne, un enjeu majeur Bien identifier les acteurs Professionnaliser.
Les traitements à plat Cette partie du cours abordera les traitements élémentaires d’une enquête. Les analyses uni-variées, ou tris à plat, sont en fait.
Traitement et analyse des données
Apprendre sur la religion et apprendre de la religion : le débat en Angleterre Nigel FANCOURT Lord Williamss School/ University of Warwick.
25 RAISONS DAIMER LA NOUVELLE FRANCOPHONIE ONTARIENNE - Lidentité bilingue - Diane Gérin-Lajoie OISE, Université de Toronto
Expériences de coopération et pratiques intéressantes sur la femme.
Ville de Saint-Jean-sur-Richelieu
Les avantages et les inconvénients
Chapitre 9 :Lévolution et la spéciation p RA: Suite à cette présentation, vous devez être capable de définir et expliquer les termes suivants: Mutation.
Handicap et politiques de coopération internationale Etat des lieux du handicap dans la coopération internationale.
Journée régionale sur le suicide et les aînés, Capitale-Nationale Par Bertrand Gignac, directeur général de lArc-en-ciel, Portneuf Et par Renée-Claude.
My VMware Gestion simplifiée des licences produits et du support
La crise des crédits "subprimes" Michel Lasserre le 25/05/2008 La crise des crédits "subprimes" Que sont les crédits "subprimes ? Pourquoi sont-ils à l'origine.
La recherche documentaire sur internet au Cycle 3
Enquêtes épidémiologiques
Contrôle daccès et qualité de service dans les réseaux basés sur ATM Olivier Paul.
J. Fabre 14/10/2008 Rénovation du calcul du taux de chômage : du taux BIT au taux localisé
La VISIO-FORMATION La formation personnalisée, en toute liberté….
Présentation OTeN – e-Forum Casablanca 14 juin 2007 Un observatoire des initiatives numériques sur le territoire français Emmanuel Vandamme, délégué de.
LES DEMARCHES ADMINISTRATIVES SUR LE NET 03/131 Amicale Laïque Poisat.
LA POLAIRE DES VITESSES
Paternité des Données Droits de Propriété Intellectuelle (DPI)
Origine du concept de Cohésion Sociale
Thierry Karsenti Simon Collin Faculté des sciences de léducation Université de Montréal.
Enquête sur le Bio : les résultats Nous avons mené une enquête locale sur un échantillon de 76 personnes sur lagriculture biologique et ses produits :
Baccalauréat professionnel
Sciences économiques et sociales
29e CONFÉRENCE INTERNATIONALE DES COMMISSAIRES À LA PROTECTION DES DONNÉES ET DE LA VIE PRIVÉE 29 th INTERNATIONAL CONFERENCE OF DATA PROTECTION AND PRIVACY.
29e CONFÉRENCE INTERNATIONALE DES COMMISSAIRES À LA PROTECTION DES DONNÉES ET DE LA VIE PRIVÉE 29 th INTERNATIONAL CONFERENCE OF DATA PROTECTION AND PRIVACY.
Possessive adjectives and form The possessive adjectives are used to express possession.
CERN IT Department CH-1211 Genève 23 Switzerland t Get the most of Office 2007! Bruno Lenski, IT/OIS.
Transcription de la présentation:

Big data : vers une nouvelle science des risques ? Serge Abiteboul INRIA et ENS Cachan Conseil national du numérique et Académie des sciences Big data et science des risques

Big data et science des risques Organisation Big data en bref Big data : mythe et réalité Exemple : la santé (une vision d’ignorant) Big data et science des risques

Big data et science des risques Big data en bref Big data et science des risques

Big data et science des risques Le Big Data Le big data ou La data Data ce n’est pas pluriel ? En français : Grosses données  Moins glamour ? Big data et science des risques

Crash course en Big Data La société moderne génère des volumes de données infernaux Double tous les 18 mois Ces données ont une valeur considérable Santé, science, environnement, sécurité, transport... Le « Big data »: croiser les données Très structurées et propres d’une entreprise/organisation Avec la masse de données moins structurées/plus sales du Web Des données personnelles (comme des emails) Des données de réseaux sociaux Et des flux de données (générées par ex. par des senseurs)… Valoriser ces données Découvrir de nouvelles connaissances Offrir de nouveaux services Big data et science des risques

Crash course: tâches principales L’analyse de données – Un vieux problème Tâches principales Acquisition : aller chercher les données, e.g., outils ETL Intégration : e.g., transformer dans un schéma unique, aligner les données Nettoyage : e.g., éliminer les réplicas, résoudre les contradictions, gérer les données manquantes… Crowd sourcing: interagir avec des humains pour obtenir des données, résoudre les contradictions… Interrogation : requête, souscription, visualisation Analyse statistique : frequent item set… L’analyse de données ne répond pas à des problèmes souvent complexes Fouille : quelles sont les questions intéressantes ? Utilisation : comment utiliser ces données ? Etc. Big data et science des risques

Big data et science des risques Difficultés Taille des données : c’est Big ! Téraoctets, plus Hétérogénéité: structures, ontologies, multilinguisme… Vélocité: importance du temps, taux de changement/d'arrivée… Espace : localisation Protection des données : données privées, réglementation… Qualité: erreurs, incomplétude, confiance, Et encore de la qualité: provenance, fraicheur... Et la complexité : un algorithme en n3 sur un milliard d’enregistrements reste hors de portée même avec mille machines… Big data et science des risques

Pour tuer quelques idées reçues La grande mode est au parallélisme massif style Hadoop Super techno venue des moteurs de recherche Ne marche que sur les problèmes très parallèles Technologie encore assez bas niveau (ça s’améliore) Évidemment, Ça impressionne (de moins en moins) C’est fun Mais si « votre data est Big » et si vous recherchez l’efficacité, interrogez vous : Vos données sont-elles vraiment Big ? Ne suffirait-il pas de gonfler votre machine en RAM/en SSD ? Peut-on réduire la dimension en échantillonnant ? Big data et science des risques

Big data : mythe et réalité Big data et science des risques

Big data et science des risques Big data – Le mythe On va résoudre les problèmes de l’humanité On a plus en plus de données bientôt toutes les données Un coup d’algo et on va résoudre le cancer, la pauvreté, etc. En analysant ces données, nous pouvons faire des prédications de plus en plus fines… mais Cela reste des statistiques Limites dues à la complexité en la taille des données Et évidemment une énorme place au hasard On va sûrement résoudre des problèmes… Mais Big data et science des risques

Big data et science des risques Big data – La réalité Ce qu’on observe surtout pour l’instants Les sociétés utilisent des données privées Pour des buts commerciaux – principalement pub ciblées Plus il y a de données, plus ils gagnent d’argent Les états utilisent des données privées Pour se protéger du terrorisme Pour surveiller leurs citoyens (surtout dans certains pays) Plus il y a de données, plus l’état est puissant Big data et science des risques

Et si on utilisait cette techno pour résoudre de vrais problèmes Prévoir et mieux y répondre À des crises sanitaires À des problèmes d'environnement À des catastrophes naturelles … Aider à résoudre les problèmes de Santé, transport, pauvreté, Organiser un suivi personnalisé Des personnes en difficultés Des personnes âgées Des élèves en difficulté Big data et science des risques

Exemple : la santé (une vision d’ignorant) Big data et science des risques

Big data et science des risques Exemple : La santé Les soins personnalisés Les polices personnalisées Toutes les données médicales de la personne Son génome Toutes ses données sociales Soins personnalisés Mesures prédictives Plus chères pour les personnes à risque Personnes « trop » à risque non assurées Mutualisation des risques de plus en plus limitée C’est la même science qui rend ça possible Quel monde souhaitons-nous? Big data et science des risques

Problème : les données personnelles Mes achats, ma géolocalisation, mes courriels… Mes données médicales, fiscales, assurances… Mes données dans les réseaux sociaux… Peut-être celles de mes amis Mes données génomiques 23andMe: pour 99$ séquencement de votre génome et publication sur le Web Et ma vie privée ? 2 exemples de problèmes récents : Instagram et revente Facebook et embauche Big data et science des risques

Une religion personnelle À qui appartiennent mes données ? Les données personnelles appartiennent à la personne Les entreprises/états n’en sont que les dépositaires temporaires Big data et science des risques

Comment pouvoir faire quand même des statistiques ? L’anonymisation des données En garantissant l’anonymat de chacun - compliqué Par exemple, « differential privacy » Le propriétaire des données a le droit de choisir ce qu’on fait de ses données Condition d’utilisation Durée Responsabilité légales de ceux qui détiennent ces données Big data et science des risques

Big data et science des risques