« Data Scientist » (Ingénieur, PhD) chez HEVA

Slides:



Advertisements
Présentations similaires
Bibliothèque Centrale de l’École Polytechnique Session pratique Recherches documentaires en sciences dures PSC 2011 septembre/octobre 2011 Denis Roura,
Advertisements

Le congres Maghrébin, Alger 26-28, Mai INTRODUCTION Les inhibiteurs de la tyrosine kinase (ITK): avancée thérapeutique de la LMC Trois ITK sont.
Le socle commun : des pistes pour la technologie Plan de la présentation : - Introduction - Contexte (socle commun et document eduscol) - Repérage des.
Vendredi 3 décembre 2010 Y a-t-il une augmentation des mastectomies totales ? Evolution des pratiques de chirurgie pour cancer du sein en France entre.
RECHERCHE ACTIVE DES PATIENTS VIH + PERDUS DE VUE, SUR L’HOPITAL AVICENNE P.HONORE 2015.
Echec Virologique et Résistance du VIH-1 après 12 et 24 Mois de Traitement de 1ère Ligne au Sénégal (Projet ANRS 12186) Nafissatou Leye LBV-HALD-SENEGAL/UMI233-IRD-FRANCE.
Séance bibliographique
Qualité de vie du cancéreux
PMSI et Système d’Information en Epidémiologie
Le big data: un changement radical pour les sociétés
METTRE EN ŒUVRE UN PROJet DE PARCOURS n psychiatrie et sante mentale
M. lahkim, M. Ramraoui, M. J Fassi Fihri, A. Elguezzar, A. Khader, R
Révolution numérique Données partagées Open data
Interprétation des indicateurs?
De nombreuses nouveautés !
Dominique PETRELLA – Frédéric GUINEPAIN - IA-IPR STI Versailles
Présentation flash Mode d’emploi
Médiathèque dans la cité : projet de réalisation d’un module de formation en ligne en partenariat avec Bibliothèques sans frontières ABF, Carvin le 12.
Commune aux 7 départements de l’école 12ème promotion
Région PACA: OMIT Observatoire du Médicament et de l ’Innovation Thérapeutique A. Mousnier 2ème journée plénière du Comité Régional du Médicament et.
Principaux résultats, module cathéter du RDPLF
Système d ’information médicalisé et tarification à l ’activité en HAD
S. Mounier, H. Laroye, O. Boscus, F. Enguehard, E. De Cruzel, G
Switch pour IP/r + 3TC versus monothérapie IP/r
TRAVAIL en 12H dans la FPH : Méthode de travail proposée
Pédiatrie – année 2015 Nous avons défini comme pédiatriques les malades dont l’âge est inférieur à 16 ans. Selon ce critère, depuis le début 704 patients.
Institut national de santé publique Mise en place du registre de l’enfant diabétique âgé de moins de 15 ans dans la wilaya d’Alger 18 avril 2012.
Rôle et apport des Idecs: résultats de l’audit de 104 patients
7 – Les outils pour piloter son action pédagogique
Groupe d’Epidémiologie Clinique du SIDA en Aquitaine (GECSA)
L’éducation thérapeutique du patient
Système d’information régional sur le médicament
Rapport sur département SPU
Déterminants du recours au dépistage des cancers gynécologiques : situation chez les femmes obèses et selon l’origine migratoire Doctorante Jeanna-eve.
Concepts informatiques fondamentaux et curricula d’informatique au secondaire Haddi Abderrahim 31 Octobre 2013.
Victoria, Seychelles, 25-27octobre 2017
République Algérienne Démocratique et Populaire Ministère de l'Enseignement Supérieur et de la Recherche Scientifique Université Saad.
Le médecin généraliste face à la continuité de la prise en charge des cancers : rôle des échanges ville-hôpital Dr Dominique Rey 9 novembre 2017.
SOCIETE FRANCOPHONE DE TRANSPLANTATION, Lille 2015
Transmissions ciblées
Royaume de Maroc Université Hassan Premier Settat Faculté des Sciences et Techniques de Settat LA CLASSIFICATION K-MEANS SOUS R /MATLAB Master :Automatique.
Traitement de première ligne de la Macroglobulinémie de Waldenström par Rituximab-Fludarabine (RF) et Rituximab Cyclophosphamide Dexamethasone (RCD): une.
Les fondamentaux de la Data Science Théorie
ORGANISATION PEDAGOGIQUE ET TECHNIQUE
Point de Mise en œuvre de la CPS au Mali
LA MODERNISATION DES PARCOURS PROFESSIONNELS, DES CARRIÈRES ET DES RÉMUNÉRATIONS ACCORD PPCR Mise en application à partir du 1er janvier 2016.
Congrès National de Chirurgie 2018
INTRODUCTION: OBJECTIFS:
Le dossier de candidature à l’AMI de Roche
Le dossier de candidature à l’AMI de Roche
Centre d’études et de recherches sur les qualifications
Data Mining Fait par : Belhaj Nadia Derouich Maryem.
SUJET : E C L A T UNIVERSITE GASTON BERGER DE SAINT LOUIS UFR DES SCIENCES APPLIQUEES ET DE TECHNOLOGIE MASTER PROFESSIONNEL EN DÉVELOPPEMENT DE SYSTÈMES.
Mémo pour complétude PAAT établissement du GHT xxxxx
ENSEIGNER L’ALGORITHMIQUE ET LA PROGRAMMATION AU COLLÈGE
Moteurs de recherches Data mining Nizar Jegham.
Technologie de l’Information pour la santé
L’analyse de la valeur des projets informatiques
Méthode du patient traceur Nice décembre 2017
Sujet de recherche MANASSE Herijaona 7 ème Année 01 AVRIL
Infections du site opératoire en chirurgie viscérale: expérience du CHU de Marrakech, Maroc. Aarab. M, Bennis.I Narjis.Y, Rabbani.K, Louzi.A, Benelkhaiat.R,
Mise en place d’un Plan de Gestion des Données au GANIL
INTELLIGENCE ARTIFICIELLE
LES RÉCIDIVES LOCORÉGIONALES DU CANCER DU RECTUM OPÉRÉ A VISÉE CURATIVE Dr kerroum Youssef; Dr Anas Ahallat; Pr Mejbar;Pr Sebbah;Pr Hrora; Pr Ahallat;
Organisation de la soutenance (diapositive à effacer par la suite)
Retour d’expérience Solutions organisationnelles
Congrès National de Chirurgie 2019
PAF Guillaume Martin - Fabrice Cizeron - Xavier Roulot
1 L’odontologie est la science médicale relative aux dents, à leurs maladies et aux traitements de celles-ci. Préface.
Gwenaël Le Moal Service de Maladies infectieuses CHU Poitiers
Transcription de la présentation:

« Data Scientist » (Ingénieur, PhD) chez HEVA Ouvrons la boîte à outils du Data Scientist pour analyser les données du SNDS Martin PRODEL « Data Scientist » (Ingénieur, PhD) chez HEVA Meetup SNDS #3 (19 sept. 2019)

Intelligence Artificielle Différents Concepts Data ScIENCE Intelligence Artificielle Big Data ? Sur les banc de l’école ou la fiche de poste Le maxi buzz word SNDS, what else ? Machine Learning Data Mining DEEP LEARNING La philosophie Boîte à outils n° 1 Boîte à outils n° 2 → ma préférée

La mise en pratique du Machine Learning Profilage de patients avec la Classification Les parcours de traitements avec le Clustering lundi 2 décembre 2019

Mise en œuvre de 2 approches sur un cas d’étude : données SNIIRAM ≈ 96 500 PV.VIH* en 2013 dont 3 373 incidents Suivi 2 ans afin de détecter leurs délivrances d’antirétroviraux (ART) : Monothérapie / bithérapie / trithérapie Rétrospective de 5 ans pour étudier les comorbidités et suivi 1 an pour étudier les coûts recours aux soins  Question : présence de sous-profils atypiques au regard des coûts ?  Question : présence de trajectoires de soins types, de switch dans les traitements, durées sous traitements ? lundi 2 décembre 2019 * PVVIH : personne vivant avec le VIH

Question 1 : utilisons un algorithme de Machine Learning qui ... Sélectionne automatiquement les variables PERTINENTES PARMI les dizaines DISPONIBLES POUR créer autant de profils patients que besoin EN FONCTION D’UN OBJECTIF PRÉCIS Expliquer le coût (Ou encore mesurer des risques : ré-hospitalisations ou complications) PRÉSENCE D'INFECTIONS NON CLASSANTES VIH NON N = 26 706 1 540 € / p PRÉSENCE D’UNE INFECTION BACTÉRIENNE NON N = 25 369 1 420 € / p DOSES REÇUES ENTRE 5 ET 10 NON N = 21 980 1 280 € / p OUI N = 3 389 140 € / p OUI N = 1 337 3 680 € / p PRÉSENCE D’UN CANCER NON N = 1 170 4 540 € / p OUI N = 167 9 510 € / p OUI N = 21 920 8 688 € / p PRÉSENCE D’UNE COMMORBIDITÉ ENDOCRINO-METABOLIQUE OUI N = 19 078 2 388 € / p NON N = 2 842 6 300 € / p Nombre de doses reçues Diagnostics EXEMPLE D’UN PROFIL PATIENT Présence d’infections non classables VIH Présence d’une comorbidité endocrino-metabolique Genre Présence d’un cancer Âge de la maladie Âge du patient Coûts Date

Exemple de 3 patients vectorisés Question 2 : analyser les parcours thérapeutiques But : Comprendre les enchainement possibles des traitements chez les patients d’une cohorte (les incidents) dans les 2 après leur inclusion Pour l’ensemble la cohorte En ayant une vision temporelle précise De manière lisible Evènements repérables dans le SNDS : Délivrances des traitements du VIH Méthodologie : utiliser la technique de Machine Learning « TAK*» Modélisation vectorielle de chaque patient et son parcours Recherche d’enchaînements communs et clustering de trajectoires similaires Rendu graphique complet grâce au TAK * Time sequence Analysis through K-clustering, by HEVA. Années de suivi Exemple de 3 patients vectorisés lundi 2 décembre 2019

Solutions possibles : « TraMineR » « Sankey Diagram » 1. Exhaustif traitement 2nd traitement 3ème traitement 4ème traitement Médicament A Médicament B Hors du suivi Non traité 1. Exhaustif 2. Manque de précision dans la temporalité 3. Manque de lisibilité 1. Seuls 34% de la cohorte sont représentés 2. Précis sur la temporalité 3. Lisible lundi 2 décembre 2019

Autre solution Le graphe « soleil » C B A D 1. Exhaustif, enchaînements clairs 2. Imprécis sur la temporalité 3. Lisible et compact B A De plus, des patients différents dans le même bloc (ex : A) D INCIDENTS inclusion 2 ans de suivi 50% lundi 2 décembre 2019

TAK Time sequence Analysis through K-clustering by HEVA * Les 816 patients incluent à la fois les patients du groupe A issus du sunburst et les patients décédés du groupe D du sunburst.

TAK : La technique 1 2 3 Patients non ordonnés Modélisation vectorielle Discrétisation du temps 1 Patients non ordonnés Technique : Hierarchical Agglomerative Clustering → Machine Learning 2 Patients ordonnés selon leur similarités Dégage les tendances Technique : ModeFilter → Image processing 3 Image lissée Améliore la lisibilité lundi 2 décembre 2019

Le retour d’expérience d’un data scientist SNDS Conclusion Le retour d’expérience d’un data scientist SNDS Très important : poser une question d’étude précise Les données sont là : SNDS La technologie « Machine Learning » est disponible pour tous → Les outils sont là, il manque le data scientist (l’orfèvre des temps modernes) → Plus de monde = plus de publications = démocratisation La technologie seule ne vaut rien → comité scientifique et médical lundi 2 décembre 2019

Merci de votre attention Des questions ? https://hevaweb.com Tak : merci (Danois) Tack : merci (Suédois) Takk : merci (Norvégien) Tusen takk : Milles mercis (Norvégien)