Laurent JEANPIERRE Equipe MAIA

Slides:



Advertisements
Présentations similaires
F. Bataille CEA, Service Hospitalier Frédéric Joliot, Orsay, France
Advertisements

Non linéarités liées à la thermique
Eléments de Génie Logiciel
Baptiste ARNAULT, Manel ZERELLI, Thierry SORIANO
AFRISTAT, outil dappui au développement de la statistique en Afrique subsaharienne Par Martin BALEPA, Directeur Général Adjoint dAFRISTAT.
Constitution de produits terminologiques à partir de corpus
Jean-Louis Foulley, Christèle Robert* INRA-Génétique animale, SGQA Jouy-en-Josas; *SAGA Castanet Tolosan Journées didactiques INRIA « Modèles.
Eugen Dedu SUPÉLEC, PRiSM UVSQ le 8 mars 2002
Urbanisation des Systèmes d'Information - Henry Boccon-Gibod 1 Urbanisation des SI Alignement Stratégique et optimisation dun Système dInformation.
C1 Bio-statistiques F. KOHLER
Inférence statistique
Aspects cognitifs de la gestion d’environnements dynamiques
Application de réseaux bayésiens à la détection de fumées polluantes
Les TESTS STATISTIQUES
3. Analyse et estimation du mouvement dans la vidéo
Piecewise Affine Registration of Biological Images
Serge Abiteboul, Grégory Cobena, Benjamin Nguyen, Antonella Poggi
Modélisation des systèmes non linéaires par des SIFs
Conscience artificielle
Les Ateliers de Génie Logiciel
                                        République Algérienne Démocratique et Populaire Ministère de l’Enseignement Supérieur et de la Recherche Scientifique.
Ametsa : un système de contrôle de l’environnement domestique générique fondé sur UPnP ENST-Bretagne.
Laboratoire LCOMS Equipe « Evaluation de Performance et Systèmes d’Aide à la Personne » (EPSAP) Guy Bourhis CENRob 4-5 avril.
Le filtrage au cours des âges Du filtre de Kalman au filtrage particulaire André Monin.
MRP, MRP II, ERP : Finalités et particularités de chacun.
Clément Boussard, Nicolas Hautière, Dominique Gruyer
Assemblée Générale Swisco
Introduction au Génie Logiciel
Application des algorithmes génétiques
Réalisateur : PHAM TRONG TÔN Tuteur : Dr. NGUYEN DINH THUC
MAINTENANCE INDUSTRIELLE
Décodage des informations
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Outils danalyse statistiques « programmation par lexemple » S. Canu,
Le périmètre diane circé été 2002.
Cours Corporate finance Eléments de théorie du portefeuille Le Medaf
Groupe 1: Classes de même intervalle
Grégory Maclair 5 décembre 2008 Laboratoire dImagerie Moléculaire et Fonctionnelle (IMF) – CNRS-UMR 5231 Laboratoire Bordelais de Recherche en Informatique.
Diagnostic des Systèmes à Evénements Discrets
Maîtrise des risques et sûreté de fonctionnement – Avignon – 6-10 Octobre 2008 Modélisation des dysfonctionnements dun système dans le cadre dactivités.
Notion de défaut Événement qui modifie fonctionnement procédé de sorte que performances dégradées ou objectif pas atteint Exemples Dérive de capteur Fuite.
Étude expérimentale de la robustesse d’une commande prédictive d’un procédé de cuisson sous infrarouge de peintures en poudre Bruno da Silva, Isabelle.
STAF 2X XSL/FO Glaus & Ruckstuhl Mars © Glaus & Ruckstuhl TECFA Programme du 18 et 19 mars Revision XML Introduction à XSL/FO (intérêts et.
Câblage LHC ST-EL This presentation will probably involve audience discussion, which will create action items. Use PowerPoint to keep track of these action.
Vincent Thomas Christine Bourjot Vincent Chevrier
ADAMOS Une plate-forme pour concevoir et évaluer des services proactifs Système proactif ? qui évolue en fonction des paramètres de lenvironnement physique.
Mise en oeuvre des MMCs L'utilisation des MMCs en reconnaissance des formes s'effectue en trois étapes : définition de la topologie de la chaîne de Markov,
Service de la protection de lenvironnement CANTON DU VALAIS – DEPARTEMENT DES TRANSPORTS, DE LEQUIPEMENT ET DE LENVIRONNEMENT DTEE Perspectives.
Extraction Automatique de formes complexes : Application à la création de modèle anatomique de la tête J. Piovano, T. Papadopoulo Séminaire Odyssee 9,
Sensibilisation a la modelisation
I MAGIS est un projet commun CNRS - INPG - INRIA - UJF iMAGIS-GRAVIR / IMAG Optimisation à base de flot de graphe pour l'acquisition d'informations 3D.
Soutenance de stage 16 Mai au 5 Août 2011
Soutenance de stage 16 Mai au 5 Août 2011
10 février 2006GDR ISIS Journée Localisation et Navigation Projet EGNOS-BUS (Eurêka) André Monin, Wael Suleiman LAAS-CNRS.
Module 8 : Surveillance des performances de SQL Server
Supports de formation au SQ Unifié
Le contenu est basé aux transparents du 7 ème édition de «Software Engineering» de Ian Sommerville«Software Engineering» de Ian Sommerville B.Shishedjiev.
Sureté de fonctionnement dans les WNCS
LES PRINCIPES DE LA THERMODYNAMIQUE
Approximation d’un contrôle optimal par un circuit électronique
Présentation AICHA REVEL INGENIEUR D’ÉTUDE STERIA DEPARTEMENT TRD
Décision incertaine et logistique : Grille typologique
 Experts en sécurité : Gestion du risque Enquêtes Performance humaine  R&D : Statistiques Modélisation du risque  Développeurs L'équipe.
Problématique de la thèse Comment les outils provenant du management des connaissances peuvent ils être utilisés dans le cadre de la politique d'amélioration.
Méthode des moindres carrés (1)
4ème journées PDM IA - Vendredi 7 mai 2004 Recherche en ligne pour la résolution de PDMs Laurent Péret, Frédérick Garcia INRA Toulouse, équipe Méthodes.
1 Prédiction de mobilité basée sur la classification selon le profil DAOUI Mehammed Université Mouloud Mammeri Tizi-Ouzou Rencontres sur.
Correction problème 1.
Réseaux de Petri et suivi du joueur
CandidatCédric Favre ProfesseurReymond Clavel AssistantsYves Stauffer Ludovic Righetti.
Transcription de la présentation:

Apprentissage et adaptation pour la modélisation stochastique de systèmes dynamiques réels Laurent JEANPIERRE Equipe MAIA Directeur de thèse : François Charpillet Messieurs les membres du jury, Je vais vous présenter aujourd’hui ma thèse intitulée Apprentissage et Adaptation pour la modélisation stochastique de systèmes dynamiques réels. Durant ces trois dernières années, j’ai eu le plaisir de conduire ces recherches dans l’équipe MAIA, sous la tutelle de mon directeur de thèse, François Charpillet. Avant de rentrer dans le vif du sujet, je voudrais d’abord présenter le cadre global de mon travail… 30.27 03 décembre 2002

Système dynamique Perturbations Système Réel Actions Observations Modèle informatique surveillance, contrôle, système dynamique. processus quelconque Observation Action Perturbations automatiser  modéliser, abstraction observations Actions ? 31.57 03 décembre 2002

Introduction Contributions Cadre applicatif Modèle compréhensible par des utilisateurs Apprentissage de modèle Bibliothèque logicielle Cadre applicatif DIATELIC (ALTIR) Assistance à l’anesthésie (CHU Brabois) Navigation d’un robot mobile notion générale  nombreux problèmes agent situé  localiser et agir architecture logicielle, diagnostic modèle compréhensible apprentissage diagnostic bibliothèque logicielle Approche  3 problèmes : DIATELIC, collaboration ALTIR. Anesthésie collaboration département d’anesthésie du CHU de Brabois. robot mobile. action. 34.17 03 décembre 2002

Plan de la présentation Introduction à DIATELIC Modélisation Processus statistiques Perceptions floues Modèle global Apprentissage et adaptation Conclusion et perspectives application à Diatelic. expérimentation données retour sur expérience focaliser collaboration modèle statistique perception de l’environnement. intégration apprentissage et d’adaptation Conclusion, perspectives Transition  DIATELIC 35.26 03 décembre 2002

Le projet DIATELIC Introduction 1995 – 2002 Suivi de patients Traités en DPCA Dialysés à domicile Quotidiennement Étude de l’hydratation Joue un rôle central dans la dialyse Non mesurable directement 2002 société partenariat laboratoire. Suivi insuffisance rénale chronique. DPCA  domicile Quotidien Vs Mensuel estimation hydratation Mesurable, rôle central dans la dialyse Transition  cadre global 36.49 Introduction Processus statistiques Perceptions floues Modèle global Apprentissage et adaptation Conclusion 03 décembre 2002

Le projet DIATELIC Présentation schématique Diagnostic Données Traitement Néphrologue hôpital Patient Maison Données/Mois  diagnostic  ajuster traitement cas idéal. Plein de patients médecin plus capable suivi correct.  Limite nb patients Diatelic = intermédiaire 37.43 Introduction Processus statistiques Perceptions floues Modèle global Apprentissage et adaptation Conclusion 03 décembre 2002

Le projet DIATELIC Présentation schématique Traitement Diagnostic patient  données / jour Serveur  diagnostic  alarme médecin  patients besoin Transition  Infrastructure 38.47 Données Alertes Introduction Processus statistiques Perceptions floues Modèle global Apprentissage et adaptation Conclusion 03 décembre 2002

DIATELIC Un projet d’envergure Une infrastructure conséquente Un transport de données par réseau Un serveur hébergeant le service Une base de données Des interfaces homme-machine Un appui médical Un module de diagnostic DIATELIC  nombreuses personnes et équipes de recherche MOI  diagnostic Transition  Système dynamique 39.11 Introduction Processus statistiques Perceptions floues Modèle global Apprentissage et adaptation Conclusion 03 décembre 2002

Le projet DIATELIC Surveillance d’un système dynamique Le patient, un système complexe Traitement médical Observation quotidienne Dynamique mal connue Evolution spontanée Modélisation On recherche un cas moyen  Il existe des divergences, des aléas patient = système terriblement complexe. observé fiche renseignements influencer traitement médical. MAIS dynamique mal connue + perturbations externes = bruit  modèle très simplifié, évolution moyenne  Aléas Transition  modèles stochastiques 40.12 Introduction Processus statistiques Perceptions floues Modèle global Apprentissage et adaptation Conclusion 03 décembre 2002

Processus de décision Markovien partiellement observable Un POMDP est un n-uplet {S,A,O,B,T,R} S  Ensemble fini d’états A  Ensemble fini d’actions O  Ensemble fini d’observations B  Fonction d’observation B : OxS  [0; 1] T  Loi de transition probabiliste T : SxAxS  [0; 1] R  Fonction de récompense R : SxA  Ë POMDP caractéristiques nécessaires découvrir état caché expliquer observations. État  plan  but (récompense) Diatelic = pas actions  ignore récompense Transition schéma POMDP 41.07 Introduction Processus statistiques Perceptions floues Modèle global Apprentissage et adaptation Conclusion 03 décembre 2002

Les POMDPs Obs Obs Obs Obs ensemble fini d’états. Dynamique  état évolue.  action en cours. (Unique). état haut à gauche, exécution action  changer d’état. Incertitudes  plusieurs états, avec une probabilité donnée. (modèle moyen) autre action  autre distribution non limité 1 seul état, pas surcharger qqsoit état, percevoir le système. Chaque état influence  flèches observation pas suffisante (petite partie du système) Transition  états 42.24 Obs Introduction Processus statistiques Perceptions floues Modèle global Apprentissage et adaptation Conclusion 03 décembre 2002

Ensemble fini d’états Problème de diagnostic Un état normal Des états représentant des déviations Poids-sec Hydratation Choix de modélisation : Modélisation des situations « pures » Pas de modélisation des interactions structure = finalité. diagnostic  régulation. existe état « normal ». Autour, situations alarmantes Diatelic: déviations  poids-sec + hydratation choix modéliser situations où 1 seul axes en cause. (interactions complexes, voire impossibles.) Transition  Actions 44.04 Introduction Processus statistiques Perceptions floues Modèle global Apprentissage et adaptation Conclusion 03 décembre 2002

Ensemble fini d’actions Problème de diagnostic Une action modifie l’évolution du système Une action peut être incertaine Dans DIATELIC : « Observer » Reflète notre mauvaise connaissance de l’évolution du patient Chaque état mène aux autres avec une probabilité équivalente « Modifier le poids-sec » Chaque état peut mener à tous les autres Probabilité égale pour chaque état Oublie le passé du patient actions  influencer évolution  fonction de transition  modèle suivre système. DIATELIC : problème difficile car Dynamique mal connue Beaucoup actions (medic+dialyse)  Simplifier Action principale  tous les jours, ignorer le traitement médical. Action alternative  modèle a changé, gommer passé Transition  Modèle graphique 46.04 Introduction Processus statistiques Perceptions floues Modèle global Apprentissage et adaptation Conclusion 03 décembre 2002

Évolution du patient Le modèle DIATELIC État normal Déshydratation Hyperhydratation Poids-sec trop bas 5 états. état central, 2 axes : Hydratation : déshydratation (coma)  hyperhydratation (oedèmes) Orthogonalement, poids-sec. Jaune  PS modèle < PS réel Cyan  PS modèle > PS réel Transition  Perception 47.26 Poids-sec trop haut Introduction Processus statistiques Perceptions floues Modèle global Apprentissage et adaptation Conclusion 03 décembre 2002

Les perceptions POMDP  Observations discrètes DIATELIC : Observations continues Poids Tension Tension différentielle Ultrafiltration  Adaptation nécessaire POMDP  ensemble fini de symboles discrets. Réalité  continues. Diatelic idem Transition  Discrétisation 48.03 Introduction Processus statistiques Perceptions floues Modèle global Apprentissage et adaptation Conclusion 03 décembre 2002

Discrétisation des valeurs continues Discrétisation par intervalles Effets de seuils gênants Beaucoup de paramètres Utilisation de fonctions continues Expressivité très importante Forme paramétrique fixée Peut nécessiter beaucoup de paramètres discrétisation simple  intervalles toutes valeurs équivalentes  1 symbole  effets de seuil. 1 valeur app 1 intervalle. Petite modif  autre symbole Traduire valeur en probabilité  expressivité Mais base de fonctions  Nb paramètres fini  compromis entre expressivité & paramètres collaboration  combinaison 50.25 Introduction Processus statistiques Perceptions floues Modèle global Apprentissage et adaptation Conclusion 03 décembre 2002

Probabilité du symbole Perceptions floues Peu d’intervalles Sémantique claire Complexité faible Transitions douces Pas d’effet de seuil Bonne tolérance au bruit Filtrer les observations fv(O) = P(v | O) ; vV  distribution de probabilités Fonction d’observation : B* : VxS  [0; 1] B (o,s) = ∑ B*(v, s).fv(o) vV Probabilité du symbole Valeur observée intervalles flous  intervalles larges, sémantique 1 valeur  Pls intervalles, probabilités. transition douce  pas effets de seuil Diagnostic  valeur observées Vs référence  discrétisation en 3 intervalles : trop peu, correcte, et trop. Exemple: Valeur centrale  100% moyenne. +10%  97% moyenne, 3% trop haute (CLICK) +10%  90% moyenne, 10% trop haute (CLICK Transition  Intégration 52.03 Introduction Processus statistiques Perceptions floues Modèle global Apprentissage et adaptation Conclusion 03 décembre 2002

Expression du modèle perceptif Chaque état est décrit : Par son influence sur les observations Indépendamment des autres états Les capteurs sont supposés indépendants La valeur fournie par un capteur ne dépend que de l’état du modèle Chaque capteur est décrit séparément POMDP  fonction OxS[0;1]  états indépendants + hypothèse : capteurs indépendants probabilité chaque capteur dans chaque état, INDEPENDANT. simplicité  réduire Nb paramètres (pas co-dépendance) Transition  modèle volumineux 53.33 Introduction Processus statistiques Perceptions floues Modèle global Apprentissage et adaptation Conclusion 03 décembre 2002

Quelques chiffres De nombreux paramètres : Actions x Etats² probabilités de transition DIATELIC : 50 paramètres Valeurs x Etats probabilités d’observation pour chaque capteur DIATELIC : 60 paramètres DIATELIC : 40 paramètres libres Probabilités de transition fixées Contraintes sur les probabilités Diatelic utilise 110 probas contraintes intégrité probabiliste + transitions fixées  40 probabilités d’observations. Transition  profil 54.49 Introduction Processus statistiques Perceptions floues Modèle global Apprentissage et adaptation Conclusion 03 décembre 2002

Le profil–patient Un profil–patient contient donc Son poids-sec Ses moyennes mobiles Tension artérielle Débit moyen de chaque type de poche Ses probabilités d’observation 41 paramètres à régler par patient ! Apprentissage d’un profil générique Apprentissage des variations profil = variables spécifiques poids-sec, moyennes mobiles (évaluation variations), probabilités d’observation  41 paramètres / patient !!! Aider  profil-type médecin  ajustements / patient Transition  apprentissage profil générique 55.53 Introduction Processus statistiques Perceptions floues Modèle global Apprentissage et adaptation Conclusion 03 décembre 2002

Apprentissage du profil Apprentissage d’un profil générique Algorithme de Baum & Welsh [Rabiner89] Etiquetage d’un corpus Chaque donnée est étiquetée Le modèle est défini par des statistiques Validation manuelle par les médecins Vérification de la sémantique Étude du diagnostic de cas connus corpus partiellement étiqueté  modèles intermédiaires + algorithme de Baum&Welsh modèle cohérent  validation ALTIR  Modèle complet Transition  utilisation modèle 57.09 Introduction Processus statistiques Perceptions floues Modèle global Apprentissage et adaptation Conclusion 03 décembre 2002

Calcul du diagnostic Procédure Forward [Rabiner89] Prédiction Recalage Estimation de l’état actuel Action en cours connue Projection sur l’état au temps suivant Recalage Lecture de l’observation Calcul des états compatibles Affinage de la prédiction calcul = procédure Forward (partie des algorithmes localisation ds modèles Markoviens part. Obs) programmation dynamique  Efficace. Transition  évolution attendue du système  état prédit t+1 Observation Fonction Observation  probabilité être issue chaque état. Loi de Bayes  Proba état sachant Observation Cumul  affinage L’état est lié au précédant. L’état est probable au vu de l’observation.  séquence distributions de probas. diagnostic  espace des problèmes à détecter  Diagnostic. DEMO 0 : Diagnostic !!! Décrire les axes des courbes !!! Transition  adaptation 58.10 Introduction Processus statistiques Perceptions floues Modèle global Apprentissage et adaptation Conclusion 03 décembre 2002

Adaptation à un patient En cas de désaccord du médecin A partir des données observées Spécifique à un patient Permet un meilleur diagnostic futur Avec l’aide d’un médecin Modification manuelle des paramètres Recherche automatique des paramètres Validation du modèle Désaccord  adaptation. (1 patient  améliorer diagnostic des jours futurs)  utiliser données connues du patient. Désaccord  information  meilleur modèle. médecin intervient 3 points : Directement sur les paramètres du patient En modifiant le diagnostic du système En validant le nouveau profil de ce patient. DEMO 1 : MANUEL Préciser les axes des paramètres ! Transition  Méthode automatique 60.55  16H00, 55 Introduction Processus statistiques Perceptions floues Modèle global Apprentissage et adaptation Conclusion 03 décembre 2002

Adaptation : un problème difficile Les conditions théoriques optimales Chaque état est visité Un grand nombre de fois De façon représentative La réalité Le patient évolue  Peu de données Les pathologies sont rares  Tous les états ne sont pas visités Adaptation = problème difficile. Médecine en particulier,  loin conditions optimales algorithmes standards difficilement applicables. En effet, DEMO 2 : Baum&Welsh !!! Parler Pb de saturation !!! Transition  Apprentissage de Diagnostic 02.50 Introduction Processus statistiques Perceptions floues Modèle global Apprentissage et adaptation Conclusion 03 décembre 2002

Descente de gradient Minimise une distance entre Le diagnostic calculé Le diagnostic corrigé Maximise la robustesse Probabilité des observations connaissant le modèle Critère de Baum & Welsh  Fonction complexe Optimisation sans dérivées Paramètres bornés apprentissage = optimisation; + connus  descente de gradient. en effet, fonctions générales minimiser distance entre le diagnostic calculé par le système, et celui proposé par un expert. Diatelic : fonction à minimiser = compromis entre la distance au diagnostic et le proba (Obs | modèle) objectif  empêcher choix paramètres cohérents avec diagnostic demandé, mais peu probable.  fonction compliquée + paramètres bornés  descente par encadrements. Transition  Démo 3 64.27 Introduction Processus statistiques Perceptions floues Modèle global Apprentissage et adaptation Conclusion 03 décembre 2002

Descente de gradient en action DEMO 3 !!! Parler de la post-interprétation !!! Transition  Conclusion 07.11 Introduction Processus statistiques Perceptions floues Modèle global Apprentissage et adaptation Conclusion 03 décembre 2002

Une architecture générique Applications Perceptions Actions But recherché Environnement Localisation Navigation en robotique Infrarouges Sonars Caméra Avancer Reculer Tourner Atteindre une position donnée Position sur une carte DIATELIC Poids Tension Ultrafiltration Dialyse Médicaments Régime Maintenir une hydratation correcte Hydratation Poids-sec Assistance à l’anesthésie EEG ECG EMG Injecter Analgésiques Hypnotiques Curarisants Maintenir un niveau de sommeil optimal Profondeur de sommeil de l’analgésie Présentation  DIATELIC 2 autres  recul, généraliser  bibliothèque générique. Chaque projet  contraintes  enrichir le modèle. navigation  plusieurs milliers d’états, MAIS expérimenter librement planification. anesthésie  aspect temporel. Seul Pb temps-réel. 1 donnée médicale / 5 secondes, ( 24H pour Diatelic, et au choix pour le robot ) Transition  Perspectives 09.42 Introduction Processus statistiques Perceptions floues Modèle global Apprentissage et adaptation Conclusion 03 décembre 2002

Conclusion Une architecture logicielle Adaptée au diagnostic Basée sur l’observation Valeurs discrètes Valeurs continues Facilitant l’interaction avec un expert Expression du diagnostic Expression du modèle Correction du diagnostic IA hors laboratoire  possible, et intéressant d’un point de vue scientifique proposé architecture logicielle (flux d’observations).  adaptée diagnostic, mais pas limitée à ces derniers. modèle bien choisi  Collaboration simple avec expert (Sémantique états + Perceptions) algorithmes d’apprentissage  modifier par le but  compréhension non nécessaire. Transition  généricité 68.16 Introduction Processus statistiques Perceptions floues Modèle global Apprentissage et adaptation Conclusion 03 décembre 2002

Perspectives Planification Adaptation par prédiction Recommandation d’action Boucle fermée (à long terme) Adaptation par prédiction Remplacer l’expert humain Utiliser une prédiction de l’observation comme contrôle Intégrer récompense  but  recommandation (Médical = long terme); Adaptation proposée  intervention active pour correction. Certains domaines  impossible. Exemple: Anesthésie, laps de temps entre 2 données  Anesthésiste peut pas modifier + apprentissage. navigation  trop d’états  humain peut pas ajuster les probas.  Adaptation par prédiction & validation  Pb de prédiction  révision de la dynamique du modèle Transition  Autres perspectives 11.04 Introduction Processus statistiques Perceptions floues Modèle global Apprentissage et adaptation Conclusion 03 décembre 2002

Perspectives Aspects continus Actions Etats Paramétriques Effet durable Etats Gradient de sévérité Dynamique du processus meilleurs aspects continus  primordiale. Anesthésie  actions continues, (intensité + durée) Etats continus  gain : déviations standard  graduel meilleure dynamique du système Ces quelques perspectives terminent donc ma présentation. Je suis bien sûr prêt à répondre à répondre à vos questions… 12.54 Introduction Processus statistiques Perceptions floues Modèle global Apprentissage et adaptation Conclusion 03 décembre 2002

Réduction grâce au Simplex Transition à partir d’un état : Somme des probabilités = 1  1 paramètre déductible des autres  seulement 40 probabilités de transition Observation d’un capteur : Les valeurs sont exclusives Chaque capteur est observé  somme des probabilités = 1  seulement 40 probabilités d’observation Introduction Processus statistiques Perceptions floues Modèle global Apprentissage et adaptation Conclusion 03 décembre 2002