Université Badji Mokhtar Annaba-Algérie- Département d’Informatique Une remémoration bayésienne d’un RàPC pour l’aide au diagnostic médical Mme DJEBBAR-ZAIDI Akila R2I’ 2011 12-14 Juin Université de TIZI OUZOU -Algérie-
Plan de présentation Introduction générale Le Raisonnement à Partir de Cas (RàPC) La remémoration Les réseaux bayésiens La structure de la base de cas La phase de remémoration proposée Conclusion et perspectives. R2I’ 2011 12-14 Juin Université de TIZI OUZOU -Algérie- DJEBBAR Akila
Introduction L’un des buts principaux de l’intelligence artificielle (IA) est de concevoir des systèmes capable de reproduire le raisonnement humain. Depuis plus de quinze ans, l’IA se multiplie en médecine comme dans d'autres domaines des sciences et des techniques. L’une des approches de l’IA: le RàPC est une approche de résolotion de problèmes basée sur la réutilisation par analogie d’expériences passées appelées cas. R2I’ 2011 12-14 Juin Université de TIZI OUZOU -Algérie- DJEBBAR Akila
Cadre du travail Modélisation des connaissances appliqué au domaine médical. Concevoir une remémoration bayésienne pour améliorer des problèmes d’aide au diagnostic avec données complètes, en essayant de mettre à la disposition des médecins un outil de raisonnement informatique permettant d’améliorer ses décisions. R2I’ 2011 12-14 Juin Université de TIZI OUZOU -Algérie- DJEBBAR Akila
Objectifs Construire une structure de base de cas à l’aide de Réseau bayésien pour l’aide au diagnostic des pathologies hépatiques. Améliorer la performance du RàPC: Permettre une remémoration efficace. - La structure de la base de cas - Le choix de la mesure de similarité Obtenir un bon diagnostic au patient. R2I’ 2011 12-14 Juin Université de TIZI OUZOU -Algérie- DJEBBAR Akila
Raisonnement à Partir de Cas Le raisonnement par cas (RàPC) est une approche de résolution de problèmes basée sur la réutilisation par analogie d’expériences passées appelées cas . Un nouveau problème est résolu en trouvant un ancien cas similaire, et en le réutilisant dans une nouvelle situation. Le CBR est aussi une approche de l’apprentissage incrémental : chaque nouvelle expérience (réussite ou échec) est retenue pour les problèmes futures. Le CBR favorise l’apprentissage par expérience. Un cas : c’est une paire (Problème, Solution) R2I’ 2011 12-14 Juin Université de TIZI OUZOU -Algérie- DJEBBAR Akila
La remémoration en RàPC Cette phase consiste à rechercher dans la base de cas le ou les cas sources les plus proches à partir de la description de la partie problème du cas cible, qui vont être utilisés pour le résoudre. Cette phase est basée uniquement sur des mesures de similarité. R2I’ 2011 12-14 Juin Université de TIZI OUZOU -Algérie- DJEBBAR Akila
Incertitude dans le domaine médicale Les informations utilisées dans le raisonnement du médecin pour prendre des décision sont potentiellement entachées d'incertitude. Cette incertitude est d'origine multiple vu qu’il y a: Possibilité d'erreur dans les données Ambiguïté de la représentation de l'information Incertitude sur les relations entre les diverses informations Imposer dans ce contexte d’incertitude la théorie des probabilités R2I’ 2011 12-14 Juin Université de TIZI OUZOU -Algérie- DJEBBAR Akila
Description du problème du diagnostic Le processus de diagnostic est une identification d’une maladie par ses symptômes il part d’un: Pour confirmer ses hypothèse Il reste toujours une incertitude c’est qu’à travers l’examen radiologique Ensemble de données interrogatoire ou observées Examen clinique Examen biologique Imagerie médicale Diagnostic R2I’ 2011 12-14 Juin Université de TIZI OUZOU -Algérie- DJEBBAR Akila
Méthode symbolique et numérique Les Réseaux Bayésiens Definition: Les réseaux bayésiens sont la combinaison des approches probabilistes et la théorie de graphes. Autrement dit, ce sont des modèles qui permettent de représenter des situations de raisonnement probabiliste à partir de connaissances incertaines. Structure Graphe orienté acyclique (DAG, Directed Acyclic Graph). Nœuds : ensemble de variables aléatoires (discrete ou continue). Arcs orientés: des dépendances (causalités) probabilistes entre les variables et des distributions de probabilités conditionnelles pour chaque variable étant donné ses parents. une table de probabilité pour chaque nœud. V F A Méthode symbolique et numérique A=v A=f c=v c=f B C R2I’ 2011 12-14 Juin Université de TIZI OUZOU -Algérie- DJEBBAR Akila
Caractéristiques des RB C’est une méthode statistique. Basé sur les probabilités conditionnelles. Exclure de l’information non pertinente du diagramme d’influence. La causalité joue un rôle important : des événements causent d’autres. Afficher graphiquement les variables d'un problème de décision et les influences entre ces variables. Basé sur le principe de théorème de Bayes. R2I’ 2011 12-14 Juin Université de TIZI OUZOU -Algérie- DJEBBAR Akila
Une remémoration bayésienne Réseau Bayésien CBR Modélisent les connaissances Incertaines Décrivent hiérarchiquement toutes les étapes du raisonnement du médecin Ressemble à la manière de raisonnement du médecin Se base sur des cas passées Une approche identifiée et bien établie pour construire les systèmes médicaux. Une remémoration bayésienne R2I’ 2011 12-14 Juin Université de TIZI OUZOU -Algérie- DJEBBAR Akila
La structure de la base de cas La base de cas est répartie en quatre niveaux: 1. Niveau clinique 2. Niveau biologique 3. Niveau imagerie médicale 4. Niveau diagnostic et thérapie Problème-cas Solution-cas R2I’ 2011 12-14 Juin Université de TIZI OUZOU -Algérie- DJEBBAR Akila
La structure de la base de cas Niveau Clinique ………. Niveau Biologique ………. Problème-Cas Attributs de l’image Echographique du foie ………. Niveau Imagerie Médicale ………. Attributs de l’image Scanographique du foie Solution-Cas Niveau Diagnostic et Thérapie ………. R2I’ 2011 12-14 Juin Université de TIZI OUZOU -Algérie- DJEBBAR Akila
Exemple de réseau Bayésien avec deux maladies du foie R2I’ 2011 12-14 Juin Université de TIZI OUZOU -Algérie- DJEBBAR Akila
Description d’un cas du système RàPC Partie Clinique: Douleur=1 Ictère=0 Tabac=1 Partie Biologique: ……… Imagerie médicale Attributs de l’image échographique: Taille=.. Homogéniété=.. Attributs de l’image scanographique: Densité=.. Angle Aigu=.. Solution (diagnostic-Thérapie): Cirrhose-Fonction Biopsie du foie R2I’ 2011 12-14 Juin Université de TIZI OUZOU -Algérie- DJEBBAR Akila
La phase de remémoration proposée Il s’effectue à chaque niveau de réseau jusqu’à le niveau inferieur (fils) par un passage de message π qui permet à entrainer pour chaque variable une mise à jour de sa probabilité π (x)= λi p(x) Ce processus permet d’initialiser les variables du réseau et d’attribuer à chaque niveau i un poid λi. Elle s’effectue selon l’évaluation de la ressemblance entre le nouveau cas et les cas déjà connus dans la base par la mesure de similarité proposée Initialisation Propagation (Extension Pearl) Recherche R2I’ 2011 12-14 Juin Université de TIZI OUZOU -Algérie- DJEBBAR Akila
Extension Algorithme de Pearl(Message Passing) Étape de propagation Le principe de cet algorithme est simple, il fonctionne comme suit : Initialisation les probabilités des variables du réseau. Faire passer le message π entre les variables du réseau. Chaque variable reçoit le message doit envoyer le message π qui porte la probabilité du parent vers son fils. Le premier niveau calcule ses probabilité par la formule suivante : À la réception de message π les récepteurs de la 2ieme et 3ième niveau mettent à jour ses probabilité puis ils recalcule le message π pour obtenir la probabilité actuelle par la formule suivante : Pour les variable du4ième niveau il n’y a pas de message π à envoyer, ils mettent à jour ses probabilité à la lumière du message reçus. π (x)= λi p(x) π (X=x)=∑ z λi P (X=x\Z=z) π x (Z=z) R2I’ 2011 12-14 Juin Université de TIZI OUZOU -Algérie- DJEBBAR Akila
Algorithme de Pearl(Message Passing) La probabilité de X sachant ses parents Message venant de Z à son fils X Le poids du niveau i Algorithme de Pearl(Message Passing) Calcul de la probabilité actuelle P (X=x) = π (X= x)= ∑z λi P (X= x\ Z= z) πx (Z= z) Construction de liste des fils Diffuser un message π contenant la probabilité calculée à tous les fils Les fils recalculent ses nouvelles probabilités à la lumière de message reçu R2I’ 2011 12-14 Juin Université de TIZI OUZOU -Algérie- DJEBBAR Akila
Activation du réseau B C A G F D E Calcul de π (A) Calcul de π (B) Calcul de π (C) Activation du réseau B C A G F D E E recalcule sa probabilité D recalcule sa probabilité F recalcule sa probabilité G recalcule sa probabilité R2I’ 2011 12-14 Juin Université de TIZI OUZOU -Algérie- DJEBBAR Akila
Discussion : le choix de l’algorithme de Pearl ? Notre modèle graphique est simple classé comme un polyarbres avec plusieurs racine. Raisonnement avec données complètes d’où le principe de l’inférence exacte de Pearl. Algorithme de Pearl est un algorithme exact qui permet de parcourir touts l’espace de recherche de notre graphe. La simplicité du calcul de la loi marginale d’une variable ou de sa loi conditionnelle relativement à un ensemble d’observations. R2I’ 2011 12-14 Juin Université de TIZI OUZOU -Algérie- DJEBBAR Akila
argmax (∑λi log P(D=d|S)) La mesure de similarité proposée (1/2) Le point d’Arrêt de l’étape de propagation représente le point de départ pour l’étape de recherche qui va nous fournir le résultat final du diagnostic. On cherche au dernier niveau la maladie ayant la probabilité maximale sachant les observation(les entrées). Le principe de la phase de remémoration est une combinaison log-linéaire de plusieurs probabilités P(D|S) pondérées par des poids. Le facteur de pondération λi est utile pour introduire le maître symptôme de chaque niveau. Elle cherche à maximiser l’expression suivante D : le diagnostic associé au cas le plus similaire. λi : le poids du niveau i. S : les symptômes. argmax (∑λi log P(D=d|S)) R2I’ 2011 12-14 Juin Université de TIZI OUZOU -Algérie- DJEBBAR Akila
argmax (∑λi log P(D=d|S)) La mesure de similarité proposée (2/2) Recherche argmax (∑λi log P(D=d|S)) Nouveau cas Le cas le plus similaire Λ1 log p(x) Λ2 log p(S|x) Λn log p(D|S) R2I’ 2011 12-14 Juin Université de TIZI OUZOU -Algérie- DJEBBAR Akila
L’algorithme de recherche proposé Début Entrée : BN λi : le poids du niveau i ; i : le num du niveau j : le num du symptôme n : le nombre de niveaux du BN m : le nombre de nœuds actifs par niveau i Nouveau cas (ensemble de symptômes S) Sortie : solution source : max (Som i) Pour i allant de 1 à N Faire Pour j allant de 1 à M Faire Propagation des nœuds symptômes S ; Som i := Som i + λi log P(D=d|S) ; Fin; D:=argmax (Somi); // D est le diagnostic associé au cas le plus similaire. Fin. R2I’ 2011 12-14 Juin Université de TIZI OUZOU -Algérie- DJEBBAR Akila
Conclusion Notre travail s’inscrit dans le cadre de la modélisation des de connaissances appliquée à l’aide au diagnostic des pathologies hépatiques. Nous avons présenté une modélisation statistique de la phase de remémoration d’un RàPC dans le but d’aide au diagnostic, en mettant l’accent sur le formalisme des réseaux Bayésiens Un modèle statistique de recherche en se basant sur le modèle Log linéaire comme une mesure de similarité afin de permettre une remémoration efficace ce qui fournit un diagnostic plus précis. R2I’ 2011 12-14 Juin Université de TIZI OUZOU -Algérie- DJEBBAR Akila
Perspectives Validation du modèle proposé, il sera nécessaire de mettre en place une expérimentation médicale complète et de confronter notre modélisation à une situation réelle. Etablir une étude comparative par rapport à d’autres modèles. R2I’ 2011 12-14 Juin Université de TIZI OUZOU -Algérie- DJEBBAR Akila
Merci de votre attention