IFT 615 Intelligence Artificielle

Slides:



Advertisements
Présentations similaires
L’échantillonnage & Ses Fluctuations
Advertisements

Algorithmes et structures de données avancés
Classification et prédiction
Classification et prédiction
Champs de Markov en Vision par Ordinateur
RECONNAISSANCE DE FORMES
GEF 435 Principes des systèmes d’exploitation
Collecte de données F. Kohler.
Inférence statistique
Nombre de sujets nécessaires en recherche clinique
1 10 Oct 2008 Garantie de production du terme source.
Application de réseaux bayésiens à la détection de fumées polluantes
Échantillonnage-Estimation
Système formel Nous avons introduit : signes de variables (x, y, z, …), de constantes (0, 1), d’opérations (+, ), de relations (=, ) Axiomes : ce sont.
Les tests d’hypothèses
Probabilités et statistiques en première S, ES, L
Estimation de la survie comparaison des courbes de survie FRT C3.
Résumé cours précédent
IFT 615 – Intelligence artificielle Raisonnement probabiliste
Froduald Kabanza Département d’informatique Université de Sherbrooke
Exemple Dans une ville, 55% des travailleurs ont un revenu supérieur à $. Si un individu de cette ville possède un revenu supérieur à $, la.
Application des algorithmes génétiques
Les lois des probabilités
Décodage des informations
Nombre de sujets nécessaires en recherche clinique
Méthode des k plus proches voisins
Incertitude, risque et apprentissage
Théorie des graphes Un peu de vocabulaire.
Comprendre la variation
Unite 2 Qui suis je?.
Bases de données lexicales
DEA Perception et Traitement de l’Information
Gestion de Fichiers Arbres B.
LES ARBRES IUP 2 Génie Informatique
IFT 615 Intelligence Artificielle
IFT 616 Intelligence Artificielle
IFT 616 Intelligence Artificielle
Froduald Kabanza Département d’informatique Université de Sherbrooke
Courbes de Bézier.
Prédiction multi-step de la volatilité : le modèle ARIMA-GARCH appliqué aux séries temporelles d’affaiblissement par la pluie sur les liaisons Terre-Satellite.
Révisions - IA Généralité: problèmes de lIA Recherche Logique Traitement de lincertitude Apprentissage Langue naturelle.
Relations et fonctions
Dépannage du 12 mars 2007.
Algorithmes probabilistes
Mise en oeuvre des MMCs L'utilisation des MMCs en reconnaissance des formes s'effectue en trois étapes : définition de la topologie de la chaîne de Markov,
Partie II Sémantique.
Intelligence artificielle IFT615 Logique du premier ordre
Réseaux bayésiens Chap. 14 Sections 1 – 3.
Méthodes de prévision (STT-3220)
ASI 3 Méthodes numériques pour l’ingénieur
Réseaux bayésiens: Inférence
GOL503 Spécificités sectorielles
D.E ZEGOUR Ecole Supérieure d’Informatique
Amélioration de la simulation stochastique
Présentation du marché obligataire
IFT 615 – Intelligence artificielle Réseaux bayésiens
Froduald Kabanza Département d’informatique Université de Sherbrooke
Intervalles de confiance pour des proportions L’inférence statistique
Exploration systématique de graphes
Recherche de motifs par projections aléatoires
CHAPITRE 3. Acquisition d’information et révision des croyances
Relations et fonctions
Chapitre 4 Variables aléatoires discrètes
Chapitre 7 Les équations différentielles d’ordre 1
Méthodes de prévision (STT-3220)
Graphisme par ordinateur
Concepts avancés en mathématiques et informatique appliquées
Scénario Quatre hipsters entrent en collision un dans l'autre dans un ascenseur plein de personnes. En conséquence ils laissent tomber leurs téléphones.
C9-1 Modèles décisionnels en gestion Introduction Les modèles linéaires La résolution des modèles linéaires continus La programmation linéaire en nombres.
Processus ponctuels Caractéristiques et Modèles de répartitions spatiales.
Transcription de la présentation:

IFT 615 Intelligence Artificielle Jean-François Landry Département d’informatique Université de Sherbrooke Réseaux bayésiens http://planiart.usherbrooke.ca/~jflandry/ift615/

Sujets couverts C’est quoi un réseau bayésien (RB) ? Structure d’un RB Signification Indépendance conditionnelle dans un RB. Inférence dans un réseau bayésien Inférence exacte Inférence approximative Diagrammes d’influence IFT615

Réseaux bayésiens Les RB sont un mariage entre la théorie des graphes et la théorie des probabilités. Un RB représente les connaissances probabilistes à partir d’une situation donnée : Par exemple, les connaissances cliniques d’un médecin sur des liens de causalité entre maladies et symptômes. Les RB sont utiles pour modéliser des connaissances d’un système expert ou d’un système de support à la décision, dans une situation pour laquelle : La causalité joue un rôle important : des événements causent d’autres. Notre compréhension de la causalité des événements est incomplète : on doit recourir aux probabilités. IFT615

Syntaxe Un RB est un graphe orienté, acyclique, dont les nœuds sont des variables (le plus souvent aléatoires) et les arcs représentent des dépendances (causalités) probabilistes entre les variables et des distributions de probabilités conditionnelles (locales) pour chaque variable étant donné ses parents. IFT615

Exemple Considérons la situation suivante : Je suis au travail. Mes voisins Marie et Jean m’ont promis de m’appeler chaque fois que mon alarme sonne. Mon voisin Jean m’appelle pour me dire que mon alarme sonne. Parfois il confond l’alarme avec la sonnerie du téléphone. Par contre ma voisine Marie ne m’appelle pas. Parfois elle met la musique trop fort. Parfois mon alarme se met à sonner lorsqu’il y a de légers séismes. Comment conclure qu’il y a un cambriolage chez moi ? On peut représenter cette situation par un RB. IFT615

Exemple Variables aléatoires : Cambriolage Séisme Alarme Jean appelle Marie appelle. Cambriolage Séisme Alarme MarieAppelle JeanApelle IFT615

Exemple La topologie du RB modélise la connaissance causale. Un arc d’un nœud X vers un nœud Y signifie que la variable X influence la variable Y. Un cambriolage peut déclencher l’alarme. Un séisme aussi. L’alarme peut inciter Jean à appeler. Idem pour Marie à appeler. Pour chaque nœud, une table de probabilité conditionnelle (TPC) donne la probabilité pour chaque valeur du nœud étant donné les combinaisons des valeurs des parents du nœud. P(C) .001 P(S) .002 Cambriolage Séisme C S P(A|C,S) T T .95 T F .94 F T .29 F F .001 Alarme MarieAppelle JeanApelle A P(M|A) T .70 F .01 A P(J|A) T .90 F .05 IFT615

Définitions S’il y a un arc d’un nœud X vers un nœud Y, cela signifie que la variable X influence la variable Y. X est appelé le parent de Y. Parents(X) est l’ensemble des parents de X. Si X n’a pas de parents, sa distribution de probabilités est dite inconditionnelle ou à priori. Si X a des parents, sa distribution de probabilités est dite conditionnelle (par rapport aux parents) ou à postériori. Si X est une variable observée, ont dit que c’est une évidence. Cambriolage Séisme Alarme JeanApelle MarieAppelle C S P(A|C,S) T T .95 T F .94 F T .29 F F .001 A P(J|A) T .90 F .05 A P(M|A) T .70 F .01 P(C) .001 P(S) .002 IFT615

Sémantique Un RB est une façon compacte de représenter des probabilités conjointes. Par définition, la probabilité conjointe de X1 et X2 est la probabilité d’avoir X1 et X2 : P(X1,X2). La probabilité conditionnelle de X1 sachant X2 est notée P(X1| X2). P(X1,X2) = P(X1 | X2)P(X2) Soit X = {X1, …, Xn}, l’ensemble des variables d’un RB : P(X1, …, Xn) = i = 1 P (Xi | Parents(Xi)) En d’autres mots, la distribution conjointe des variables d’un RB est définie comme étant le produit des distributions conditionnelles (locales). Seules comptent les probabilités de chaque variable connaissant ses parents, pour calculer la distribution conjointe. n IFT615

Sémantique En fait, quelque soit un ensemble de variables X = {X1, …, Xn}, par définition : P(X1, …, Xn) = P(Xn | Xn-1, …, X1)P(Xn-1, …, X1) = P(Xn | Xn-1, …, X1) P(Xn-1 | Xn-2, …, X1) … P(X2|X1)P(X1) = i = 1 P (Xi | Xi-1, …, X1) Pour un RB : P(X1, …, Xn) =Π i = 1 P (Xi | Parents(Xi)) Ceci est cohérent avec l’assertion précédente pour autant que Parents(Xi) soit un sous-ensemble de {Xi-1, …, X1}. Cette condition est satisfaite en étiquetant les nœuds du RB dans un ordre cohérent avec la relation d’ordre partielle implicite dans la topologie du RB. n n IFT615

Exemple P(j,m,a,¬c, ¬ s) = P(j|a) P(m|a) P(a| ¬ c, ¬ s) P(¬ c) P(¬ s) Cambriolage Séisme Alarme JeanApelle MarieAppelle C S P(A|C,S) T T .95 T F .94 F T .29 F F .001 A P(J|A) T .90 F .05 A P(M|A) T .70 F .01 P(C) .001 P(S) .002 P(X1, … ,Xn) =  i = 1 P (Xi | Parents(Xi)) P(j,m,a,¬c, ¬ s) = P(j|a) P(m|a) P(a| ¬ c, ¬ s) P(¬ c) P(¬ s) = .90 × .70 × .001 × 0.999 × . 998 = .00062 n IFT615

Construction d’un RB Cambriolage Séisme Alarme JeanApelle MarieAppelle C S P(A|C,S) T T .95 T F .94 F T .29 F F .001 A P(J|A) T .90 F .05 A P(M|A) T .70 F .01 P(C) .001 P(S) .002 Il y a un arc de X vers Y si X influence directement Y. S’il y a un arc d’un nœud X vers un nœud Y, on dit que : X donne le support causal à Y. Y donne le support diagnostique à X. IFT615

Construction d’un RB Pour construire un RB correcte, on s’assure que chaque nœud est indépendant de tous ses prédécesseurs, étant donné ses parents. En d’autres mots, les parents du nœud Xi devraient être tous les nœuds dans {X1, …, Xi-1} qui influencent/cause directement Xi Dans quel ordre ajouter les nœuds au réseau? Mettre les « causes racines » d’abord, ensuite les nœuds qu’ils influencent directement. IFT615

Construction d’un RB 1. Choisir un ordre des variables X1, … ,Xn 2. Pour i = 1 to n: ajouter Xi au réseau choisir les parents X1, … ,Xi-1 tel que P (Xi | Parents(Xi)) = P (Xi | X1, ... Xi-1) Ce choix garantit que: P (X1, … ,Xn) =i =1 P (Xi | X1, … , Xi-1) (chain rule) =  i =1P (Xi | Parents(Xi)) (par construction) n n IFT615

Exemple Supposons qu’on ordonne les variables comme suit: M, J, A, C, S. P(J | M) = P(J)? MarieAppelle JeanApelle IFT615

Exemple Supposons qu’on ordonne les variables comme suit: M, J, A, C, S Non. P(A | J, M) = P(A | J)? P(A | J, M) = P(A)? MarieAppelle JeanApelle Alarme IFT615

Exemple Supposons qu’on ordonne les variables comme suit: M, J, A, C, S. Non. P(A | J, M) = P(A | J)? P(A | J, M) = P(A)? Non. P(C| A, J, M) = P(C | A)? P(C| A, J, M) = P(C)? MarieAppelle JeanApelle Alarme Cambriolage IFT615

Exemple Supposons qu’on ordonne les variables comme suit: M, J, A, C, S. Non. P(A | J, M) = P(A | J)? P(A | J, M) = P(A)? Non. P(C | A, J, M) = P(C | A)? Oui. P(C | A, J, M) = P(C)? Non. P(S | C, A ,J, M) = P(S | A)? MarieAppelle JeanApelle Alarme Cambriolage Séisme IFT615

Exemple Supposons qu’on ordonne les variables comme suit: M, J, A, C, S. Non. P(A | J, M) = P(A | J)? P(A | J, M) = P(A)? Non. P(C | A, J, M) = P(C | A)? Oui. P(C | A, J, M) = P(C)? Non. P(S | C, A ,J, M) = P(S | A)? Non. P(S | C, A, J, M) = P(S | A, C)? Oui. MarieAppelle JeanApelle Alarme Cambriolage Séisme IFT615

Exemple Cambriolage Séisme Alarme JeanApelle MarieAppelle Déterminer l’indépendance conditionnelle est très difficile dans le sens non causal. Par exemple, en médecine, des études ont montré que les experts préfèrent donner des probabilités dans le sens causal (pathologie → symptôme) plutôt que dans le sens diagnostique. Un réseau avec des dépendance diagnostique (effet → cause) est généralement moins compacte. Dans le cas présent: 1 + 2 + 4 + 2 + 4 = 13 nombres pour représenter les tables de probabilité conditionnelle du réseau au lieu de 10 pour la première version. Généralement il est plus pratique de représenter les dépendances dans le sens causal plutôt que dans le sens diagnostique : causes  effets hypothèses  évidences pathologies  symptômes Ceci réduit le nombre de dépendance dans le RB. Aussi c’est plus facile de donner les probabilités d’avoir une évidence étant donné la cause, plus tôt que l’inverse. IFT615

Autres appellations Il y a d’autres appellations pour les RB : Cambriolage Séisme Alarme JeanApelle MarieAppelle C S P(A|C,S) T T .95 T F .94 F T .29 F F .001 A P(J|A) T .90 F .05 A P(M|A) T .70 F .01 P(C) .001 P(S) .002 Il y a d’autres appellations pour les RB : Réseaux de croyances (belief networks). Réseaux probabilistes. Réseaux causals. Les nœuds d’un réseau bayésien sont aussi appelés des « nœuds chances ». IFT615

RB avec des variables continues PDF(D) PDF(S) Dans ce cours, on considère uniquement des RB avec des variables discrètes : Les TPC sont spécifiées en énumérant toutes les entrées. Mais les RB fonctionnent aussi avec des variables continues : Les probabilités conditionnelles sont spécifiées par des fonctions de densité de probabilités (PDF). Ex: Distance entre voleur et le capteur de mouvement. Force du séisme sur l’échelle de Richter. … … Distance Voleur Force Séisme C S P(A|D,S) P(A)=f(d, s) Alarme MarieAppelle JeanApelle A P(M|A) T .70 F .01 A P(J|A) T .90 F .05 IFT615

Indépendance conditionnelle dans un RB (1) Cambriolage Séisme Alarme JeanApelle MarieAppelle C S P(A|C,S) T T .95 T F .94 F T .29 F F .001 A P(J|A) T .90 F .05 A P(M|A) T .70 F .01 P(C) .001 P(S) .002 Un RB modélise les relations d’indépendance conditionnelle suivantes Un nœud est indépendant de ses non-descendants, étant donné ses parents. Exemples : Cambriolage et MarieAppelle sont dépendants. Mais ils sont indépendants étant donné Alarme : P(M | A, C) = P (M | A). Si A est connu, C n’intervient pas dans le calcul. IFT615

Indépendance conditionnelle dans un RB (1) Cambriolage Séisme Alarme JeanApelle MarieAppelle C S P(A|C,S) T T .95 T F .94 F T .29 F F .001 A P(J|A) T .90 F .05 A P(M|A) T .70 F .01 P(C) .001 P(S) .002 Un RB modélise les relations d’indépendance conditionnelle suivantes Un nœud est indépendant de ses non-descendants, étant donné ses parents. Exemples : JeanAppelle et MarieAppelle sont dépendants. Mais ils sont indépendant étant donné Alarme : P(J | A, M) = P (J | A). Si A est connu, M n’intervient pas dans le calcul. IFT615

Indépendance conditionnelle dans un RB (1) Cambriolage Séisme Alarme JeanApelle MarieAppelle C S P(A|C,S) T T .95 T F .94 F T .29 F F .001 A P(J|A) T .90 F .05 A P(M|A) T .70 F .01 P(C) .001 P(S) .002 Un RB modélise les relations d’indépendance conditionnelle suivantes Un nœud est indépendante de ses non-descendants, étant donné ses parents. Exemples : Cambriolage et Séisme sont indépendants. Mais ils sont dépendants étant donné Alarme. P(A | C, S) n’est pas simplifiable. IFT615

Indépendance conditionnelle dans un RB (2) Un nœud est conditionnellement indépendant étant donné tous ses parents, enfants et parents de ses enfants (autrement dit étant donné sa couverture de Markov). Couverture de Markov de X IFT615

Indépendance conditionnelle dans un RB (3) Cambriolage Séisme Alarme JeanApelle MarieAppelle C S P(A|C,S) T T .95 T F .94 F T .29 F F .001 A P(J|A) T .90 F .05 A P(M|A) T .70 F .01 P(C) .001 P(S) .002 D-séparation : critère pour décider si un nœud X est indépendant d’un nœud Y, étant donné un autre nœud Z. Ce cas est non traité ici. IFT615

Interrogation d’un RB L’usage principal d’un RB est de calculer la distribution de probabilités à postérioris pour un ensemble de variables, étant donné un événement observé. Un événement est une assignation de valeurs à certaines variables d’évidence. Soit X l’ensemble de variables pour laquelle on fait l’interrogation, E les variables d’évidences (qu’on peut observer) et Y les variables cachées (qu’on ne peut pas observer). Une interrogation est du genre P(X|e), où e est une assignation de valeurs à certaines variables dans E. Une interrogation s’appelle aussi faire une inférence. IFT615

Interrogation d’un RB Exemple : P(Cambriolage | JeanApelle = T, MarieAppelle = T ) = [0.287,0.716] Comment fait-on un tel calcul ? Inférence exacte (prohibitif) Par énumération Élimination de variables Inférence approximative par échantillonnage avec les méthode de Monte-Carlo (plus efficace) Vraisemblance pondérée Chaînes de Markov simulées Cambriolage Séisme Alarme JeanApelle MarieAppelle C S P(A|C,S) T T .95 T F .94 F T .29 F F .001 A P(J|A) T .90 F .05 A P(M|A) T .70 F .01 P(C) .001 P(S) .002 IFT615

Rappel de notions de base en probabilités P(X,Z) = P(X|Z)P(Z). P(Z,X) = P(Z|X)P(X). On en déduit P(X|Z) = P(X,Z) / P(Z) P(X|Z) = P(Z|X)P(X) / P(Z) Règle de Bayes Si on a une distribution conjointe pour P(Z,Y) on peut calculer la distribution P(Z) par la somme des probabilités pour toutes les valeurs possibles de Y (marginalisation): P(Z) = Σy P(Z, Y = y). Si on a une distribution conditionnelle P(Z|Y), on peut « conditionner » : P(Z) = Σy P(Z | Y = y)P(Y=y). P(Z) peut donc être considéré comme un facteur constant, α IFT615

Rappel de notions de base en probabilités Ceci nous donne P(X|Z) = α P(X,Z) α est une constante de normalisation pour s’assurer que la somme des probabilités de la distribution P(X,Z) soit égale à 1. De manière générale, soit X, l’ensemble de variables pour laquelle on fait l’interrogation, E, les variables d’évidences (qu’on peut observer) et Y, les variables cachées (qu’on ne peut pas observer). e, les valeurs observées pour les variables dans E. P(X|E=e) = α P(X,E=e) = Σy P(X, E=e, Y = y) Noté aussi P(X|e) = α Σy P(X, e, y) IFT615

Inférence par énumération On a vu que : P(X|e) = α Σy P(X, e, y) On a vu aussi que selon la sémantique d’un RB P(X1, … ,Xn) = π i = 1 P (Xi | Parents(Xi)) Les termes P(X, e, y) peuvent donc s’écrire comme le produit des probabilités conditionnelles du réseau. En d’autre termes, on peut calculer la réponse à une interrogation P(X|e) sur un RB, simplement en calculant les sommes des produits des probabilités conditionnelles du RB. Algorithme Figure 14.9, Page 506 du livre. n IFT615

Exemple P(Cambriolage | JeanApelle = T, MarieAppelle = T ) Noté P(C | j, m) Les variables cachées sont Séisme et Alarme. P(C | j, m) = α Σs,a P(C, s, a, j, m) Note : s et a veulent dire, toutes les valeurs possibles de S=s et A=a variables. Ne pas confondre avec j et m qui sont des évidences fixes (J=j et M=m). Cambriolage Séisme Alarme JeanApelle MarieAppelle C S P(A|C,S) T T .95 T F .94 F T .29 F F .001 A P(J|A) T .90 F .05 A P(M|A) T .70 F .01 P(C) .001 P(S) .002 Voir la note 5 en bas de la page 505 dans le livre. IFT615

Exemple = α Σs,a P(c)P(s)P(a|c,s)P(j|a)P(m|a) P(C | j, m) = α Σs,a P(C, s, a, j, m) On calcule pour C = true P(c | j, m) = α Σs,a P(c)P(s)P(a|c,s)P(j|a)P(m|a) =0.001*0.002*0.95*0.90*0.70+ 0.001*0.998*0.94*0.90*0.70+ 0.001*0.02*0.05*0.05*0.01+ 0.001*0.998*0.06*0.05*0.01 =α (0.00059224) Et C = false = α Σs,a P(┐c)P(s)P(a| ┐c,s)P(j|a)P(m|a) = α (0.0014919) α = 1/(0.00059224+ 0.00059224) Donc, P(C | j, m) = [0.284, 0.716] Cambriolage Séisme Alarme JeanApelle MarieAppelle C S P(A|C,S) T T .95 T F .94 F T .29 F F .001 A P(J|A) T .90 F .05 A P(M|A) T .70 F .01 P(C) .001 P(S) .002 Je n’ai pas vérifié les chiffres, je les ai prises telles quelles du livre. Ça me semble quand même l’inverse, c.-à-d., P(C =true | j, m) = 0.716 et P(C=false | j, m) = 0.284. Refaire les calculs et vérifier. IFT615

Inférence par élimination des variables Même principe que l’inférence par énumération, mais on évite les répétions de calculs déjà faits. Voir section 14.4.2 du livre (3e édition). IFT615

Inférence approximative Les méthodes d’inférence exacte sont inefficaces. Le problème d’inférence est NP-Complet. Les méthodes d’inférences approximatives sont plus pratiques. En général, on n’a pas besoin d’un calcul exact des probabilités pour qu’une conclusion tirée d’un RB soit correcte. Les méthodes approximatives assignent des probabilités aux variables aléatoires en fonction des TPC associées à ces variables. Ces assignations sont basées sur des simulations stochastiques, plutôt que des observations réelles. Voir la section 14.5 dans le livre. IFT615

Types d’interrogations d’un RB Cambriolage Séisme Alarme JeanApelle MarieAppelle C S P(A|C,S) T T .95 T F .94 F T .29 F F .001 A P(J|A) T .90 F .05 A P(M|A) T .70 F .01 P(C) .001 P(S) .002 Diagnostique (on connaît les effets, on cherche les causes) P(Cambriolage|JeanAppelle=T) Garder à l’esprit qu’on a des arcs « causes  effets ». Prédiction (étant donné les causes, quels sont les effets) P(JeanAppelle|Cambriolage=T). Probabilité conjointe P(Alarme) IFT615

Apprentissage d’un RB La structure d’un RB (le graphe) est le plus souvent spécifiée à l’aide d’un expert. Dans d’autres applications, la structure est générée automatiquement à partir des données statistiques. C’est un des problèmes d’apprentissage machine. Dans d’autres problèmes, on connaît la structure du RB, mais on ne connaît pas les TPC. Là aussi, on peut les apprendre à partir des données statistiques. C’est un autre problème d’apprentissage machine. IFT615

Diagrammes d’influence Un diagramme d’influence (DI) est une extension d’un RB avec des nœuds de décision et des nœuds d’utilité. Les nœuds habituels d’un RB sont appelés des nœuds chances. On ajoute : Des nœuds de décision représentant une prise de décision Des nœuds d’utilité représentant l’utilité (coût ou degré de désirabilité) des nœuds chances influencés par les actions. Ainsi on peut modéliser des prises des décisions simples Pour des décisions complexes (séquentielles), les processus de décision de Markov sont généralement préférables. IFT615

Exemple Parapluie Temps Trainer parapluie Bonheur Prévision Prendre / Ne pas prendre pluvieux  pluvieux .4 .6 Parapluie Temps Trainer parapluie P(trainer | prendre) = 1 P( trainer, prendre) = 1 Bonheur Prévision Temps Prévision pluvieux ensoleillé .3 pluvieux pluvieux .7  pluvieux ensoleillé .8  pluvieux pluvieux .2 U(trainer, pluvieux) = 25 U(trainer, pluvieux) = -20 U(trainer, pluvieux) = -100 U( trainer, pluvieux) = 100 IFT615

Évaluation des diagrammes d’influence Mettre à jour les variables d’évidence. Pour chaque valeur possible d’un nœud décision Change le nœud décision pour lui donner cette valeur. Calcule les probabilités à postérioris des parents des nœuds utilités (en utilisant un algorithme d’inférence standard pour les RB). Calcule l’utilité résultante pour l’action. Retourne l’action avec la plus grande utilité IFT615

Exemple de RB complexe IFT615

Valeur de l’information Parfois un agent est amené à prendre des décisions sans posséder toute l’information. Un aspect important de la prise de décision est de déterminer les questions à poser pour chercher de l’information (pour trouver des évidences). La question la plus pertinente à poser est celle qui apporte le plus d’information : Les effets d’une action prise suite à la question apporte une différence significative dans le processus de décision. Ces effets sont très vraisemblables. Les inférences sur les DI permettent de déterminer les décisions qui apportent le plus d’information. IFT615

AUTRES EXEMPLES D’INFÉRENCE DE RB IFT615

Exemple 1 : Évaluation par énumérations F M F M P(H|F,M) 0.5 T 1.0 0.01 0.02 Requête: Calculer P(T=true) Variables connues: F = False M = true Variables inconnues: H O P(O) 0.6 H O Énumération des valeurs possible des variables cachées (2*2) T H O P(H) * P(O)*P(T | H, O) = F 0.0 * 0.4 * 0.1 T 0.0 * 0.6 * 0.5 1.0 * 0.4 * 0.5 0.02 1.0 * 0.6 * 1.0 0.60 TOTAL 0.62 H O P(T|H,O) F 0.1 T 0.5 1.0

Exemple 2 : Évaluation par énumérations Requête: Calculer P(T=true) Variables connues: M = true Variables inconnues: H O F P(F) 0.2 F M F M P(H|F,M) 0.5 T 1.0 0.01 0.02 P(O) 0.6 H F H O P(F)*P(H)*P(O|F,H)* P(T | F, M=true, H, O,) = 0.8 * 0.0 * 0.4 * 0.1 T 0.8 * 0.0 * 0.6 * 0.5 0.8 * 1.0 * 0.4 * 0.5 0.16 0.8 * 1.0 * 0.6 * 1.0 0.48 0.2 * 0.98 * 0.4 * 0.1 0.00784 0.2 * 0.98 * 0.6 * 0.5 0.0588 0.2 * 0.02 * 0.4 * 0.5 0.0008 0.2 * 0.02 * 0.6 * 1.0 0.0024 TOTAL 0.71 O T H O P(T|H,O) F 0.1 T 0.5 1.0

Exemple 2 : Évaluation avec décomposition en polytree Requête: Calculer P(T=true) Variables connues: M = true Variables inconnues: H O F P(F) 0.2 F M P(H|F,M) 0.5 T 1.0 0.01 0.02 F M P(O) 0.6 H O 1 F P(F)*P(H | F) = 0.8*1.0 0.8 T 0.2*0.02 0.004 Total 0.804 1 T 2 H O P(T|H,O) F 0.1 T 0.5 1.0 2 H O P(H)*P(O)*P(T|H,O) = F 0.196*0.4 * 0.1 0.00784 T 0.196*0.6 * 0.5 0.0588 0.804*0.4 * 0.5 0.1068 0.804*0.6 * 1.0 0.4824 TOTAL 0.71

Exemple 2: par échantillonage direct (approx) P(F) 0.2 Requête: Calculer P(T=true) Variables connues: M = true Variables inconnues: H O F F M=true F M P(H|F,M) 0.5 T 1.0 0.01 0.02 P(O) 0.6 H F H O T # Random<0.2 Random<P(H|F,M) Random<0.6 Random<P(T|H,O) 1 False True 2 3 4 5 6 7 8 Average of T=True 6/8 = 0.75 O T H O P(T|H,O) F 0.1 T 0.5 1.0 Plus qu’il y a d’échantillons, plus l’erreur d’estimation est faible.

Autres appellations Diagrammes d’influence (influence diagrams). Réseaux de décision (decision networks) Diagrammes de pertinence (relevance diagrams) IFT615

Exemples d’applications Microsoft Windows : identification des problèmes d’impression. Office : Microsoft Agent. NASA Support au diagnostique en temps réel des pannes du système de propulsion des navettes spatiales. Médecine Intellipath : aide au diagnostique des maladies (proposer le diagnostique le plus probable à partir des symptômes; recommander les tests de laboratoires les plus pertinents; recommander les traitements). AT&T Détections des fraudes et des mauvais payeurs pour les factures de téléphone. IFT615

Logiciels Hugin (commercial). Génie/Smile (domaine publique) IFT615 Exemples de projets: - Utiliser Génie/Smile pour modéliser les liens de cause à effets pour un sous-domaine médical (exemple douleurs abdominales) et faire du diagnostique avec, à la TeachMed. IFT615

Résumé Un RB est un graphe orienté, acyclique, représentant des connaissances causales, et reflétant les dépendances conditionnelles entre des variables. La topologie du réseau (arcs entres les variables) et les TPC donnent une représentation compacte de la distribution conjointe des probabilités. Les connaissances du réseau (liens de causalité et probabilités) sont généralement obtenus avec l’aide d’un expert. Pour des applications concrètes, ceci peut être très laborieux. Un diagramme d’influence est un réseau bayésien avec des nœuds de décision et des nœuds d’utilité. IFT615