La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Froduald Kabanza Département d’informatique Université de Sherbrooke

Présentations similaires


Présentation au sujet: "Froduald Kabanza Département d’informatique Université de Sherbrooke"— Transcription de la présentation:

1 IFT 702 Planification en intelligence artificielle Reconnaissance de plans
Froduald Kabanza Département d’informatique Université de Sherbrooke planiart.usherbrooke.ca/kabanza/cours/ift702

2 Plan de l’exposé Énoncé du problème Quelques approches
© Froduald Kabanza IFT702

3 Rappel – Problème de planification
Données: Actions primitives But État à atteindre Comportement (but temporellement étendu) État initial Sortie : plan d’actions Séquence Politique Quelle prochaine action? © Froduald Kabanza IFT702

4 Problème de reconnaissance de plans
Données : Séquence d’observations Actions primitives Pour certaines approches: librairie de plans Sortie : But expliquant les observations Plan expliquant les observations Problèmes reliés Complex event processing Pattern recognition Abductive reasoning Planning Quel est son but? Comment y arrivera-t-il? © Froduald Kabanza IFT702

5 Facteurs de complexité
Jeux Sécurité Défense Interfaces humain-machines Domotique Compréhension du langage naturel © Froduald Kabanza IFT702

6 Facteurs de complexité
Environnement complétement observable vs partiellement observable Interaction vs pas d’interaction entre l’agent observé et l’agent observateur L’agent observé est hostile vs coopératif Un seul agent observateur vs une équipe d’agents observateurs Un seul agent observé vs des équipes d’agents observateurs Contraintes de temps réel Quel est son but? Comment y arrivera-t-il? © Froduald Kabanza IFT702

7 Planification comme outil de compréhension de la situation
Architecture de contrôle inspirée de SAPHIRA © Froduald Kabanza IFT702

8 Deux types d’approches vues dans ce cours
Basé sur des librairies de plans On suppose que l’agent agit en suivant des recettes On peut modéliser ses recettes par une librairie de plans. Le problème revient à reconnaître lequel des plans est suivi. Problème: comment avoir les librairies de plans? Apprentissage Forage Techniques: Inférence probabiliste Parsing probabiliste (HTN/Grammaires) Basé sur les actions primitives On suppose qu’un comportement rationnel (optimal) est plus probable que celui qui l’est moins Subtilité: différent de dire que l’agent agit de façon rationnel (optimale) On n’a pas besoin des recettes Le problème revient à inverser le processus de planification: Probabilité d’un but dépend de la différence entre un comportement optimal vers le but et le comportement observé Technique: Ramirez et Geffner (AAAI 2010). © Froduald Kabanza IFT702

9 Rappel – inférence probabiliste
Contexte: Un gardien de sécurité passe un mois dans un édifice sous-terrain, sans sortir. Il s’amuse à prévoir le temps en observant si le patron amène un parapluie. Variables: Xt = {Rt} (pour « Rain ») et Et={Ut} (pour « Umbrella »). Un gardien de sécurité passe un mois dans un édifice sous-terrain, sans sortir. Chaque jour, son directeur arrive avec ou sans parapluie. Le gardien veut inférer la possibilité qu’il ait plu ou non en fonction des séquences d’observation du parapluie. Modèle des transitions: P(Rt | Rt-1). Modèle d’observation: P(Et | Rt). © Froduald Kabanza IFT702

10 Reconnaissance de plan Par réseau bayésiens
D. Pynadath and M. Wellman. Accounting for Context in Plan Recognition, with Application to Traffic Monitoring. Proc. of Conference on Uncertainty in Artificial Intelligence, 1995. © Froduald Kabanza IFT702

11 Reconnaissance de plan par réseaux bayésiens dynamiques
Kautz et al. Kautz : “This is one result of our experiment. In this experiment, a graduate student carries this GPS for thirty days. We get the GPS log. We put it into our system without any labeling. After a few hours, the system output such a picture, this picture tells us where the common goals are for the person and where are the routine parking spot and bus stops. In fact, that is just correct. We then label them to make it clear.”

12 Reconnaissance de plan par réseaux bayésiens dynamiques
Kautz et al. xk-1 zk-1 zk xk mk-1 mk tk-1 tk gk-1 gk Goal Trip segment Transportation mode x=<Location, Velocity> GPS reading © Froduald Kabanza IFT702

13 Reconnaissance de plans par une logique Markovienne (Markov logic)
A. Sadilek and H. Kautz, Location-Based Reasoning about Complex Multi-Agent Behavior, Journal of Artificial Intelligence Research 43 (2012) Application : jeu de capture du drapeau Markov Logic Mariage de la logique du premier ordre avec les probabilités. Assigne des poids à des formules de logique du premier ordre Interprétation probabiliste Approche: Utiliser la logique markovienne pour spécifier les règles du jeu Utiliser l’inférence de la logique markovienne pour prédire les buts des joueurs étant donné les observations © Froduald Kabanza IFT702

14 Reconnaissance de plans par analyse (parsing) des grammaires
C. Geib and R. Goldman.  A probabilistic plan recognition algorithm based on plan tree grammars. Artif. Intell. 173(11): (2009) If a hacker has a goal like stealing information from a computer (theft), the plan library breaks that goal into five steps: scan the system to determine vulnerabilities (recon), exploit the system’s weaknesses to gain entry (break-in), escalate privileges (gain-root), export desired data (steal), and hide traces of presence on computer (clean). Ordering constraints within a method are represented by directed arcs. For example, the hacker must break-in before she can gain-root. Finally, notice that there is a condition/event that is tied to the action clean. The dashed line represents the fact that this condition results from the execution of the action. Thus, if clean is executed it will result in deleted event logs (deleted-logs). This information about action effects will be critical to inferring the execution of unobserved actions. © Froduald Kabanza IFT702

15 Reconnaissance de plans par analyse (parsing) des grammaires
C. Geib and R. Goldman.  A probabilistic plan recognition algorithm based on plan tree grammars. Artif. Intell. 173(11): (2009) Implémenté par l’algorithme YAPPR. Pour avoir l’implémentation: contacter planiart.usherbrooke.ca/~julien © Froduald Kabanza IFT702

16 Approche en inversant la planification
M. Ramirez and H. Geffner. Probabilistic Plan Recognition Using Off-the-Shelf Classical Planners. AAAI 2010. Par définition En supposant le principe de rationalité (un agent aura tendance à suivre les plans optimaux), on peut établir que c(G,O) est le coût du meilleur plan respectant avec les observations c(G, 𝑂 ) est le coût du plan optimal peu importe les observations Chacun de ces coûts est calculé en lançant un planificateur classique Accès au code: contacter planiart.usherbrooke.ca/~julien Couvrir les slides 18 à 22. © Froduald Kabanza IFT702

17 Résumé La reconnaissance de plan vise à comprendre les plans, les buts, les intentions d’autres agents à partir d’observations. Problème plus compliqué que la planification. Résolu en réduisant le problème à des algorithmes/théories d’inférences utilisées pour d’autres problèmes. Filtrage et prédiction probabiliste Inversion de la planification Etc. © Froduald Kabanza IFT702


Télécharger ppt "Froduald Kabanza Département d’informatique Université de Sherbrooke"

Présentations similaires


Annonces Google