Froduald Kabanza Département d’informatique Université de Sherbrooke

Slides:



Advertisements
Présentations similaires
Bratec Martin ..
Advertisements

NOTIFICATION ÉLECTRONIQUE
Fragilité : une notion fragile ?
SEMINAIRE DU 10 AVRIL 2010 programmation du futur Hôtel de Ville
Phono-sémantique différentielle des monosyllabes italiens
MAGGIO 1967 BOLOGNA - CERVIA ANOMALIES DU SOMMEIL CHEZ L'HOMME
droit + pub = ? vincent gautrais professeur agrégé – avocat
Transcription de la présentation:

IFT 702 Planification en intelligence artificielle Reconnaissance de plans Froduald Kabanza Département d’informatique Université de Sherbrooke planiart.usherbrooke.ca/kabanza/cours/ift702

Plan de l’exposé Énoncé du problème Quelques approches © Froduald Kabanza IFT702

Rappel – Problème de planification Données: Actions primitives But État à atteindre Comportement (but temporellement étendu) État initial Sortie : plan d’actions Séquence Politique Quelle prochaine action? © Froduald Kabanza IFT702

Problème de reconnaissance de plans Données : Séquence d’observations Actions primitives Pour certaines approches: librairie de plans Sortie : But expliquant les observations Plan expliquant les observations Problèmes reliés Complex event processing Pattern recognition Abductive reasoning Planning Quel est son but? Comment y arrivera-t-il? © Froduald Kabanza IFT702

Facteurs de complexité Jeux Sécurité Défense Interfaces humain-machines Domotique Compréhension du langage naturel © Froduald Kabanza IFT702

Facteurs de complexité Environnement complétement observable vs partiellement observable Interaction vs pas d’interaction entre l’agent observé et l’agent observateur L’agent observé est hostile vs coopératif Un seul agent observateur vs une équipe d’agents observateurs Un seul agent observé vs des équipes d’agents observateurs Contraintes de temps réel Quel est son but? Comment y arrivera-t-il? © Froduald Kabanza IFT702

Planification comme outil de compréhension de la situation Architecture de contrôle inspirée de SAPHIRA © Froduald Kabanza IFT702

Deux types d’approches vues dans ce cours Basé sur des librairies de plans On suppose que l’agent agit en suivant des recettes On peut modéliser ses recettes par une librairie de plans. Le problème revient à reconnaître lequel des plans est suivi. Problème: comment avoir les librairies de plans? Apprentissage Forage Techniques: Inférence probabiliste Parsing probabiliste (HTN/Grammaires) Basé sur les actions primitives On suppose qu’un comportement rationnel (optimal) est plus probable que celui qui l’est moins Subtilité: différent de dire que l’agent agit de façon rationnel (optimale) On n’a pas besoin des recettes Le problème revient à inverser le processus de planification: Probabilité d’un but dépend de la différence entre un comportement optimal vers le but et le comportement observé Technique: Ramirez et Geffner (AAAI 2010). © Froduald Kabanza IFT702

Rappel – inférence probabiliste Contexte: Un gardien de sécurité passe un mois dans un édifice sous-terrain, sans sortir. Il s’amuse à prévoir le temps en observant si le patron amène un parapluie. Variables: Xt = {Rt} (pour « Rain ») et Et={Ut} (pour « Umbrella »). Un gardien de sécurité passe un mois dans un édifice sous-terrain, sans sortir. Chaque jour, son directeur arrive avec ou sans parapluie. Le gardien veut inférer la possibilité qu’il ait plu ou non en fonction des séquences d’observation du parapluie. Modèle des transitions: P(Rt | Rt-1). Modèle d’observation: P(Et | Rt). © Froduald Kabanza IFT702

Reconnaissance de plan Par réseau bayésiens D. Pynadath and M. Wellman. Accounting for Context in Plan Recognition, with Application to Traffic Monitoring. Proc. of Conference on Uncertainty in Artificial Intelligence, 1995. © Froduald Kabanza IFT702

Reconnaissance de plan par réseaux bayésiens dynamiques Kautz et al. http://www.cs.rochester.edu/u/kautz/talks/converging-technology-kautz-v3.ppt Kautz : “This is one result of our experiment. In this experiment, a graduate student carries this GPS for thirty days. We get the GPS log. We put it into our system without any labeling. After a few hours, the system output such a picture, this picture tells us where the common goals are for the person and where are the routine parking spot and bus stops. In fact, that is just correct. We then label them to make it clear.”

Reconnaissance de plan par réseaux bayésiens dynamiques http://www.cs.rochester.edu/u/kautz/talks/converging-technology-kautz-v3.ppt Kautz et al. xk-1 zk-1 zk xk mk-1 mk tk-1 tk gk-1 gk Goal Trip segment Transportation mode x=<Location, Velocity> GPS reading © Froduald Kabanza IFT702

Reconnaissance de plans par une logique Markovienne (Markov logic) A. Sadilek and H. Kautz, Location-Based Reasoning about Complex Multi-Agent Behavior, Journal of Artificial Intelligence Research 43 (2012) 87-133. Application : jeu de capture du drapeau Markov Logic Mariage de la logique du premier ordre avec les probabilités. Assigne des poids à des formules de logique du premier ordre Interprétation probabiliste Approche: Utiliser la logique markovienne pour spécifier les règles du jeu Utiliser l’inférence de la logique markovienne pour prédire les buts des joueurs étant donné les observations © Froduald Kabanza IFT702

Reconnaissance de plans par analyse (parsing) des grammaires C. Geib and R. Goldman.  A probabilistic plan recognition algorithm based on plan tree grammars. Artif. Intell. 173(11): 1101-1132 (2009) If a hacker has a goal like stealing information from a computer (theft), the plan library breaks that goal into five steps: scan the system to determine vulnerabilities (recon), exploit the system’s weaknesses to gain entry (break-in), escalate privileges (gain-root), export desired data (steal), and hide traces of presence on computer (clean). Ordering constraints within a method are represented by directed arcs. For example, the hacker must break-in before she can gain-root. Finally, notice that there is a condition/event that is tied to the action clean. The dashed line represents the fact that this condition results from the execution of the action. Thus, if clean is executed it will result in deleted event logs (deleted-logs). This information about action effects will be critical to inferring the execution of unobserved actions. © Froduald Kabanza IFT702

Reconnaissance de plans par analyse (parsing) des grammaires C. Geib and R. Goldman.  A probabilistic plan recognition algorithm based on plan tree grammars. Artif. Intell. 173(11): 1101-1132 (2009) Implémenté par l’algorithme YAPPR. Pour avoir l’implémentation: contacter planiart.usherbrooke.ca/~julien © Froduald Kabanza IFT702

Approche en inversant la planification M. Ramirez and H. Geffner. Probabilistic Plan Recognition Using Off-the-Shelf Classical Planners. AAAI 2010. Par définition En supposant le principe de rationalité (un agent aura tendance à suivre les plans optimaux), on peut établir que c(G,O) est le coût du meilleur plan respectant avec les observations c(G, 𝑂 ) est le coût du plan optimal peu importe les observations Chacun de ces coûts est calculé en lançant un planificateur classique Accès au code: contacter planiart.usherbrooke.ca/~julien Couvrir les slides 18 à 22. © Froduald Kabanza IFT702

Résumé La reconnaissance de plan vise à comprendre les plans, les buts, les intentions d’autres agents à partir d’observations. Problème plus compliqué que la planification. Résolu en réduisant le problème à des algorithmes/théories d’inférences utilisées pour d’autres problèmes. Filtrage et prédiction probabiliste Inversion de la planification Etc. © Froduald Kabanza IFT702