La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Agents Logiques Chap. 7. Plan Agents basés sur des connaissances Le monde de Wumpus Logique en général – modèle et entraînement (entailment) Logique propositionnelle.

Présentations similaires


Présentation au sujet: "Agents Logiques Chap. 7. Plan Agents basés sur des connaissances Le monde de Wumpus Logique en général – modèle et entraînement (entailment) Logique propositionnelle."— Transcription de la présentation:

1 Agents Logiques Chap. 7

2 Plan Agents basés sur des connaissances Le monde de Wumpus Logique en général – modèle et entraînement (entailment) Logique propositionnelle (booléenne) Equivalence, validité, satisfiabilité Règles dinférence et preuve de théorème –Chaînage avant –Chaînage arrière –Règle de Résolution

3 Base de connaissances Base de connaissances = ensemble de phrases dans un langage formel Approche déclarative pour construire un agent (ou un système) : –Tell : lui dire ce quil doit savoir (Approche procédurale: dire comment faire – étape par étape) Ensuite, il peut se demander ( Ask) ce quil a à faire – les réponses doivent suivre la KB (conséquence logique) On peut voir un agent selon son niveau de connaissances i.e., ce quils savent, indépendamment de comment cest implanté Ou au niveau dimplantation –i.e., structures de données dans la KB et algorithmes pour les manipuler

4 An agent simple basé sur connaissances Lagent doit être capable de: –Représenter les états, les actions, etc. (un formalisme de représentation) –Intégrer de nouvelles perceptions –Mettre à jour la représentation du monde (modifier KB) –Déduire des propriétés cachées du monde (conséquences) –Déduire des actions appropriées (prendre des décisions – conséquences)

5 Description de PEAS dans le monde de Wumpus Mesure de performance –Or+1000, mort –-1 par étape, -10 pour utiliser la flèche Environnement –Objets: wumpus, agent, fosses, or –Carrés adjacents au wumpus sentent fort (smelly) –Carrés adjacents à une fosse sentent du brises (breezy) –On voit briller (Glitter) ssi lor est dans le carré –Tirer (Shooting) tue le wumpus si on est face à –Tirer utilise la seule flèche disponible –Saisir (Grabbing) prend lor si dans le même carré –Relâcher (Releasing) laisse lor dans le carré Senseurs: Puanteur (Stench), Brise (Breeze), Éclat (Glitter), Coup (Bump), Cri (Scream) Actuateurs: Left turn, Right turn, Forward, Grab, Release, Shoot

6 Caractéristiques du monde de Wumpus Observable complètement Non – seulement des perceptions locales Déterministe Oui – Le résultat spécifié exactement Épisodique Non – séquentielle au niveau dactions Statique Oui – Wumpus et fosses ne bougent pas Discret Oui Seul-agent? Oui – Wumpus est le seul agent qui agit dans lenvironnement

7 Explorer le monde de wumpus

8

9

10

11

12

13

14

15 Logique en général Les logiques sont des langages formels pour représenter des informations tel que des conclusions peuvent être tirées. La syntaxe définit les règles pour écrire des phrases du langage La sémantique définit le sens des phrases –i.e., définit la vérité dune phrase dans un monde E.g., le langage darithmétique –x+2 y est une phrase; x2+y > {} nest pas une phrase –x+2 y est vrai ssi le nombrer x+2 nest pas plus petit que y –x+2 y est vrai dans un monde où x = 7, y = 1 –x+2 y est faux dans in monde où x = 0, y = 6 E.g. le français –« Mets est une dans » nest pas une phrase –« Je mange une pomme » est une phrase –« Je me promène » nest pas vrai maintenant –« Je donne un cours » est vrai

16 Entraînement/Implication (Entailment) Entraînement signifie quune chose suit sémantiquement une autre ( ): KB α La base de connaissances KB entraîne la phrase α ssi α est vrai dans tous les mondes où KB est vrai –E.g., la KB contenantthe Giants won et the Reds won entraîne Either the Giants won or the Reds won –E.g., x+y = 4 entraîne 4 = x+y –Lentraînement est une relation entre des phrases (i.e., une relation syntaxique) qui est basée sur la sémantique On ne peut pas créer cette relation nimporte comment E.g. x+y = 4 x-y = 4 ne doit pas être créée.

17 Modèle Les logiciens pensent typiquement en terme de modèles, qui sont des mondes structurés formellement, par rapport auxquels la vérité est évaluée. On dit que m est un modèle dune phrase α si α est vrai dans m M(α) est lensemble de modèles de α On note KB α ssi M(KB) M(α) –E.g. KB = Giants won and Red won α = Giants won

18 Entraînement dans le monde de wumpus Situation après avoir rien détecté dans [1,1], bougé à droite et senti la brise à [2,1] Considérer les modèles possibles pour KB en supposant il y a seulement des puits 3 choix booléens 8 modèles possibles

19 Modèles Wumpus (mondes possibles)

20 Modèles Wumpus KB = règles du monde wumpus + observations

21 Modèles Wumpus KB = règles du monde wumpus + observations α 1 = "[1,2] est sécuritaire", KB α 1, prouvé par model checking

22 Modèles Wumpus KB = règles du monde wumpus + observations

23 Modèles Wumpus KB = règles du monde wumpus + observations α 2 = "[2,2] est sécuritaire", KB α 2

24 Inférence KB i α = la phrase α peut être dérivée de KB par une procédure i Adéquation (Soundness): i est adéquate si quand KB i α est vrai, KB α lest aussi. Complétude (Completeness): i est complète si quand KB α est vrai, KB i α lest aussi À venir: nous allons définir une logique (logique du premier ordre) qui est suffisamment expressive pour exprimer presque tout ce quon veut exprimer, et pour laquelle il existe une procédure dinférence à la fois adéquate et complète. Cest-à-dire, la procédure peut répondre à toute question dont la réponse suit logiquement KB

25 Logique propositionnelle: Syntaxe La logique propositionnelle est la logique la plus simple pour illustrer les idées de base Syntaxe = règle de grammaire Les symboles de proposition P 1, P 2 etc. sont des phrases –Si S est une phrase, S est une phrase (négation) –Si S 1 et S 2 sont des phrases, S 1 S 2 est une phrase (conjonction) –Si S 1 et S 2 sont des phrases, S 1 S 2 est une phrase (disjonction) –Si S 1 et S 2 sont des phrases, S 1 S 2 est une phrase (implication) –Si S 1 et S 2 sont des phrases, S 1 S 2 est une phrase (biconditionnel)

26 Logique propositionnelle: Sémantique Chaque modèle spécifie la valeur vrai/faux pour un symbole de proposition E.g. P 1,2 P 2,2 P 3,1 falsetruefalse Avec ces symboles, 8 modèles possibles peuvent être énumérés automatiquement Règles pour évaluer la vérité par rapport à un modèle m: Sis true iff S is false S 1 S 2 is true iff S 1 is true and S 2 is true S 1 S 2 is true iff S 1 is true or S 2 is true S 1 S 2 is true iffS 1 is false or S 2 is true i.e., is false iffS 1 is true and S 2 is false S 1 S 2 is true iffS 1 S 2 is true and S 2 S 1 is true Processus récursif simple pour évaluer une phrase arbitrairement complexe, e.g., P 1,2 (P 2,2 P 3,1 ) = true (true false) = true true = true

27 Table de vérité pour les connecteurs logiques Pour ce système avec 2 symboles de proposition: - 4 mondes possibles

28 Phrase dans le monde de Wumpus Supposons que P i,j est vrai si il y a une fosse à [i, j]. Et B i,j est vrai si il y a une brise à [i, j]. P 1,1 B 1,1 B 2,1 "Pits cause breezes in adjacent squares (une fosse cause la brise dans les carrés adjacents) B 1,1 (P 1,2 P 2,1 ) B 2,1 (P 1,1 P 2,2 P 3,1 )

29 Table de vérité pour inférence À vérifier Vérifier pour chaque ligne où KB est vraie (modèle de KB) si la conclusion est aussi vraie.

30 Inférence par énumération Profondeur dabord pour énumérer tous les modèles Procédure adéquate et complète Cest une approche sémantique Pour n symboles, complexité en temps O(2 n ), en espace O(n)

31 Méthodes de preuve Méthodes de preuve divisées grosso modo en 2 catégories: –Model checking (Vérification de modèles) Énumération en utilisant une table de vérité (toujours exponentiel en n) Retour en arrière (backtracking) amélioré, e.g., Davis--Putnam- Logemann-Loveland (DPLL) Recherche heuristique dans lespace de modèles (adéquate mais non complet) e.g., algorithme hill-climbing qui favorise le conflit minimal –Application de règles dinférence Génération légitime (sound) de phrases nouvelles à partir des anciennes Preuve = une séquence dapplications de règles dinférence Peut utiliser les règles dinférence comme opérateur dans un algorithme de recherche standard Typiquement, ceci demande à transformer une phrase en une forme normale (pour simplifier la procédure)

32 Par ordinateur? Lordinateur a beaucoup de problème pour manipuler la sémantique –Il peut faire la vérification dans une table de vérité –Mais complexité exponentielle Une approche syntaxique –Manipulations des expressions pour tenter darriver à la conclusion –Procédure dinférence En maths?

33 Équivalences logiques 2 phrases sont logiquement équivalentes ssi elles sont vraies dans les mêmes modèles : α ß ssi α β et β α

34 Comment vérifier léquivalence? Vérifier dans la table de vérité si 2 expressions ont toujours les mêmes valeurs de vérité A B et (A) B ? Utilité des équivalences –Une expression peut être transformée en une autre équivalente

35 Validité et satisfiabilité dune phrase Une phrase est valide si elle est vrai dans tous les modèles, e.g., True,A A, A A, (A (A B)) B La validité est reliée à linférence via le Théorème de déduction: KB α si et seulement si (KB α) est valide Une phrase est satisfiable si elle est vraie dans quelques modèles e.g., A B, C Une phrase est insatisfiable si elle est vraie dans aucun modèle e.g., A A La satisfiabilité est reliée à linférence via la propriété suivante: KB α si et seulement si (KB α) est insatisfiable

36 Méthodes de preuve Méthodes de preuve divisées grosso modo en 2 catégories: –Model checking (Vérification de modèle) Énumération en utilisant une table de vérité (toujours exponentiel en n) Retour en arrière (backtracking) amélioré, e.g., Davis--Putnam- Logemann-Loveland (DPLL) Recherche heuristique dans lespace de modèles (adéquate mais non complet) e.g., algorithme hill-climbing qui favorise le conflit minimal –Application de règles dinférence Génération légitime (sound) de phrases nouvelles à partir des anciennes Preuve = une séquence dapplications de règles dinférence Peut utiliser les règles dinférence comme opérateur dans un algorithme de recherche standard Typiquement, ceci demande à transformer une phrase en une forme normale (pour simplifier la procédure)

37 Règles dinférence Forme générale dune règle –Signification: Si est accepté, alors on accepte aussi –Une procédure de preuve Ensemble de phrases KB 0 Pour une règle dinférence, si est dans KB 0, alors on ajoute dans KB 0 : KB 1 Si dans un KB n, on voit la conclusion C, alors C est prouvée.

38 Règles: exemples Modus Ponens Modus Tolens Et-élimination

39 Exemple de preuve KB 0 = {A, A B, C, B C D} = D KB 1 avec MP: {A, A B, C, B C D, B} KB 2 avec MP: {A, A B, C, B C D, B, D} Prouvé # Recherche –KB 0, KB 1, KB 2 comme états –Une application de règle dinférence = successeur

40 Résolution Conjunctive Normal Form (CNF) (forme normale conjonctive) conjonction de disjonctions de littéraux = clauses E.g., (A B) (B C D) Règle de résolution (pour CNF): l i … l k, m 1 … m n l i … l i-1 l i+1 … l k m 1 … m j-1 m j+1... m n où l i et m j sont des littéraux complémentaires (i.e. l i = m j ) E.g., P 1,3 P 2,2, P 2,2 P 1,3 Règle de résolution est adéquate et complète pour la logique de proposition

41 Résolution Une démonstration informelle de ladéquation de la règle de résolution: l 1 … l i-1 l i l i+1 … l k ( l i … l i-1 l i+1 … l k ) l i m 1 … m j-1 m j m j+1... m n m j ( m 1 … m j-1 m j+1... m n ) ( l i … l i-1 l i+1 … l k ) l i m j ( m 1 … m j-1 m j+1... m n ) ( l i … l i-1 l i+1 … l k ) ( m 1 … m j-1 m j+1... m n ) l i … l i-1 l i+1 … l k m 1 … m j-1 m j+1... m n

42 Résolution Une démonstration informelle de ladéquation de la règle de résolution: A B (A) B B C B C (A) B B C (A) C = A C

43 Conversion en CNF B 1,1 (P 1,2 P 2,1 ) 1.Éliminer, remplacer α β par (α β) (β α). (B 1,1 (P 1,2 P 2,1 )) ((P 1,2 P 2,1 ) B 1,1 ) 2. Éliminer, remplacer α β par α β. ( B 1,1 P 1,2 P 2,1 ) ( (P 1,2 P 2,1 ) B 1,1 ) 3. Déplacer vers lintérieur en utilisant les règles de Morgan et double-négation: ( B 1,1 P 1,2 P 2,1 ) (( P 1,2 P 2,1 ) B 1,1 ) 4. Appliquer la loi de distributivité ( sur ) et aplatir : ( B 1,1 P 1,2 P 2,1 ) ( P 1,2 B 1,1 ) ( P 2,1 B 1,1 )

44 Algorithme de Résolution Preuve par contradiction/réfutation, i.e., montrer que KB α est insatisfiable (ou monter que ça mène à la contradiction ( )

45 Exemple KB = (B 1,1 (P 1,2 P 2,1 )) B 1,1 α = P 1,2

46 Chaînage avant et arrière Forme Horn (plus restreinte) KB = conjonction de Clauses Horn –Clause Horn = Symbole de proposition; ou (conjonction de symboles) symbole –E.g., C (B A) (C D B) Modus Ponens (Pour forme Horn): complet pour KB en forme Horn α 1, …,α n,α 1 … α n β β Peut être utilisé avec chaînage avant (forward chaining) ou chaînage arrière (backward chaining). Ces algorithmes sont très naturels et demandent un temps linéair

47 Chaînage avant Idée: Activer une règle dont les prémisses sont satisfaites dans KB, –Ajouter son conclusion dans KB, jusquà la requête soit trouvée dans KB

48 Algorithme Chaînage avant est adéquat et complet pour KB en Horn

49 Exemple de chaînage avant

50

51

52

53

54

55

56

57 Preuve de complétude Chaînage avant dérive toute phrase atomique qui est entraînée par KB 1.Il atteint un point fixe où aucune phrase atomique nouvelle est dérivée 2.Considérer cet état final comme un modèle m, qui assigne true/false aux symboles 3.Chaque clause dans la KB originale est vraie dans m a 1 … a k b 4.Donc, m est un modèle de KB 5.Si KB q, q est vraie dans chaque modèle de KB, y compris m 6.Donc, q peut être dérivée.

58 Chaînage arrière Idée: travailler vers arrière à partir de la requête q: Pour prouver q par chaînage arrière, Si q est déjà connue, ou Prouver par chaînage arrière toutes les prémisses dune règle dinférence qui conclut en q Éviter des boucles : vérifier si un nouveau sous-but est déjà dans le stack de buts (- comparer avec la recherche dans un graphe) Éviter la répétition : vérifier si le nouveau sous-but 1.est déjà prouvé vrai, ou 2.a déjà échoué dans sa preuve

59 Exemple de chaînage arrière

60

61

62

63

64

65

66

67

68

69 Chaînage avant vs. arrière Ch. avant est une procédure data-driven, automatique, inconsciente du problème à résoudre, –e.g., reconnaissances dobjet, décisions routine Peut faire beaucoup de travail non pertinent au but Ch. arrière est une procédure goal-driven, appropriée pour la résolution du problème, –e.g., où sont mes clés? Comment puis-je entrer dans un programme de doctorat? Complexité de Ch. arrière peut être beaucoup moins que linéaire à la taille de KB

70 Méthodes de preuve Méthodes de preuve divisées grosso modo en 2 catégories: –Model checking (Vérification de modèle) Énumération en utilisant une table de vérité (toujours exponentiel en n) Retour en arrière (backtracking) amélioré, e.g., Davis--Putnam- Logemann-Loveland (DPLL) Recherche heuristique dans lespace de modèles (adéquate mais non complet) e.g., algorithme hill-climbing qui favorise le conflit minimal –Application de règles dinférence Génération légitime (sound) de phrases nouvelles à partir des anciennes Preuve = une séquence dapplications de règles dinférence Peut utiliser les règles dinférence comme opérateur dans un algorithme de recherche standard Typiquement, ceci demande à transformer une phrase en une forme normale (pour simplifier la procédure)

71 Inférence propositionnelle efficace 2 familles dapproches efficaces pour linférence propositionnelle Algorithmes de recherche en arrière complète –Algorithme DPLL (Davis, Putnam, Logemann, Loveland) Algorithmes de recherche locale incomplète –Algorithme WalkSAT

72 Algorithme DPLL Déterminer si une phrase de logique propositionnelle en entrée (en CNF) est satisfiable. Améliorations sur lénumération de la table de vérité: 1.Terminaison hâtive Une clause est vraie si chaque littéral est vrai. Une phrase est fausse si une de ses clauses est fausse. 2.Heuristique de symbole pur Symbole pur: toujours apparaître avec le même « signe » dans toutes les clauses. e.g., Dans les 3 clauses (A B), ( B C), (C A), A et B sont purs, C nest pas pur. Faire un symbole pur vrai. 3.Heuristique de clause unité Clause unité: seulement un littéral dans la clause La seule littérale dans la clause doit être vraie.

73 Algorithme DPLL

74 Algorithme WalkSAT Algorithme incomplet, recherche locale Fonction dévaluation : heuristique de conflit min pour minimiser le nombre de clauses insatisfaites Compromis entre voracité et le caractère aléatoire

75 Algorithme WalkSAT

76 Problèmes de satisfiabilité difficiles Considérer des phrases 3-CNF aléatoires. e.g., ( D B C) (B A C) ( C B E) (E D B) (B E C) m = nb. de clauses n = nb. de symbols –Problème difficiles semblent apparaître autour de m/n = 4.3 (point critique)

77 Problèmes de satisfiabilité difficiles

78 Temps médiane pour 100 phrases 3-CNF aléatoires satisfiables, n = 50

79 Agent basé sur inférence dans le monde de wumpus Un agent du monde wumpus utilisant la logique propositionnelle : - Exprimer les observations et les règles du jeu P 1,1 W 1,1 B x,y (P x,y+1 P x,y-1 P x+1,y P x-1,y ) S x,y (W x,y+1 W x,y-1 W x+1,y W x-1,y ) W 1,1 W 1,2 … W 4,4 W 1,1 W 1,2 W 1,1 W 1,3 … 64 symboles de proposition distincts, 155 phrases

80

81 KB contient des phrases "physiques" pour chaque carré Pour chaque moment t et chaque place [x,y], L x,y FacingRight t Forward t L x+1,y Prolifération rapide de clauses Intractable pour des applications réelles Vers la logique de prédicats (logique de premier ordre) Limitation de capacité dexpression de logique propositionnelle t t

82 Sommaire Les agents logiques appliquent des inférences sur une base de connaissances pour dériver de nouvelles informations (conclusions) et prendre des décisions Concepts de base en logique: –syntaxe: structure formelle de phrases –sémantique: vérité de phrases par rapport aux modèles –entaînement: une phrase nécessairement vrai étant donné une autre –inférence: dériver des phrases à partir des autres phrases –Adéquation (soundness): des dérivations produisent seulement des phrases impliquée (conséquences logiques) –complétude: des dérivations peuvent produire toutes les phrases impliquées (conséquences logiques) Le monde de Wumpus demande la capacité de représenter des informations partielles et négatives, raisonner pour des cas, etc. La règle de résolution (et la procédure dinférence correspondante) est complète pour la logique de propositions Chaînage avant et arrière demandent un temps linéaire, sont complets pour des clauses Horn Logique propositionnelle manque dexpressivité


Télécharger ppt "Agents Logiques Chap. 7. Plan Agents basés sur des connaissances Le monde de Wumpus Logique en général – modèle et entraînement (entailment) Logique propositionnelle."

Présentations similaires


Annonces Google