La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

1 Raisonnement à partir de cas : des fondements aux applications Sophie Loriette-Rougegrez bureau H213 Laboratoire LM2S Université

Présentations similaires


Présentation au sujet: "1 Raisonnement à partir de cas : des fondements aux applications Sophie Loriette-Rougegrez bureau H213 Laboratoire LM2S Université"— Transcription de la présentation:

1 1 Raisonnement à partir de cas : des fondements aux applications Sophie Loriette-Rougegrez bureau H213 Laboratoire LM2S Université de technologie de Troyes 12, rue Marie Curie BP TROYES cedex

2 2 Plan du cours Quand utiliser le ràpc ? Origines du ràpc : Le modèle cognitif Le raisonnement par analogie Les étapes du ràpc Les techniques utilisées Le ràpc et les autres techniques de raisonnement Adresses et bibliographie

3 3 Pourquoi le RàPC ? Problème dans la construction de certains systèmes à base de connaissances : la connaissance sadapte mal à une représentation déclarative sous forme de règles Experience REGLES

4 4 Exemples dutilisation du RàPC Diagnostic médical : Les problèmes de ce patient sont très semblables aux symptômes de cette maladie immobilier : Ma maison est très semblable à celle qui vient d être vendue au bas de la rue pour F domaine juridique : Ce licenciement abusif est en tout point similaire au dossier Dulino de mai 97

5 5 Quand utiliser le Ràpc ? L expérience représente la plus grande partie des connaissances sur un sujet Les experts parlent de leur domaine en citant des exemples Les problèmes ne sont pas complètement compris (modèles faibles, connaissances du domaine faibles) Beaucoup d exceptions au cas général Besoin de construire une mémoire dentreprise Un volume de données satisfaisant doit exister lorsque.... suffisantes

6 6 Principe sous-jacent au RàPC Problème Solution Nouveau problème Nouvelle solution Nouveau problème = problème cible ancien problème = problème source Nouvelle solution = solution cible ancienne solution = solution source

7 7 Problème/Solution Pas de définition générale Définition liée à chaque application Selon la tâche, la solution sera bien ou approximativement définie (classification/aide à la décision) la qualité de la solution pourra être évaluée

8 8 Modèle cognitif du rapc Influence majeure : recherches sur les processus liés à la compréhension La compréhension est vue comme un processus d explication notre connaissance permet de générer les explications Exemple : Cela suppose un certain nombre de prédictions pour lier les éléments du texte les uns aux autres. Frédéric est allé au restaurant. Il a commandé un menu végétarien.

9 9 Théorie des scripts Schank et Abelson (77) proposent une représentation de notre connaissance sous forme de scripts Les scripts représentent notre connaissance épisodique D autres formes de connaissance existent (buts, plans, etc.) déjà considérés dans les systèmes informatiques Les scripts sont supposés faciliter notre compréhension par expositions répétées à la même situation Scripts = alternative à la théorie des schémas (Brewer & Nakamura 84)

10 10 Insuffisances du modèle Un script est supposé servir de référence dans la compréhension d un épisode. Ex : script « aller chez le dentiste » On doit pouvoir représenter des schémas généraux et des instances de ces schémas La théorie des scripts ne précise rien sur ce qui est créé en premier Un schéma général créé à partir de plusieurs instances ? Une première instance généralisée pour servir de schéma général ?

11 11 Insuffisances du modèle (suite) Les scripts sont très détaillés Des scènes se répètent Redondance d informations, sans lien entre ses différentes instances - Coûteux - frein à la généralisation

12 12 Insuffisances du modèle (suite) Les résultats mettent en évidence des confusions entre scènes appartenant à des scripts différents Expériences de Bower, Black, Turner (1979)

13 13 L accès aux connaissances épisodiques Comment accède-t-on aux connaissances épisodiques ? Travaux de Schank et Abelson en 77 émettent l hypothèse suivant laquelle les mêmes algorithmes sont utilisés à la fois pour la recherche de la connaissance générale et de la connaissance spécifique Théorie de la mémoire dynamique (Schank 82)

14 14 Théorie de la mémoire dynamique (Schank 82) Hypothèses se souvenir, comprendre, expérimenter, apprendre, sont des processus indissociables la mémoire évolue sous l influence de l expérience Proposition de M.O.P.

15 15 MOP : consulter un professionnel Séq. évts Scènes $toothage $exam Serv = toothage Serv. = phys. Exam.. Scripts

16 16 La scène « commande »

17 17 Autre origine : le raisonnement par analogie "rapport, similitude partielle d'une chose avec une autre" ex : analogie atome/système solaire, l'analogie courant électrique/cours d'eau. Le raisonnement par analogie consiste à avoir recours à un élément mieux connu pour inférer des informations sur un élément qui l'est moins. Deux types danalogie : analogie heuristique [Coulon et al ] et analogie recours [Bruneau et al. 89]

18 18 Composantes Théorie de Spearman : 3 composantes Théorie componentielle de Sternberg (1977) : opérations mentales fondamentales Ordre contesté en 79 par Whitely et Barnes : approximations successives Gentner (83 ) : importance de l identification de relations de haut niveau

19 19 Le "carré" analogique A B C D a c b

20 20 Principales étapes du RàPC Une situation cible Recherche de cas similaires dans la base de cas (<> BD) Adaptation de la solution trouvée Prix ? Cas similaires Adaptation Représentation des cas indexation des cas évaluation et comparaison de cas adaptation de cas

21 21 Généralités Cas une expérience Base de cas les cas doivent être bien choisis : typiques, importants, etc. Similarité évaluer la ressemblance de 2 cas (ou la pertinence d un cas ?)

22 22 Généralités (suite) Similarité : locale (valeurs d attributs) globale (ts attributs + poids). Recherche de cas BD : appariement exact CBR : appariement inexact L appariement doit être efficace

23 23 Généralités (suite) Adaptation de petites différences peuvent engendrer des modifications importantes Apprentissage Objectif : améliorer les performances du système au fur et à mesure de son fonctionnement CBR peut être combiné à d autres modes de raisonnement

24 24 La représentation des cas

25 25 Qu'est-ce qu'un cas ? "Une connaissance contextualisée qui représente une expérience enseignant une leçon pour satisfaire les buts du raisonneur" (Kolodner 93) Circonstances ou situation relatifs à une personne, une chose, une action... Une chose qui a existé ou qui s'est réellement produite Des circonstances décrivant un contexte dans lequel a été prise une décision Une description de surface

26 26 Représentation des cas Les cas sont souvent décrits par un ensemble de caractéristiques Année Modèle Constructeur Options Kilométrage

27 27 Contenu des cas Représentation minimale description de problème solution Extensions Contexte (justification etc.) Liens avec dautres cas Echecs rencontrés

28 28 Formalismes de représentation Frames (MEDIATOR (Kolodner and Simpson 89)), (Casey (Koton 89)) Objets : frames + héritage de procédures + envois de messages. KRL (Bobrow et Winograd 77) Logique des propositions/prédicats Vecteurs

29 29 CHEF (Hammond 89)

30 30 Les cas de CELIA (Redmond 92) Titre du cas - la voiture cale ,

31 31 CELIA Cas structurés en fragments 1 fragment -> 1 but de l enseignant fragments indexés individuellement contexte fragment contexte = dysfonctionnements du système diagnostiqué + résultat des actions entreprises + historique des actions entreprises similarité sur la liste des actions entreprises et le but Indexation des fragments par une structure de MOP

32 32 CASE REPRESENTATION in REBECAS (Loriette-Rougegrez 95) Instant t i Instant t j Instant t l Instant t k Case 3 (axis d) Vegetation Relief Wind Propagation

33 33 An axis in REBECAS source parameters target parameters Relief Vegetation Wind Propagation Coniferes 40 km/h, 140 ° 21/8/90 16:15 50 km/h 110 ° 21/8/90 17:00 21/8/90 16:30 (125°, 1400 m) 21/8/90 17:00 (125°, 1700m) Pins 1000 m2300 m PASTFUTURE

34 34 L indexation

35 35 Indexation Objectif : pouvoir retrouver, rapidement, les bons cas. Les indices indiquent les circonstances dans lesquelles le cas peut être utile indexation au moment de la constitution de la base de cas Déterminer en quoi un cas est proche de la nouvelle situation recherche des cas les plus intéressants

36 36 Problématique de l indexation Les succès et les échecs sont-ils indexés dans la même base de cas ? Les indices organisent-ils la base de cas sur des similarités ou différences (HYPO (Ashley 91)) ? A quoi accède-t-on ? Nombre de cas succès/échecs instances/généralisations ? Descriptions de problèmes/solutions ? L indexation est-elle nécessaire : plus proche voisins + implémentation parallèle suffisantes ? Stocker des échecs ou revoir l indexation ? Ou utiliser des démons (CHEF) ?

37 37 Qualités requises pour les indices Permettre de différencier les cas, et être annonciateurs de l issue du cas avoir un bon niveau d abstraction pour pourvoir rendre les cas utilisables dans différentes circonstances en évitant toutefois un niveau d abstraction trop élevé pouvant être à l origine d inférences multiples pour reconnaître les correspondances entre attributs couvrir l ensemble des cas pouvant se produire : le choix se fait essentiellement en fonction du domaine et des tâches à effectuer par le système

38 38 Indexation manuelle Etablir la check-liste 1. Lister les tâches faisant l objet de la recherche de cas, 2. Pour chaque tâche, déterminer les types de caractéristiques prédictives des solutions, 3. Idem pour les caractéristiques prédictives des issues, 4. Pour chaque type de caractéristique, calculer l ensemble des généralisations utiles de la caractéristique et s assurer que les caractéristiques choisies sont reconnaissables (disponibles pendant le raisonnement), 5. Créer la check liste en collectant l ensemble complet de caractéristiques à partir de la comparaison 2 à 2 des cas, déterminer ce qui permet de les différencier (ici on parle des valeurs et non des indices) (CYRUS) => souvent combinaison des 2. Aboutit généralement à un grand nombre d indices prédictifs, mais trop nombreux pour être prédictifs dans tous les cas.=> recherche du meilleur cas en 2 étapes ex : MEDIATOR (buts des disputants, types d objets disputés), CLAVIER (Hennessy et hinkle 92 )

39 39 Méthodes d'indexation automatiques Méthodes statistiques permettent de déterminer les caractéristiques importantes, et de leur associer un poids utilisation a priori génération d explications : pour savoir comment indexer un cas, on explique l issue du cas. Les indices sont les éléments apparaissant dans l explication. méthode inductive Combinaison de plusieurs méthodes : manuelle + explications dans CHEF

40 40 Indexation automatique par explication (knowledge-based) création d explications par un système peut se faire par différentes méthodes : mécanisme de preuve, case-based (swale (kass et leake 88)) : stocke explications, règles (chef) expliquer quoi ? buts poursuivis lors de la réalisation de la situation décrite dans le cas utilise beaucoup de connaissances du domaine procède à une généralisation de l explication puis extrait les indices de l explication généralisée Avantage : les indices sont toujours liés à la réussite ou l échec décrit dans le cas

41 41 Indexation par induction Intéressant lorsque le but guidant la recherche de cas est très bien défini. Les cas sont considérés comme des exemples illustrant des concepts Des algorithmes comme ID3 (Quinlan 86) sont alors utilisables Avantages : v procède à un calcul rigoureux des indices permettant de distinguer et de représenter les cas v ce calcul sert à organiser la base de cas. Temps d accès de l ordre de log(N) v ne nécessite pas de connaissance du domaine Inconvénients : v temps de calcul v requiert une grande base de cas au départ pour exécuter l algorithme d induction Technique présente dans les outils de construction de systèmes rapc

42 42 Modèles qualitatifs Utilisés entre autres dans (Dattani and Bramer, 1995) Un modèle qualitatif contient des nœuds représentant des paramètres du domaine d application, et des arcs, représentant leurs relations (une flèche dans (Dattani and Bramer, 1995) indique un lien de précédence) Le modèle indique également en quoi une combinaison de caractéristiques affecte l issue du cas -> utilisé au cours de l indexation inductive Editeur de modèles dans REMIND

43 43 Utilisation des modèles qualitatifs Immobilier (Dattani and Bramer 1995) Maintenance d avions (Dattani, Magaldi and Bramer 1996) Maintenance de réseaux de PC (Moss, Bramer and Dattani 1996)

44 44 La recherche du/des meilleur(s) cas

45 45 Rechercher quels cas ? Les cas utiles un cas est utile s'il est similaire au nouveau problème selon des dimensions aidant le raisonneur à faire une tâche ou atteindre un but (Kolodner 93) il faut : un algorithme qui sache comment explorer la mémoire des algorithmes capables de choisir quels cas sont intéressants le nouveau problème On peut aussi rechercher des « fragments » de cas CELIA, REBECAS !

46 46 La similarité ne suffit pas toujours des informations peuvent avoir de l importance dans certains cas et pas dans d autres. Ex : âge du patient on doit rechercher les cas utiles. Notion subjective et variable dans le temps L utilité ne peut être calculée a priori mais la similarité peut l être. La similarité est une mesure objective

47 47 Propriétés souhaitées La similarité entre le cas cible et le cas source implique une utilité du cas source la similarité est basée sur des faits connus la similarité peut être plus ou moins grande : nécessité de la quantifier

48 48 Fonctions dacceptation Origine : [Lenz et al. 98] cas cible noté q, cas considéré noté c On définit l acceptation entre c et q, notée acc(q, c) acc(q, c) est fonction des acceptations locales entre entités d informations (attributs-valeurs) (e,e ), acceptation locale entre e et e, peut être forte pour 2 entités liées : e et e similaires/e et e contraires (e,e )=0 si e est sans intérêt pour e (e,e )<0 si e doit absolument être évité

49 49 Fonctions d acceptation (suite) (e,e )peut être définie par une fonction floue représentant le domaine de l attribut ex : (été,mois = juin) Plusieurs entités e peuvent être associées à une entité e: nécessité d une fonction locale d accumulation 1 0 mois été

50 50 Fonctions d acceptation (suite) Acceptation globale doit considérer l intérêt de chaque attribut dans c, pour q fonction de la pertinence de chaque ei dans c, des accumulations locales

51 51 Etablissement des correspondances entre entités d informations noms heuristiques

52 52 Calcul de (e, e ) hiérarchie d'abstraction distance qualitative ou quantitative

53 53 Hiérarchies de symboles Les caractéristiques décrites dans les cas sont souvent associées à des valeurs symboliques, La similarité de 2 symboles va dépendre de la proximité des symboles dans une hiérarchie d abstraction Les symboles sont regroupés dans des hiérarchies d abstraction

54 54 Types de recherche fonction du cas en cours détude : recherche séquentielle --> organisation plate recherche hiérarchique --> organisation hiérarchique ==> appariement partiel par réseaux fonction dun pattern (Template matching) ==> appariement exact

55 55 Recherche séquentielle (méthode des plus proches voisins) La base de cas est une liste chaque cas est testé + toute la base est examinée + qualité de la recherche = f(appariement) + ajout de cas facile - coûteux - Problème : déterminer le poids des caractéristiques - temps de la recherche est en 0(n) ((cas2 f1 f5 f9) (cas3 f6 f7 f8 f10)...)

56 56 Recherches hiérarchiques indices organisés en arbre comparer les caractéristiques de chaque noeud aux caractéristiques correspondantes du nouveau problème descendre la hiérarchie rejeter le sous-arbre arbres conçus par les méthodes inductives recherche rapide deux conditions : une caractéristique "cible" et un nombre de cas significatif Exemples : mémoire dynamique, mémoire catégories/exemples

57 57 Réseaux de caractéristiques partagées noeud = ensemble de caractéristiques partagées par les cas indexés par ce noeud ou un de ses descendants lordre des caractéristiques établissant la partition doit suivre leur importance + rapide - qualité de la structuration est temporaire

58 58 Disputes Disputant is a country Disputed object is a land mass Disputant is a child disputed object is a food Physical dispute (Korea) Political dispute (Panama) Object is an orange disputants are sisters disputants are teens Object is candy (Candy) disputants want object as a whole (Orange1) Disputants want different parts of object (Orange2) Cas

59 59 Réseaux de discrimination Chaque noeud est une question discriminant les cas indexés par ce noeud ou un de ses descendants Lordre des caractéristiques établissant la partition doit suivre leur importance

60 60 Dispute type ? Physical disputant goal ? Ownership Ownership of which piece ? Whole object ? Type of object ? Part of object Orange 2 Food ? Type of food ? Candy Fruit Orange 1 Land Korea Political Panama

61 61 Réseaux de discrimination redondants traite l'incomplétude éventuelle des données réseaux parcourus en parallèle + des chemins différents pour chaque cas - occupation mémoire, ajout de cas coûteux ex : CYRUS

62 62 Diplomatic meetings The actor is Cyrus Vance Participants are foreign diplomats Topics are international contracts Participants talked to each other Goal was to resolve disputed contract ParticipantsTopic BeginDayan Gromyko SALT Camp David Accords Jérusalem EV2 MOP3 Topic is Camp David Accords Participants are israeli EV3 EV4EV2 MOP2 Participants include Begin Topics concern Israeli and Arabs topicsParticipants Jérusalem EV3 Camp David accords MOP4 Begin MOP4 Dayan EV4

63 63 Réseaux de recherche de cas 1 cas = 1 descripteur + 1 ens. D IE E = ensemble de nœuds IE C = ensemble de nœuds cas = fonction de similarité entre 2 IE (e, c) : pertinence d un IE vis à vis d un cas : ens. De fonctions de propagation entre noeuds

64 64 Recherche parallèle Un cas par processeur cas = vecteur (caractéristiques de surface) pas dindexation, appariement pondéré ex : MBRTalk (Stanfill & Waltz 86) ajout de cas facile, matériel coûteux

65 65 Recherche de patterns Rôle identique à celui dune requête dans une base de données ex : trouver les cas qui décrivent un taux dendettement 30 ans

66 66 Adaptation

67 67 Adaptation But : inférer des informations sur le cas en cours détude en fonction de ses caractéristiques et du cas sélectionné Trés spécifique au : domaine d'application tâche à réaliser représentation des cas

68 68 Techniques d adaptation Ajustement de paramètres réinstanciation substitution basée sur les cas substitution basée sur un modèle simulation dérivationnelle...

69 69 Evaluation du raisonnement

70 70 Evaluation et correction L évaluation consiste à obtenir un retour sur le raisonnement effectué par le système Plusieurs sources : opérateur humain simulateur externe Evaluation bonne : cas stocké Evaluation mauvaise : explication de l échec (de la différence entre ce qu est la solution et ce qu elle aurait dû être) L échec devient une expérience enrichissant le système : modification de l organisation de la base, création de procédures, etc.

71 71 Les architectures hybrides Intérêt : bénéficier de la puissance de différents modes de raisonnement : À base de cas, par règles, par satisfaction de contraintes, etc. Des techniques de raisonnement considérées « égales » architectures « coopératives » Des techniques de raisonnement privilégiées : enchaînement séquentiel des méthodes OU

72 72 Variabilité du rapc Variantes suivant : aspect concret/général des cas cas comme unité de stockage et traitement ou distribution des cas organisation plate/hiérarchique de la base de cas Quantité de connaissances du domaine disponibles degré d automatisation du système Petite/grande base de cas traitement séquentiel/parallèle des cas

73 73 Quelques adresses Informations générales et bibliographies reasoning.html ftp://ftpagr.informatik.uni-kl.de/pub/CBR/

74 74 Althoff, Auriol, Barletta, Manago (95) : a review of industrial case-based reasoning tools, AI intelligence Bobrow D.G., Winograd T. 79 : KRL : another perspective, cognitive science 3 (1) Bower G.H., Black J.B., Turner T.J. 79 : Scripts in text comprehension and memory. Cognitive psychology 11: Brewer W.F., Nakamura G.V. : 84 : the nature and functions of schemas. In handbook of social cognition, ed. R.S. Wyer and T.K. Srull. Northvale, NJ : Erlbaum Bruneau 88 : Utilisation du raisonnement par analogie dans le cadre d une application pour la réutilisation de logiciels, thèse de doctorat, université de Rennes Coulon et al. 90 : D. Coulon, J.F. Boisvieux, L. Bourelly, L. Bruneau, E. Chouraqui, J.M. David, C.R. Lu, M. Py, J. Savelli, B. Seroussi, C. Vrain : Le raisonnement par analogie en intelligence artificielle, formalisation et applications, actes des 3ièmes journées nationales PRC-GDR IA, B. Bouchon-Meunier ed., Paris, Gentner 83 : Struture-mapping : a theoretical framework for analogy, Cognitive science 7, Hammond 89 : Case-based planning : viewing planning as a memory task. Boston : Academic press Hennessy & Hinkle 92 : applying case-based reasoning to autoclave loading. IEEE Expert 7(5):21-26 Kass A.M., Leake D.B. 88 : Case-based reasoning applied to constructing explanations. In proceedings : Workshop on case-based reasoning (DARPa), Clearwater, Florida. San Mateo, CA : Morgan Kaufman Kolodner J. 93 : Case-based reasoning, Morgan Kaufman Kolodner J.L. and Simpson R.L. 89 : The MEDIATOR : analysis of n early case-based problem solver. Cognitive science 13(4): Koton P. 89: Using experience in learning and problem solving. Ph. D. diss., Department of Computer Science, MIT

75 75 M. Lenz, B. Bartsch-Spörl, H.D. Burkhard, S. Wess (Eds) : Case-based reasoning technology : from foundations to applications, Springer (1998) S. Loriette-Rougegrez (1998) : Raisonnement à partir de cas pour des évolutions spatio-temporelles de processus, Revue internationale de géomatique, journées CASSINI 1998, vol. 8, n°1-2/1998, pp , ENSG / Marne-la-Vallée, novembre 1998 S. Rougegrez (1995) : Prediction without modelling : a demonstration of the use of case-based reasoning for the prediction of process behaviour, proceedings of Expert Systems 95, Applications and innovations in expert systems III, A. Macintosh & C. Cooper ed., Cambridge, pp Quinlan J.R. : induction of decision trees. Machine learning 1, Redmond M.A. 92 : Learning by observing and understanding expert problem solving. Georgia institutde of technology, college of computing technical report no. GIT-CC-92/43. Atlanta Schank R.C. 82 : Dynamic memory : a theory of learning in computers and people. New York: Cambridge university press Schank et Abelson (77) : Scripts, plans, goals and understanding. Northvale, NJ : Erlbaum Spearman C. (23) : the anture of intelligence and the prnciples of cognition, Londres, Mac Millan, 1923 Stanfill & Waltz 86 : Toward memory-based reasoning. Communications of the ACM 29(12) Sternberg (77) : intelligence, information processing, and analogicial reasoning : the componential analysis of human habilities, Hillsdale (NJ), Lawarence Erlbaum, 77 Whitely & Barnes (79) : The implication of processing event sequences for theories of analogical reasoning, Memory and Cognition 7,


Télécharger ppt "1 Raisonnement à partir de cas : des fondements aux applications Sophie Loriette-Rougegrez bureau H213 Laboratoire LM2S Université"

Présentations similaires


Annonces Google