La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Raisonnement à partir de cas : des fondements aux applications

Présentations similaires


Présentation au sujet: "Raisonnement à partir de cas : des fondements aux applications"— Transcription de la présentation:

1 Raisonnement à partir de cas : des fondements aux applications
Sophie Loriette-Rougegrez bureau H213 Laboratoire LM2S Université de technologie de Troyes 12, rue Marie Curie BP 2060 10010 TROYES cedex

2 Plan du cours Quand utiliser le ràpc ? Origines du ràpc :
Le modèle cognitif Le raisonnement par analogie Les étapes du ràpc Les techniques utilisées Le ràpc et les autres techniques de raisonnement Adresses et bibliographie

3 Pourquoi le RàPC ? Experience REGLES
Problème dans la construction de certains systèmes à base de connaissances : la connaissance s’adapte mal à une représentation déclarative sous forme de règles Experience REGLES

4 Exemples d’utilisation du RàPC
Diagnostic médical : “Les problèmes de ce patient sont très semblables aux symptômes de cette maladie” immobilier : Ma maison est très semblable à celle qui vient d ’être vendue au bas de la rue pour F domaine juridique : Ce licenciement abusif est en tout point similaire au dossier Dulino de mai 97

5 Quand utiliser le Ràpc ? lorsque ....
L ’expérience représente la plus grande partie des connaissances sur un sujet Les experts parlent de leur domaine en citant des exemples Les problèmes ne sont pas complètement compris (modèles faibles, connaissances du domaine faibles) Beaucoup d ’exceptions au cas général Besoin de construire une mémoire d’entreprise Un volume de données satisfaisant doit exister suffisantes

6 Principe sous-jacent au RàPC
Problème Nouveau problème Nouvelle solution Solution Nouveau problème = problème cible ancien problème = problème source Nouvelle solution = solution cible ancienne solution = solution source

7 Problème/Solution Pas de définition générale
Définition liée à chaque application Selon la tâche, la solution sera bien ou approximativement définie (classification/aide à la décision) la qualité de la solution pourra être évaluée Ex solution : diagnostic , plan en diagnostic, on peut définir l ’exactitude de la solution, pas en aide à la décision on peut avoir des critères qui ordonnent les solutions

8 Modèle cognitif du rapc
Influence majeure : recherches sur les processus liés à la compréhension La compréhension est vue comme un processus d ’explication notre connaissance permet de générer les explications Exemple : Cela suppose un certain nombre de prédictions pour lier les éléments du texte les uns aux autres. Frédéric est allé au restaurant. Il a commandé un menu végétarien. Quand on lit, on écoute, c ’est notre connaissance qui permet de faire le lien entre les différents éléments. Sous-entendu : Fred est client. « il » est Fred cr dans un restaurant, c ’est le client qui commande. Il avait à sa disposition un menu

9 Théorie des scripts Schank et Abelson (77) proposent une représentation de notre connaissance sous forme de scripts Les scripts représentent notre connaissance épisodique D ’autres formes de connaissance existent (buts, plans, etc.) déjà considérés dans les systèmes informatiques Les scripts sont supposés faciliter notre compréhension par expositions répétées à la même situation Scripts = alternative à la théorie des schémas (Brewer & Nakamura 84) Déjà à cette époque, on pense que les scripts doivent permettre d ’accumuler de nouveaux épisodes : structure dynamique Un script regroupe un ensemble de souvenirs ayant des points communs. Un premier souvenir est classé seul. Quand d ’autres souvenirs identiques avec celui-ci arrivent, un script est constitué avec les points communs. Les autres épisodes, ayant quelques différences avec le script , sont attaché au xscript. Intérêt est que le script décrit une séquence d ’attentes. Si une attente n ’est pas satisfaite, on peut se référer à un épisode qui lui non plus n ’a pas respecté cette attente

10 Insuffisances du modèle
Un script est supposé servir de référence dans la compréhension d ’un épisode. Ex : script « aller chez le dentiste » On doit pouvoir représenter des schémas généraux et des instances de ces schémas La théorie des scripts ne précise rien sur ce qui est créé en premier Un schéma général créé à partir de plusieurs instances ? Une première instance généralisée pour servir de schéma général ?

11 Insuffisances du modèle (suite)
Les scripts sont très détaillés Des scènes se répètent Redondance d ’informations, sans lien entre ses différentes instances - Coûteux - frein à la généralisation

12 Insuffisances du modèle (suite)
Expériences de Bower, Black, Turner (1979) Les résultats mettent en évidence des confusions entre scènes appartenant à des scripts différents Ils essayent de vérifier que les scripts sont un bon modèle de nos souvenirs. Ils demandent aux personnes de donner le script auquel est rattaché tel souvenir. Mais les personnes confondent des scènes communes à des scripts différents. Ex : « attente » chez le dentiste et le généraliste. Certains confondent événements qui se sont produits dans l ’une des salles d ’attente et le rattachent à l ’autre script

13 L ’accès aux connaissances épisodiques
Comment accède-t-on aux connaissances épisodiques ? Travaux de Schank et Abelson en 77 émettent l ’hypothèse suivant laquelle les mêmes algorithmes sont utilisés à la fois pour la recherche de la connaissance générale et de la connaissance spécifique L ’indexation doit permettre de décrire un cas suivant un type et selon en quoi ils se différencient les uns des autres Théorie de la mémoire dynamique (Schank 82)

14 Théorie de la mémoire dynamique (Schank 82)
Hypothèses se souvenir, comprendre, expérimenter, apprendre, sont des processus indissociables la mémoire évolue sous l ’influence de l ’expérience La compréhension se fait en rapprochant de nouvelles choses de ce que l ’on connaît déjà : les anciennes expériences générales ou spécifiques génèrent des attentes permettant de simplifier la compréhension Les MOP sont une représentation plus distribuée des situations Une situation = ens. De scènes une scène = 1 description indépendante : : 1 description normative + instances 1 scène -> 1 but Proposition de M.O.P.

15 MOP : consulter un professionnel
Séq. évts Le script « aller chez le dentiste » et le script « aller chez le mèdecin » sont généralisés en le MOP « aller chez un professionnel » un MOP est composé d ’un ensemble de scènes. Une scène a une description sous forme de séquence d ’événements. Les scripts correspondant à cette séquence d ’événements sont associés à la scène (ex : dentiste et mèdecin ont en commun la salle d ’attente). Plus tard, les cas correspondent aux séquences d ’événements anormales dans certains scripts. Scènes Serv. = phys. Exam.. Serv = toothage Scripts $toothage $exam

16 La scène « commande » Dans un MOP, un script contient une seule scène
Dans un MOP, on a de la connaissance générale au niveau MOP, scène, script, qui décrivent une « situation normale » Les cas décrivent des situations anormales, et sont indexés par les scripts

17 Autre origine : le raisonnement par analogie
"rapport, similitude partielle d'une chose avec une autre" ex : analogie atome/système solaire, l'analogie courant électrique/cours d'eau. Le raisonnement par analogie consiste à avoir recours à un élément mieux connu pour inférer des informations sur un élément qui l'est moins. Deux types d’analogie : analogie heuristique [Coulon et al ] et analogie recours [Bruneau et al. 89] Les travaux précédents montrent comment l’être humain, puis la machine, peuvent retrouver et représenter des souvenirs en mémoire. Le raisonnement par analogie montre comment exploiter ces souvenirs dans la résolution de problèmes. Le raisonnement par analogie Par définition, l'analogie désigne "rapport, similitude partielle d'une chose avec une autre". De nombreux exemples d'analogie existent dans notre entourage : l'analogie atome/système solaire, l'analogie courant électrique/cours d'eau. Le raisonnement par analogie consiste à avoir recours à un élément mieux connu pour inférer des informations sur un élément qui l'est moins. Il implique notamment l'évaluation de la ressemblance entre entités et leur mémorisation en vue de leur réutilisation. Depuis une vingtaine d'années, l'intelligence artificielle s'intéresse à ce raisonnement pour l'amélioration des performances des systèmes à base de connaissances. Plusieurs systèmes ont été implémentés [Hall 89]. Le premier, ANALOGY [Evans 68], résolvait des problèmes de géométrie proposés dans des tests d'intelligence. Finalités du raisonnement par analogie Le raisonnement par analogie est reconnu être très utilisé par l'être humain. Dans la vie quotidienne, face à une situation donnée, l'expérience d'une situation semblable peut s'avérer très utile. En intelligence artificielle, les systèmes mettent en œuvre ce raisonnement à diverses fins : pour la compréhension du langage naturel, la planification, etc. Il existe principalement deux contextes d'utilisation du raisonnement par analogie notamment dans le cadre de la résolution de problèmes : - la résolution du problème s'annonce particulièrement complexe et longue. L'utilisation de la solution d'un problème similaire déjà résolu permet d’accélérer le processus de résolution ; - dans le domaine considéré, il n'existe pas de théorie qui permette de résoudre le problème posé. L'utilisation d'un problème similaire résolu s'avère être la seule issue. La première analogie est qualifiée d'"heuristique", et la seconde d"analogie-recours". Les travaux de Jean-Marie David et Daniel Coulon [Coulon et al ] sur la compréhension de textes sont un exemple d'analogie heuristique : un texte à trous doit être complété à l'aide d'un texte complet. Plutôt que de considérer exhaustivement tous les mots susceptibles de le compléter, des liaisons entre les mots du texte complet sont recherchées pour déterminer les mots manquants du premier texte. Le système MARCO pour l'aide à la conception de logiciels modulaires [Bruneau et al. 89] utilise l'analogie-recours : la modification d'un logiciel repose entièrement ici sur l'utilisation d'un logiciel dont la conception est similaire.

18 Composantes Théorie de Spearman : 3 composantes
Théorie  componentielle de Sternberg (1977) : opérations mentales fondamentales Ordre contesté en 79 par Whitely et Barnes : approximations successives Gentner (83 ) : importance de l ’identification de relations de haut niveau

19 Le "carré" analogique  C A     D B   a b c
Le raisonnement par analogie a pour objectif l'inférence d'informations sur une situation (la cible) à partir de la description d'une situation dans laquelle ces informations sont connues (la source). Les deux composantes essentielles de l'analogie sont la mise en évidence des caractéristiques ou propriétés communes des situations et la détermination des relations intra- ou inter-domaines. En raisonnement par analogie, la ressemblance entre situations est basée souvent sur des critères syntaxiques. Le raisonnement à partir de cas au contraire compare plutôt des ensembles de descripteurs. Les composantes identifiées dans ce raisonnement et leur agencement ont conduit à des théories différentes [Cauzinille et al. 85]. Spearman propose très tôt trois composantes du raisonnement par analogie : l'appréhension de l'expérience, l'éduction de relations et l'éduction de corrélats. La théorie componentielle de Sternberg (1977) définit un comportement intelligent comme la mise en oeuvre d'opérations mentales fondamentales dont un sous-ensemble est utilisé par le raisonnement par analogie. Ces opérations sont l'encodage, l'inférence, la mise en correspondance, et le transfert. Leur ordre d'exécution est contesté par Whitely et Barnes en 79 pour qui l'ensemble fonctionne plus par approximations successives que séquentiellement. Gentner en 83 révèle l'importance de l'identification des relations dans les situations. Sa théorie privilégie la mise en correspondance de relations de haut niveau au détriment des relations entre faits isolés : c'est le principe de systématicité implémenté dans le système SME [Gentner et al. 86]. Formalisation et terminologie Le "paradigme d'analogie" définit l'analogie comme la mise en œuvre d'un mécanisme de mise en correspondance, ou de projection, entre des structures afin de transposer des connaissances d'un univers d'application à un autre, en fonction d'un certain point de vue pouvant correspondre à un but à atteindre ou un problème à résoudre. Il manipule deux entités appartenant chacune à un univers [Coulon et al ] pouvant être réorganisé selon le point de vue adopté. L'une des deux entités est utilisée pour inférer des connaissances sur la deuxième, elle appartient à l'univers de base, l'autre appartient à l'univers cible. Dans la description des mécanismes du raisonnement par analogie, ces deux entités sont appelées simplement "base" et "cible". L'univers Le terme "univers", quelquefois remplacé par celui de "domaine", désigne l'ensemble des connaissances relatives à un domaine donné. Il contient des éléments de description atomiques ou structurés et un ensemble de connaissances permettant d'inférer de nouvelles connaissances. Les relations L'intégralité du raisonnement analogique est basée sur le concept de relation. Deux types de relations sont utilisées : les relations de dépendance et les relations de correspondance. Les relations de dépendance sont internes aux entités base et cible. Les relations de correspondance les relient. Les relations de dépendance Les entités base et cible sont des descriptions de dépendance, potentiellement incomplètes. Elles consistent en un triplet (A, b0, B). A et B désignent deux éléments de description issus des univers considérés et b0 est une relation de dépendance entre A et B. L'existence de b0 signifie que A intervient dans la déduction de B. Si B se déduit de A alors b0 est une relation de détermination. Les relations de correspondance Les relations de correspondance a relient deux descriptions de dépendance base et cible (A, b0, B) et (C, b1, D) pouvant appartenir à deux univers différents, ou sont décomposées en relations de correspondance aa ab ac entre les couples constitués d'un élément de description de la base et de son "correspondant" dans la cible (fig. 1). La stratégie du raisonnement par analogie Les éléments de description A, B, C ou D peuvent être structurés et sont dans ce cas composés d'un ensemble d'entités. L'établissement des relations de correspondance se fait au niveau de ces entités en considérant leur rôle dans l'élément de description auquel elles sont associées, ou en fonction de leur rôle dans la relation de dépendance. La priorité donnée à l'un de ces rôles définit l'organisation des phases de recherche des relations de dépendance et de correspondance. Celle-ci détermine la stratégie du raisonnement analogique. Le choix de la stratégie dépend de la représentation initiale du problème. On distingue deux types de stratégie : - la stratégie dirigée par les relations de dépendance : la mise en correspondance est réalisée entre les descriptions de dépendance base et cible, à partir de l'identité des rôles des entités qui les composent sous contrainte des relations de dépendance. - la stratégie dirigée par les éléments de description : la correspondance est établie sous contrainte du rôle des entités dans leurs éléments de description. Dans la première stratégie, les relations de dépendance imposent les relations de correspondance. Dans la seconde, les relations de correspondance imposent les relations de dépendance. Bien souvent, ces contraintes ne sont pas suffisamment fortes en raison notamment de l'incomplétude potentielle de la représentation des descriptions de dépendance. Les deux stratégies sont alors utilisées conjointement jusqu'à détermination totale de la cible. Les différentes combinaisons des phases "recherche des relations de dépendance"/"recherche des relations de correspondance" définissent autant de modèles du raisonnement. La recherche éventuelle de la base qui sera utilisée pour le raisonnement, et la mise en forme préalable des univers en fonction de l'objectif du raisonnement constituent d'autres sources de variation de ce modèle. D B

20 Principales étapes du RàPC
Une situation cible Recherche de cas similaires dans la base de cas (<> BD) Adaptation de la solution trouvée Prix ? Cas similaires Adaptation Représentation des cas indexation des cas évaluation et comparaison de cas adaptation de cas

21 Généralités Cas une expérience Base de cas
les cas doivent être bien choisis : typiques, importants, etc. Similarité évaluer la ressemblance de 2 cas (ou la pertinence d ’un cas ?) Quand la solution est une action, il est important d ’avoir dans la base d ’autres cas pour décrire les effets de cette action (Gilboa et Schmeidler 95)

22 Généralités (suite) Similarité : locale (valeurs d ’attributs)
globale (ts attributs + poids). Recherche de cas BD : appariement exact CBR : appariement inexact L ’appariement doit être efficace

23 Généralités (suite) Adaptation
de petites différences peuvent engendrer des modifications importantes Apprentissage Objectif : améliorer les performances du système au fur et à mesure de son fonctionnement CBR peut être combiné à d ’autres modes de raisonnement En raisonnement par analogie, adaptation entredifférentes domaines en rapc, adaptation dans le même domaine, besoin de connaissances apprentissage inductif : à partir de plusieurs pb, solution, trouverune solution générale qui s ’applique. Ex : génération des arbres de décision pour des problèmes classifiés. Technique : stat, théorie info Application à amélioration de la base de cas, similarité (ajustement poids), adaptation

24 La représentation des cas

25 Qu'est-ce qu'un cas ? "Une connaissance contextualisée qui représente une expérience enseignant une leçon pour satisfaire les buts du raisonneur" (Kolodner 93) Circonstances ou situation relatifs à une personne, une chose, une action... Une chose qui a existé ou qui s'est réellement produite Des circonstances décrivant un contexte dans lequel a été prise une décision Une description de surface

26 Représentation des cas
Les cas sont souvent décrits par un ensemble de caractéristiques Année Modèle Constructeur Options Kilométrage

27 Contenu des cas Représentation minimale Extensions
description de problème solution Extensions Contexte (justification etc.) Liens avec d’autres cas Echecs rencontrés La représentation minimale est utilisée pour mesurer des ressemblances et adapter. Chaque application utilise sa propre structure de représentation. Des tentatives d ’uniformisation ont échoué

28 Formalismes de représentation
Frames (MEDIATOR (Kolodner and Simpson 89)), (Casey (Koton 89)) Objets : frames + héritage de procédures + envois de messages. KRL (Bobrow et Winograd 77) Logique des propositions/prédicats Vecteurs frames composés selon Kolodner de caractéristiques, dimensions, indices, selon Kolodner vecteurs surtout utilisés pour le MBR. Pas contextuel, ce n’est pas du cbr LEs réseaux sémantiques sont à l’essai

29 CHEF (Hammond 89)

30 Les cas de CELIA (Redmond 92)
Titre du cas - la voiture cale 1 3 11 2 4 5 6, 9 Cas = ensemble de fragments représentant un raisonnement de l ’enseignant. Chaque fragment correspond à un but de l ’enseignant. Les fragments sont indexés individuellement et contiennent le contexte dans lequel ils sont été utilisés, ce qui permet d ’y accéder directement. Le contexte inclut la description du problème initial (les dysfonctionnements du système diagnostiqué) et le résultat des actions entreprises jusqu ’à ce moment (ex : les tests faits et leurs résultats). Le contexte décrit la situation de résolution de problème dans lequel le but auquel il a été associé a été choisi par l ’enseignant. La dernière partie du contexte, le contexte interne, est privilégiée dans la recherche d ’un fragment. Le contexte interne représente l ’historique des actions entreprises. Dans le domaine du diagnostic, il y a un petit nombre d ’actions possibles. Les contextes internes sont donc appariés par dénombrement des actions partagées par le fragment recherché et celui examiné. Les fragments sont indexés par une structure de MOPs telle qu ’elle avait été proposée par Schank en 82. 7 8 10

31 CELIA Cas structurés en fragments
1 fragment -> 1 but de l ’enseignant fragments indexés individuellement contexte  fragment contexte = dysfonctionnements du système diagnostiqué + résultat des actions entreprises + historique des actions entreprises similarité sur la liste des actions entreprises et le but Indexation des fragments par une structure de MOP

32 CASE REPRESENTATION in REBECAS (Loriette-Rougegrez 95)
Case 3 (axis d) Instant tl Instant tk Instant ti Instant tj Propagation Vegetation Relief Wind

33 An axis in REBECAS source parameters target Relief Vegetation Wind
Propagation Coniferes 40 km/h, 140 ° 21/8/90 16:15 50 km/h 110 ° 21/8/90 17:00 21/8/90 16:30 (125°, 1400 m) 17:00 (125°, 1700m) Pins 1000 m 2300 m PAST FUTURE

34 L ’indexation

35 Indexation Objectif : pouvoir retrouver, rapidement, les bons cas. Les indices indiquent les circonstances dans lesquelles le cas peut être utile  indexation au moment de la constitution de la base de cas Déterminer en quoi un cas est proche de la nouvelle situation  recherche des cas les plus intéressants

36 Problématique de l ’indexation
Les succès et les échecs sont-ils indexés dans la même base de cas ? Les indices organisent-ils la base de cas sur des similarités ou différences (HYPO (Ashley 91)) ? A quoi accède-t-on ? Nombre de cas succès/échecs instances/généralisations ? Descriptions de problèmes/solutions ? L ’indexation est-elle nécessaire : plus proche voisins + implémentation parallèle suffisantes ? Stocker des échecs ou revoir l ’indexation ? Ou utiliser des démons (CHEF) ? CHEF : utilise des démons qui se déclenchent lorsque les conditions correspondant à un échec déjà rencontré, sont satisfaites. Les démons permettent de refaire les m^mes erreurs

37 Qualités requises pour les indices
Permettre de différencier les cas, et être annonciateurs de l ’issue du cas avoir un bon niveau d ’abstraction pour pourvoir rendre les cas utilisables dans différentes circonstances en évitant toutefois un niveau d ’abstraction trop élevé pouvant être à l ’origine d ’inférences multiples pour reconnaître les correspondances entre attributs couvrir l ’ensemble des cas pouvant se produire : le choix se fait essentiellement en fonction du domaine et des tâches à effectuer par le système

38 Indexation manuelle Etablir la check-liste
1. Lister les tâches faisant l ’objet de la recherche de cas, 2. Pour chaque tâche, déterminer les types de caractéristiques prédictives des solutions, 3. Idem pour les caractéristiques prédictives des issues, 4. Pour chaque type de caractéristique, calculer l ’ensemble des généralisations utiles de la caractéristique et s ’assurer que les caractéristiques choisies sont reconnaissables (disponibles pendant le raisonnement), 5. Créer la check liste en collectant l ’ensemble complet de caractéristiques à partir de la comparaison 2 à 2 des cas, déterminer ce qui permet de les différencier (ici on parle des valeurs et non des indices) (CYRUS) => souvent combinaison des 2. Aboutit généralement à un grand nombre d ’indices prédictifs, mais trop nombreux pour être prédictifs dans tous les cas.=> recherche du meilleur cas en 2 étapes ex : MEDIATOR (buts des disputants, types d ’objets disputés), CLAVIER (Hennessy et hinkle 92 )

39 Méthodes d'indexation automatiques
Méthodes statistiques permettent de déterminer les caractéristiques importantes, et de leur associer un poids utilisation a priori génération d ’explications : pour savoir comment indexer un cas, on explique l ’issue du cas. Les indices sont les éléments apparaissant dans l ’explication. méthode inductive Combinaison de plusieurs méthodes : manuelle + explications dans CHEF Les indices peuvent être calculés automatiquement à partir d’une liste donnée par le concepteur du systme, sur la base de sa connaissance du domaine. Par exemple, dans CHEF, les indices dans les cas représentant une recette sont la texture et le goût des aliments, la méthode de préparation et les ingrédients. L’indexation basée sur les explications (barletta & mark 88) indexe les cas individuellement. Cette méthode consiste à expliquer pourquoi une solution a ou n’a pas fonctionné. Les indices sont une généralisation des causes de cet échec ou de cette réusiite. Cette méthode demande une connaissance approfondie du domaine. Méthodes statisstiques (établissement des poids) : identifier les caractéristiques importantes, associer un poids, affinement dynamique par retour de l’utilisateur détermination manuelle des indices par confrontation des cas (cyrus) (indexation basée sur les différences) méthodes de généralisation : crée un ensemble d’indices pour des cas abstraits créées à partir de cas qui partagent le même ensemble de caractéristiques. Les caractéristiques non partagées servent à indexer les cas intiaux méthode inductie : identifier les caraxtéristiques les plus discriminantes : pas de connaissance nécessaire, peut traiter de grands ensembles de cas, lebowitz 87 méthode déductive : génération d’explications sur le rôle des caractéristiques : barletta et mark 88 CHEF : manuelle pour l ’accès normal aux cas, par explication pour les échecs

40 Indexation automatique par explication (knowledge-based)
création d ’explications par un système peut se faire par différentes méthodes : mécanisme de preuve, case-based (swale (kass et leake 88)) : stocke explications, règles (chef) expliquer quoi ? buts poursuivis lors de la réalisation de la situation décrite dans le cas utilise beaucoup de connaissances du domaine procède à une généralisation de l ’explication puis extrait les indices de l ’explication généralisée Avantage : les indices sont toujours liés à la réussite ou l ’échec décrit dans le cas

41 Indexation par induction
Intéressant lorsque le but guidant la recherche de cas est très bien défini. Les cas sont considérés comme des exemples illustrant des concepts Des algorithmes comme ID3 (Quinlan 86) sont alors utilisables Avantages : procède à un calcul rigoureux des indices permettant de distinguer et de représenter les cas ce calcul sert à organiser la base de cas. Temps d ’accès de l ’ordre de log(N) ne nécessite pas de connaissance du domaine Inconvénients : temps de calcul requiert une grande base de cas au départ pour exécuter l ’algorithme d ’induction Technique présente dans les outils de construction de systèmes rapc

42 Modèles qualitatifs Utilisés entre autres dans (Dattani and Bramer, 1995) Un modèle qualitatif contient des nœuds représentant des paramètres du domaine d ’application, et des arcs, représentant leurs relations (une flèche dans (Dattani and Bramer, 1995) indique un lien de précédence) Le modèle indique également en quoi une combinaison de caractéristiques affecte l ’issue du cas -> utilisé au cours de l ’indexation inductive Editeur de modèles dans REMIND

43 Utilisation des modèles qualitatifs
Immobilier (Dattani and Bramer 1995) Maintenance d ’avions (Dattani, Magaldi and Bramer 1996) Maintenance de réseaux de PC (Moss, Bramer and Dattani 1996)

44 La recherche du/des meilleur(s) cas

45 Rechercher quels cas ? Les cas utiles
un cas est utile s'il est similaire au nouveau problème selon des dimensions aidant le raisonneur à faire une tâche ou atteindre un but (Kolodner 93) il faut : un algorithme qui sache comment explorer la mémoire des algorithmes capables de choisir quels cas sont intéressants le nouveau problème On peut aussi rechercher des « fragments » de cas CELIA, REBECAS ! HYPO recherche des cas différents

46 La similarité ne suffit pas toujours
des informations peuvent avoir de l ’importance dans certains cas et pas dans d ’autres. Ex : âge du patient on doit rechercher les cas utiles. Notion subjective et variable dans le temps L ’utilité ne peut être calculée a priori mais la similarité peut l ’être. La similarité est une mesure objective

47 Propriétés souhaitées
La similarité entre le cas cible et le cas source implique une utilité du cas source la similarité est basée sur des faits connus la similarité peut être plus ou moins grande : nécessité de la quantifier

48 Fonctions d’acceptation
Origine : [Lenz et al. 98] cas cible noté q, cas considéré noté c On définit l ’acceptation entre c et q, notée acc(q, c) acc(q, c) est fonction des acceptations locales entre entités d ’informations (attributs-valeurs) (e,e ’), acceptation locale entre e et e ’, peut être forte pour 2 entités liées : e et e ’ similaires/e et e ’ contraires (e,e ’)=0 si e ’ est sans intérêt pour e (e,e ’)<0 si e ’ doit absolument être évité

49 Fonctions d ’acceptation (suite)
(e,e ’)peut être définie par une fonction floue représentant le domaine de l ’attribut ex : (été,mois = juin) Plusieurs entités e ’ peuvent être associées à une entité e: nécessité d ’une fonction locale d ’accumulation mois été 1

50 Fonctions d ’acceptation (suite)
Acceptation globale doit considérer l ’intérêt de chaque attribut dans c, pour q fonction de la pertinence de chaque ei dans c, des accumulations locales

51 Etablissement des correspondances entre entités d ’informations
noms heuristiques Gentner : favoriser les prédicats dans des structures les plus complexes, pas d’objets isolés.

52 Calcul de (e, e ’) hiérarchie d'abstraction
distance qualitative ou quantitative le degré peut être structuré pour la sélection (comme dans REBECAS)

53 Hiérarchies de symboles
Les caractéristiques décrites dans les cas sont souvent associées à des valeurs symboliques, La similarité de 2 symboles va dépendre de la proximité des symboles dans une hiérarchie d ’abstraction Les symboles sont regroupés dans des hiérarchies d ’abstraction

54 Types de recherche fonction du cas en cours d’étude :
recherche séquentielle --> organisation plate recherche hiérarchique --> organisation hiérarchique ==> appariement partiel par réseaux fonction d’un pattern (Template matching) ==> appariement exact autre organisation de la mémoire : réseau d’activation recherche du meilleur cas dépend des indices et de l’organisation de la base de cas en 86 (falkenhainer, forbus, gentner : the structgure mapping engine) : était déjà une préocucpation des chercheurs en analogie : utilisaient heuristiques pour contraintdre la recherche recherche : séquentielle, hiér’archique, pseudo-parllèle différence par rapport aux bd: appariement approximatif techniques utilisées : nn, induction, induction guidée par la connaissance, recherche de patterns, euvent être combinées nn = plus grand pb = détemrminer le poids des indices en O(n) : bien quand peu de cas. cf calcul de Remind induction : ID3(Quinlan 79) : cherche les caractéristiques qui discriminent le meiux les cs et génèren t un abre de décision induction guidée par la connaissance :identifie manuelemment les carqctéristiques rehcerche de patterns : comme requêtres SQL, permeet de limiter la base de cas à un portion, par exemple pour utiliser ensutie nn

55 Recherche séquentielle (méthode des plus proches voisins)
La base de cas est une liste chaque cas est testé + toute la base est examinée + qualité de la recherche = f(appariement) + ajout de cas facile - coûteux - Problème : déterminer le poids des caractéristiques - temps de la recherche est en 0(n) amélioation possible : indexation par toutes les caractéristuques, partitionner la base (par template retrieval par exemple) ((cas2 f1 f5 f9) (cas3 f6 f7 f8 f10)...)

56 Recherches hiérarchiques
indices organisés en arbre comparer les caractéristiques de chaque noeud aux caractéristiques correspondantes du nouveau problème descendre la hiérarchie rejeter le sous-arbre arbres conçus par les méthodes inductives recherche rapide deux conditions : une caractéristique "cible" et un nombre de cas significatif Exemples : mémoire dynamique, mémoire catégories/exemples Deux principaux modèles d’organisation : modèle de mémoire dynamique : principe : organiser les cas ayant des propriétés communes dans une structure plus générale : les caractéristiuqes communes aux cas indexés : dans cyrus : les GE (generalized episode) : indexent les cas. Hiérarchie de GE, aux feuilles : les cas. Les indices qui discriminent les cas un noueud = un GE, un nom d’idice, une valeur ou u cas cas peuvent doner lieu à création dynamique d’un ge Modèle des catégories/exemples (Porter & Bareiss 86) les cas sont considérés comme des exemples représentatifs d’une catégorie mémoire = réseau (catégories, relations sémantiques, cas , pointeurs vers cas ou catégories) un cas --> une catégorie les caractéristiques décrivant les cas ont ue importance différente selon la catégorie à laquelle ils sont associés types d’indices (ppointeurs) : caract --> cas catégorie --> cas associés catégorie --> cas différant légèrement des cas associés à la catégorie réseau sémantique de catégories un cas peut être fusionnés avec un autre cas si se ressemblent beaucoup

57 Réseaux de caractéristiques partagées
noeud = ensemble de caractéristiques partagées par les cas indexés par ce noeud ou un de ses descendants l’ordre des caractéristiques établissant la partition doit suivre leur importance + rapide - qualité de la structuration est temporaire algo : prendre les cas, déterminer les caractéristiques communes, faire un noeud, puis partager les cas selon une méthode de clustering, et recommencer la même chose sur les sous-ensembles

58 Disputes Disputant is a country Disputed object is a land mass
Disputant is a child disputed object is a food Physical dispute (Korea) Political dispute (Panama) Object is an orange disputants are sisters disputants are teens Object is candy (Candy) disputants want object as a whole (Orange1) Disputants want different parts of object (Orange2) Cas

59 Réseaux de discrimination
Chaque noeud est une question discriminant les cas indexés par ce noeud ou un de ses descendants L’ordre des caractéristiques établissant la partition doit suivre leur importance

60 Ownership of which piece ?
Dispute type ? Physical disputant goal ? Ownership Ownership of which piece ? Whole object ? Type of object ? Part of object Orange 2 Food ? Type of food ? Candy Fruit Orange 1 Land Korea Political Panama

61 Réseaux de discrimination redondants
traite l'incomplétude éventuelle des données réseaux parcourus en parallèle + des chemins différents pour chaque cas - occupation mémoire, ajout de cas coûteux ex : CYRUS

62 The actor is Cyrus Vance Participants are foreign diplomats
Diplomatic meetings The actor is Cyrus Vance Participants are foreign diplomats Topics are international contracts Participants talked to each other Goal was to resolve disputed contract Participants Topic Jérusalem Camp David Accords Begin Dayan SALT Gromyko EV3 EV4 EV2 EV2 MOP2 Participants include Begin Topics concern Israeli and Arabs MOP3 Topic is Camp David Accords Participants are israeli topics Participants Jérusalem Camp David accords Begin Dayan EV3 MOP4 MOP4 EV4

63 Réseaux de recherche de cas
1 cas = 1 descripteur + 1 ens. D ’IE E = ensemble de nœuds IE C = ensemble de nœuds cas = fonction de similarité entre 2 IE (e, c) : pertinence d ’un IE vis à vis d ’un cas  : ens. De fonctions de propagation entre noeuds

64 Recherche parallèle Un cas par processeur
cas = vecteur (caractéristiques de surface) pas d’indexation, appariement pondéré ex : MBRTalk (Stanfill & Waltz 86) ajout de cas facile, matériel coûteux Waltz : recherche parallèle sur toutes les caractéristiques de surface dans Simoudis, tient compte des caractéristiques calculées : recherche d’abord en parallèle, puis regarde les cas sélectionnés et en déduit les caractéristiques importantes dérivées à prendre en compte et recommence la recherche sur ces caractéristiques

65 Recherche de patterns Rôle identique à celui d’une requête dans une base de données ex : trouver les cas qui décrivent un taux d’endettement < 30% et un âge > 30 ans

66 Adaptation

67 Adaptation But : inférer des informations sur le cas en cours d’étude en fonction de ses caractéristiques et du cas sélectionné Trés spécifique au : domaine d'application tâche à réaliser représentation des cas

68 Techniques d ’adaptation
Ajustement de paramètres réinstanciation substitution basée sur les cas substitution basée sur un modèle simulation dérivationnelle ... ajustement de paramètres : compare les paramètres entre les deux cas et fait ajustement si nécessaire (judge) : si crime moins violent alors sentence moins grave abstraction/respécialisation: adaptation structurelle utilisée dans plexus (alterman 88), génère des solutions créatives basée sur des critiques: un critique analye les combinaisons de caractéristiques qui peuvent poser problème et utilise les techniques précédentes (persuader) réinstanciation : instancier les caractéristiques avec nouvelles (poulet/frites devient rosbeef/petits pois) simulation dérivationnelle : réécute la solution dans un nouveau contexte basée sur un modèle : celia substitution basée sur les cas : utilise les cas pour suggérer adaptation de la solution ACBARR

69 Evaluation du raisonnement

70 Evaluation et correction
L ’évaluation consiste à obtenir un retour sur le raisonnement effectué par le système Plusieurs sources : opérateur humain simulateur externe Evaluation bonne : cas stocké Evaluation mauvaise : explication de l ’échec (de la différence entre ce qu ’est la solution et ce qu ’elle aurait dû être) L ’échec devient une expérience enrichissant le système : modification de l ’organisation de la base, création de procédures, etc.

71 Les architectures hybrides
Intérêt : bénéficier de la puissance de différents modes de raisonnement : À base de cas, par règles, par satisfaction de contraintes, etc. OU Des techniques de raisonnement privilégiées : enchaînement séquentiel des méthodes On peut aussi faire appel à d ’autres raisonnements pendant le cbr : pour indexation, pour adaptation Des techniques de raisonnement considérées « égales » architectures « coopératives »

72 Variabilité du rapc Variantes suivant : aspect concret/général des cas
cas comme unité de stockage et traitement ou distribution des cas organisation plate/hiérarchique de la base de cas Quantité de connaissances du domaine disponibles degré d ’automatisation du système Petite/grande base de cas traitement séquentiel/parallèle des cas

73 Quelques adresses Informations générales et bibliographies
ftp://ftpagr.informatik.uni-kl.de/pub/CBR/

74 Althoff, Auriol, Barletta, Manago (95) : a review of industrial case-based reasoning tools, AI intelligence Bobrow D.G., Winograd T. 79 : KRL : another perspective, cognitive science 3 (1) Bower G.H., Black J.B., Turner T.J. 79 : Scripts in text comprehension and memory. Cognitive psychology 11: Brewer W.F., Nakamura G.V. : 84 : the nature and functions of schemas. In handbook of social cognition, ed. R.S. Wyer and T.K. Srull. Northvale, NJ : Erlbaum Bruneau 88 : Utilisation du raisonnement par analogie dans le cadre d ’une application pour la réutilisation de logiciels, thèse de doctorat, université de Rennes Coulon et al. 90 : D. Coulon, J.F. Boisvieux, L. Bourelly, L. Bruneau, E. Chouraqui, J.M. David, C.R. Lu, M. Py, J. Savelli, B. Seroussi, C. Vrain : Le raisonnement par analogie en intelligence artificielle, formalisation et applications, actes des 3ièmes journées nationales PRC-GDR IA, B. Bouchon-Meunier ed., Paris, 45-88 Gentner 83 : Struture-mapping : a theoretical framework for analogy, Cognitive science 7, Hammond 89 : Case-based planning : viewing planning as a memory task. Boston : Academic press Hennessy & Hinkle 92 : applying case-based reasoning to autoclave loading. IEEE Expert 7(5):21-26 Kass A.M., Leake D.B. 88 : Case-based reasoning applied to constructing explanations. In proceedings : Workshop on case-based reasoning (DARPa), Clearwater, Florida. San Mateo, CA : Morgan Kaufman Kolodner J. 93 : Case-based reasoning, Morgan Kaufman Kolodner J.L. and Simpson R.L. 89 : The MEDIATOR : analysis of n early case-based problem solver. Cognitive science 13(4): Koton P. 89: Using experience in learning and problem solving. Ph. D. diss., Department of Computer Science, MIT

75 M. Lenz, B. Bartsch-Spörl, H. D. Burkhard, S
M. Lenz, B. Bartsch-Spörl, H.D. Burkhard, S. Wess (Eds) : Case-based reasoning technology : from foundations to applications, Springer (1998) S. Loriette-Rougegrez (1998) : Raisonnement à partir de cas pour des évolutions spatio-temporelles de processus, Revue internationale de géomatique, journées CASSINI 1998, vol. 8, n°1-2/1998, pp , ENSG / Marne-la-Vallée, 26-27 novembre 1998 S. Rougegrez (1995) : Prediction without modelling : a demonstration of the use of case-based reasoning for the prediction of process behaviour, proceedings of Expert Systems 95, Applications and innovations in expert systems III, A. Macintosh & C. Cooper ed., Cambridge, pp Quinlan J.R. : induction of decision trees. Machine learning 1, Redmond M.A. 92 : Learning by observing and understanding expert problem solving. Georgia institutde of technology, college of computing technical report no. GIT-CC-92/43. Atlanta Schank R.C. 82 : Dynamic memory : a theory of learning in computers and people. New York: Cambridge university press Schank et Abelson (77) : Scripts, plans, goals and understanding. Northvale, NJ : Erlbaum Spearman C. (23) : the anture of intelligence and the prnciples of cognition, Londres, Mac Millan, 1923 Stanfill & Waltz 86 : Toward memory-based reasoning. Communications of the ACM 29(12) Sternberg (77) : intelligence, information processing, and analogicial reasoning : the componential analysis of human habilities, Hillsdale (NJ), Lawarence Erlbaum, 77 Whitely & Barnes (79) : The implication of processing event sequences for theories of analogical reasoning, Memory and Cognition 7,


Télécharger ppt "Raisonnement à partir de cas : des fondements aux applications"

Présentations similaires


Annonces Google