La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Systèmes à Base de Connaissances (SBC) Master 1 GI.

Présentations similaires


Présentation au sujet: "Systèmes à Base de Connaissances (SBC) Master 1 GI."— Transcription de la présentation:

1 Systèmes à Base de Connaissances (SBC) Master 1 GI

2 Introduction à lIntelligence Artificielle (IA)

3 La machine modèle quelle comprenne un interlocuteur humain. quelle soit capable de réaliser les tâches que celui-ci lui demande. quelle réagisse avec « intelligence ».

4 Définition de lintelligence Selon LE PETIT LAROUSSE (1996): Aptitude mentale à comprendre et à raisonner Capacité de sadapter à son environnement…

5 Définition de lintelligence artificielle Une présupposition essentielle pour agir intelligemment dune manière générale est la capacité de produire et de manipuler des structures symboliques. (Allen Newell) Le but de lintelligence artificielle est létude de la structure de linformation et de la structure de processus de résolution de problèmes, indépendamment des applications et indépendamment dune réalisation. (John McCarthy.)

6 Quest ce que lIA concrètement. Rechercher (analyser, résoudre des problèmes, trouver des méthodes de résolution) Représenter des connaissances (logique, règles, mémoire, cas, langue naturelle, etc.) Mettre en application les idées 1 et 2 (Systèmes Experts, pilotes automatiques, agents dinterfaces, robots, Data Mining, etc.)

7 Historique de lintelligence artificielle 1943 : McCulloch et Pitts créent le modèle du neurone formel 1948 : Création de la cybernétique (science des systèmes) par Norbert Wiener : Hebb établit la première règle d'apprentissage neuronal 1950 Shannon, 1952 Samuel, 1953 Turing : machine pour jouer aux échecs 1956: Dartmouth Workshop - John McCarthy propose le terme « Artificial Intelligence » 1958: MIT – John McCarthy crée le « langage LISP »

8 Historique de lintelligence artificielle : Représentation des connaissances et inférences en logique formelle (Méthode de la résolution Robinson) 1965: Zadeh crée la logique floue 1965: Une équipe de Stanford University, sous la direction d'Ed Feigenbaum, réalise le 1er système expert (DENDRAL) Weizenbaum, J., (1966) ELIZA - A computer program for the study of natural language communication between man and machine. Communications of the ACM, 9.1: General Problem Solver (1969): résolveur de problèmes général 1970: PROLOG

9 Historique de lIA Le renouveau (les premiers systèmes experts) DENDRAL réalise l'analyse automatique des spectres de masse pour déterminer la structure moléculaire du corps chimique étudié. Heuristics Dendral : A program for generating explanatory hypotheses in organic chemistry. de B. Buchanan, Sutherland, Feigenbaum, Machine Intelligence, 1969 MYCIN diagnostique les maladies infectieuses du sang et propose un traitement approprié. Computer based medical consultations : MYCIN de E. Shortliffe, 1976 LIA institutionnalisée 1980-aujourdhui Une industrie (SE, Systèmes dapprentissage, interfaces ergonomiques, Data Mining, etc.)

10 Historique de lIA Les principaux langages de lintelligence artificielle Lisp (1960, J. MacCarthy) Prolog (1973, A. Colmerauer), Prolog avec contraintes SmallTalk (1972, A. Kay) JAVA (1994), C++, Scheme,...

11 Grands domaines de l'IA Reconnaissance et synthèse de la parole(ex: réservation dhôtel, 11artificiel ) Reconnaissance et synthèse d'images (ex. recherche dinfo) Reconnaissance de l'écriture (ex: recon. cheques, codes postaux) Langage naturel (ex: interfaces, text mining, Web Mining) Aide à la décision (ex: SE temps réels et autonome: contrôle de trajectoire du satellite Voyager) Aide à la programmation (ex: agents dinterface) Apprentissage / Adatptatif (ex: construction de systèmes experts, classification automatique de galaxie, contrôleurs de robots...) Jeux (e.g. Echecs(DeeperBlue à 2600), Checkers (Champion), Othello (Champion), BackGammon(champion), GO (bon amateur). Médecine: Aide à la décision (SE), prédiction de patients à risques, analyse automatique dimages médicales

12 IA, état de lart Les retombées de lIA sont partout objets, agents, méthodologies, représentation des connaissances approches causales, qualitatives fouille de données, fouille de texte statistiques non linéaires (réseaux neuronaux) programmation par contraintes nouvelles méthodes d optimisation (évolution artificielle)

13 Lun des objectifs majeurs de lI.A est la résolution de problèmes complexes et dérivant de domaines variés. Pour résoudre un problème donné, on a souvent besoin de manipuler des connaissances du domaine concerné. Ces connaissances nécessitent des modèles et des formalismes de représentation capables de les rendre utilisables sur ordinateur.

14 La représentation des connaissances nétant pas le but ultime, il faut que les connaissances représentées puissent être manipulées par un mécanisme de raisonnement approprié capable de fournir une solution au problème posé. En effet, représentation et raisonnement sont, dune manière ou dune autre, très liés. Dans un système à base de connaissances on a donc besoin a la fois : dun formalisme pour représenter les connaissances et dun mécanisme de raisonnement appelé souvent « moteur dinférence» qui est capable denchaîner des inférences sur les représentations de ces connaissances.

15 Connaissance ? [1] Cognition : faculté de « connaître » -> activités mentales (perception, raisonnement, mémoire, représentation, apprentissage, langage, conscience, émotions, …) Inférence : production dune connaissance Avec représentation de la connaissance (déclarative) Sans représentation de la connaissance (incorporée) Raisonnement : enchaînement dinférences avec un objectif SBC A Mille

16 Connaissance ? [2] Démontrer de la connaissance => démontrer une capacité à mobiliser des informations pour agir ou produire dautres capacités à agir (connaissances) Connaissance = information + mode demploi dans un contexte donné En IA: Connaissance = Information + Sémantique Pas de classement universel des différents types de connaissances SBC A Mille

17 Objectifs, attentes dun SBC Inscrire les connaissances en tant que connaissance (pas seulement en tant quinformation) dans un système : Pour « conserver » des savoirs, des savoir-faire et leur sémantique associée Disposer dun « moteur » permettant denchaîner des inférences sur ces inscriptions de connaissances : Pour « exploiter » les savoirs et savoir-faire ainsi « conservés » SBC A Mille

18 En matière de représentation de connaissances, on distingue –historiquement- deux paradigmes distincts : Le paradigme revendiquant la séparation entre les connaissances et le raisonnement (i.e. la manipulation de ces connaissances) et qui stipule donc une représentation déclarative des connaissances; Le paradigme dans lequel les connaissances et la manière de les manipuler sont inter-mêlées et qui opte donc pour une représentation procédurale des connaissances. I.Représentation des connaissances Introduction Fait1Fait i Fait 3Fait n Fait2 Raisonnement : Manipulation des faits Procédure 1 Procédure 2 Procédure i Procédure n Représentation déclarative Représentation Procédurale Quoi ?Comment ?

19 Il y a plusieurs raisons pour préférer la manière déclarative à la manière procédurale : La représentation déclarative peut être modifiée facilement par ajout ou suppression de nouveaux faits. Une même collection de faits peut être utilisée de différentes façons moyennant quelques simples modifications et ce, selon le problème à résoudre. Mieux encore, la représentation déclarative est souvent extensible au-delà de ce qui est explicitement représenté et ce, parce quelle est liée (malgré tout) à des processus de raisonnement adéquats qui permettent la dérivation dune connaissance additionnelle. I.Représentation des connaissances Introduction

20 La représentation procédurale a, toutefois, la particularité dêtre indispensable à toute implémentation sur machine. En effet, il y a toujours des connaissances difficiles à exprimer de manière déclarative et même celles, de nature déclarative, doivent à un moment ou un autre être manipulées par une procédure opératoire qui représente le mécanisme de raisonnement utilisé Autrement dit, il est nécessaire de spécifier la manière procédurale (le comment) dutilisation des connaissances déclaratives dans le but de trouver une solution au problème posé. Il en résulte quen I.A, on a souvent tendance à marier ces deux types de représentation avec, toutefois, une relative prédominance du déclaratif. I.Représentation des connaissances Introduction

21 Au-delà de cette fausse controverse « déclarative vs procédurale », la vraie difficulté réside dans le choix du formalisme à utiliser pour résoudre un problème relevant dun domaine donné. En effet, il n'existe pas de formalisme "idéal" de représentation de connaissances pour tous les problèmes en I.A. Chaque type de problèmes requiert le choix dun formalisme qui soit approprié à son domaine de connaissances. A ce niveau, les différents courants de lIA et les différentes positions concernant la nature du raisonnement intelligent ont leur influence –parfois de manière implicite- sur le choix du formalisme. Par exemple, les logiciens vont toujours préférer les formalismes logiques alors que les imitateurs du comportement humain vont plutôt préférer les réseaux sémantiques ou les frames voire les réseaux de neurones. I.Représentation des connaissances Introduction

22 Critères de choix dun formalisme : Voici quelques critères de choix dun formalisme de représentation qui sont assez objectifs : Expressibilité : la capacité à représenter toutes les connaissances pertinentes du domaine. Fidélité : la capacité de mappper facilement les connaissances du domaine avec leur représentation. Extensibilité : la capacité à acquérir de nouvelles connaissances. Adéquation ou correction inférentielle : la capacité à manipuler les connaissances par un mécanisme de raisonnement valide. Explication : la capacité dexpliquer –aux humains- les raisonnements effectués sur les connaissances (plus précisément leur représentation). Efficacité calculatoire : la capacité à guider le processus de raisonnement dans le choix des inférences à appliquer pour une résolution plus rapide. I.Représentation des connaissances Choix dun formalisme

23 Le choix dun formalisme pour la représentation des connaissances se fait en général parmi les trois catégories suivantes : Les formalismes logiques ; Les réseaux sémantiques ; Les hiérarchies dobjets structurés. Ces formalismes entrent dans le cadre des représentations déclaratives, mais, ils font appel à des représentations procédurales lorsquil sagit de manipuler les connaissances déclaratives pour trouver une solution à un problème donné. Il arrive aussi quune partie des connaissances du domaine soit à caractère particulièrement procédural. Certains formalismes permettent, dans ce cas, de les incorporer dans la représentation déclarative choisie sous forme dattachement procédural. I.Représentation des connaissances Choix dun formalisme

24 Les formalismes logiques et surtout la logique des prédicats jouent un rôle important dans tout ce qui relève de la représentation des connaissances et ceci est dû à plusieurs aspects de ces formalismes : Dabord, ils sont les premiers –chronologiquement parlant- formalismes utilisés en IA notamment pour les applications de démonstration automatique de théorèmes ; Certains formalismes peuvent être vus comme une variante syntaxique dune partie de la logique de prédicats ou lune de ces extensions ; Ils sont des formalismes purement syntaxiques dont la sémantique est rigoureusement définie ; Ils bénéficient dune base mathématique solide en termes de mécanismes de raisonnement qui procèdent uniquement par manipulation symbolique; On peut résumer ce qui précède en disant quils servent de référence pour les autres formalismes : Létude dun formalisme nest jamais complète sans une comparaison avec la logique des prédicats ou lune de ses extensions. I.Représentation des connaissances Formalismes Logiques

25 Logiques classiques: La logique des propositions : La plus simple parmi les formalismes logiques. Elle souffre dune limitation au niveau de son expressibilité (pas de quantification, pas de variables, etc.) Mais bénéficie de propriétés importantes en termes de décidabilité de ses mécanismes de raisonnement. La logique des prédicats : La logique des prédicats peut être vue comme une extension de la logique propositionnelle et elles forment ensemble ce quon appelle les logiques classiques. I.Représentation des connaissances Formalismes Logiques

26 Différentes Logiques : Le schéma suivant montre les différents types de logiques qui existent à lheure actuelle : I.Représentation des connaissances Formalismes Logiques

27 Logique des prédicats : La logique des prédicats est le résultat des travaux de Frege sur les systèmes formels vers la fin du 19 ième siècle. LIA, a su en tirer profit en lutilisant comme un formalisme de représentation de connaissance dans de nombreuses applications où la logique propositionnelle se déclarait insuffisante. Létude de la logique de prédicats comme un formalisme de représentation de connaissances comprend trois aspects : Laspect syntaxique concerne la définition de la syntaxe correcte des formules (dites bien formées) qui vont nous permettre décrire les énoncés concernant les faits du monde réel; Laspect sémantique concerne le calcul des valeurs de vérité des formules qui représentent ces faits en se basant sur linterprétation des différents éléments constituant ces formules ; Laspect raisonnement soccupe de létablissement de preuves formelles de la validité des formules (et donc des faits quelles représentent) en se basant sur des règles dinférence valides et des formules initiales valides. I.Représentation des connaissances Formalismes Logiques

28 Logique des prédicats : Lexemple de raisonnement classique qui suit illustre bien le principe de formulation avec la logique des prédicats : TOUT être humain est mortel. OR Socrate est un être humain. DONC Socrate est mortel. X être-humain(X) mortel(X) être-humain(Socrate) mortel(Socrate) I.Représentation des connaissances Formalismes Logiques

29 Logiques non classiques: Plusieurs genres de connaissances sont difficilement représentables en logique des prédicats surtout lorsquon désire rester le plus fidèle possible à la réalité. Voici des exemples de telles connaissances (exprimées en langage naturel) : « Il pleut assez souvent en hiver » : comment exprimer la fréquence dans le temps dun évènement ? et surtout comment sen servir dans le raisonnement ? « Moi, je pense que le Couscous est le plus délicieux repas au monde, mais Fatima pense que le Chawarma est le meilleur de tous» : comment exprimer différentes croyances ? « Ali a vu Hassan en premier, je lai vu juste après alors que Samir ne la vu que le lendemain » : Comment représenter la chronologie des évènements ? « Il fait très noir la nuit, sauf en jours de pleine lune» : comment exprimer des exceptions ? Pour augmenter lexpressibilité de la logique des prédicats, dautres logiques ont vu le jour, comme par exemple : La logique probabiliste, la logique des croyances, la logique temporelle, etc. I.Représentation des connaissances Formalismes Logiques

30 Logiques non monotones: Il existe également d'autres logiques dites non monotones qui permettent de représenter les connaissances relatives à des domaines où linformation est à la fois incomplète et évolutive. Elles violent le principe de la monotonie selon lequel, si S et S sont deux ensembles de formules et si S est inclus dans S, tout théorème démontrable à partir de S est également démontrable à partir de S. Dans les logiques non-monotones, il se peut quune formule qui a été démontrée comme étant valide, ne le reste plus lorsque les faits connus comme vrais sont augmentés. Le raisonnement par-défaut est un exemple de raisonnement non-monotonique. Il est utilisé lorsque les connaissances actuelles sont incomplètes et que certaines connaissances par-défaut (sorte destimations) peuvent être utilisées pour les compléter jusquà preuve de leur invalidité. I.Représentation des connaissances Formalismes Logiques

31 Logiques non monotones: Les systèmes de démonstration automatique basés sur de tels raisonnements non- monotoniques sont bien évidemment plus complexes à manier que les systèmes monotoniques. En effet, il faut à chaque nouveau fait ajouté (respectivement, supprimé) : Chercher quels faits ont été supposés vrais justement en se basant sur labsence (respectivement, lexistence) de ce fait nouvellement ajouté et quil faut donc supprimer de la base de faits; Chercher quels faits doivent être supprimés (respectivement, ajoutés) à leur tour puisque leur démonstration repose sur les faits qui viennent dêtre supprimés (respectivement, le fait qui vient dêtre ajouté). I.Représentation des connaissances Formalismes Logiques

32 Quelle Logique ? Comme conclusion, on peut dire que lutilisation de la logique des prédicats peut être extrêmement utile dans plusieurs applications comme celles de démonstration de théorèmes, surtout avec lexploitation des techniques heuristiques et autres techniques qui améliorent son efficacité. Toutefois, il existe des genres de connaissances qui sont difficilement formulables en logique de prédicats : la notion de temps, dincertitude et de croyance nen sont que des exemples et il en existe bien dautres. Les logiciens ont trouvé une solution à cette limitation en utilisant dautres logiques qui sont pour la plupart des extensions de la logique des prédicats. Par ailleurs, on peut penser à représenter et exploiter des connaissances sur les connaissances (méta-connaissances) ou à utiliser des logiques de deuxième ordre pour raisonner sur les prédicats eux-mêmes (en permettant que les quantifications portent sur les prédicats). Il faut, toutefois, garder à lesprit que lorsquon augmente lexpressibilité du formalisme logique utilisé, on perd malheureusement en simplicité et, parfois, en efficacité aussi. I.Représentation des connaissances Formalismes Logiques

33 Lutilisation des réseaux sémantiques comme formalisme de représentation de connaissances remonte aux travaux du linguiste Quillian (en 1968) sur la mémoire sémantique. En effet, les réseaux sémantiques sont très utilisés dans les travaux sur le traitement et la compréhension des langages naturels. Ce formalisme a comme caractéristique principale le fait que la signification dun concept dépend du réseau sémantique dans lequel il sinsère et de ses relations avec les autres concepts de ce réseau. Dans ce formalisme, les concepts du domaine à modéliser sont représentées par des nœuds et les relations entre concepts par des arcs étiquetés interconnectant les nœuds associés à ces concepts. Il peut être défini comme étant un formalisme de représentation structurée de connaissances sous forme de graphe sémantique. On rappelle quun graphe est une structure mathématique où nœuds et arcs nont pas de signification particulière alors que dans un réseau sémantique ils ont une signification spécifique doù lutilisation du mot sémantique. I.Représentation des connaissances Réseaux sémantiques

34 Parmi les concepts quun réseau sémantique sait très bien modéliser on trouve les concepts fortement hiérarchisés où les relations entre concepts sont de type : est-un sous-ensemble de (arc isa) ou est-un élement de, comme ceci est illustré dans lexemple suivant : I.Représentation des connaissances Réseaux sémantiques

35 Types darcs Les types darcs les plus utilisés dans les réseaux sémantiques sont : Est-un- élément Est-un- sous-ensemble Partie de (constituant, attribut) Relations prédicatives darité 3 ou plus Relations spatiales Relations temporelles Fonction... I.Représentation des connaissances Réseaux sémantiques

36 Types dinférences Le raisonnement dans un réseau sémantique se base essentiellement sur la recherche de chemin le long des arcs afin de trouver de nouvelles associations entre les nœuds (concepts). Il exploite trois grands types dinférence: Inférence par héritage Inférence par composition de relations Inférence par propagation dactivation I.Représentation des connaissances Réseaux sémantiques

37 Types dinférences Inférence par héritage : Elle permet lhéritage de propriétés des nœuds pères vers les nœuds fils dans le cas où ces nœuds sont liés par des arcs est-un (on parle dune hiérarchie est-un). Par exemple, un chien hérite toutes les propriétés dun être-vivant. Elle permet donc une réduction des connaissances explicitement représentées (il est inutile de répéter pour chaque nœud les propriétés des nœuds pères). Il faut, toutefois, gérer les exceptions concernant les cas où des propriétés des nœuds pères ne sont pas héritées par certains nœuds fils. Par exemple : Ali est un homme mais il ne doit pas hériter de la propriété davoir quatre pattes du concept père Animaux. En effet, les propriétés associées aux nœuds de plus haut niveau doivent être vues comme des propriétés par défaut qui peuvent être annulées par des propriétés plus spécifiques associées à des nœuds de plus bas niveau dans la hiérarchie. Dune manière générale, il faut définir les règles d'héritage afin déviter des inférences erronées. I.Représentation des connaissances Réseaux sémantiques

38 Types dinférences Inférence par composition de relations : Le cas le plus typique est le cas des relations transitives, où la composition n fois dune telle relation donne la relation de départ. Par exemple, à partir dun réseau sémantique où les relations doigt est-une-partie de Main et Main est-une-partie de Corps sont représentées par des arcs, on peut inférer la relation doigt est-une-partie de Corps. De manière plus générale, on peut inférer lexistence dune relation r (donc dun arc) entre deux nœuds n1 et n2 sil existe un chemin entre n1 et n2 qui fait intervenir k relations r1, …, rk telles que : r1 r2 …. rk = r. I.Représentation des connaissances Réseaux sémantiques

39 Types dinférences Inférence par propagation dactivation : Cette technique date des premiers travaux de Quillian sur les réseaux sémantiques. Son objectif est dinférer une relation entre deux nœuds (ou plusieurs), en se basant sur les relations (arcs) existantes entre ces nœuds et dautres nœuds du réseau. Par exemple, on désire savoir sil existe des hommes qui mangent des chiens et on a le réseau suivant : M1 M2 Arc Manger trouvé I.Représentation des connaissances Réseaux sémantiques

40 Remarques finales La représentation de connaissances est comme tout sujet de recherche relevant de lIA est lobjet de beaucoup de controverses. Au-delà de ces polémiques, nous devons retenir que chaque type de formalisme a ses points forts et ses points faibles. Il nexiste pas de formalisme idéal pour tout type de problèmes ou pour toute sorte dapplications. Certains problèmes requièrent même plusieurs formalismes pour la représentation de leurs différents aspects. Lors du choix dun formalisme pour la résolution dun problème particulier, on doit veiller entre autre à ce que : toutes les connaissances nécessaires à la résolution du problème puissent être représentées (cf. critère dexpressibilité). la manipulation des connaissances pour la résolution du problème soit facilitée par le formalisme (cf. critères dadéquation inférentielle et defficacité calculatoire). I.Représentation des connaissances Conclusion

41 Remarques finales Il ny a pas donc de règle générale pour le choix dun formalisme, mais lon sait, toutefois, que : les formalismes logiques (en particulier, la logique des prédicats) sont plus appropriés lorsque les connaissances du domaine étudié sont uniformes et peu sujettes au contexte de telle sorte quelles peuvent être vues comme une théorie du domaine. les formalismes structurés comme les réseaux sémantiques et les frames peuvent être plus efficaces pour la résolution de certains types de problèmes relevant de domaines où les connaissances sont, par exemple, de nature taxonomique. La tendance actuelle semble privilégier des représentations hybrides comme les logiques de description, les ontologies du Web sémantique qui tentent de marier la rigueur sémantique de la logique des prédicats à lefficacité inférentielle des systèmes à base de frames ou dobjets. I.Représentation des connaissances Conclusion

42 Les années 70 ont connu le développement des systèmes experts (SE) qui se basaient sur le paradigme revendiquant la séparation entre les connaissances et le raisonnement et qui stipule donc une représentation déclarative des connaissances. Les SE en exploitant ce paradigme ont pu résoudre des problèmes jusqu'ici insolvables par des programmes I.A ou informatiques plus classiques. Parmi les domaines où les SE ont pu faire leur preuve, on trouve : le diagnostic médical, le domaine juridique, la conception en électronique, la planification, etc. Ces domaines sont caractérisés par le fait quils nécessitent une certaine expertise et une capacité à raisonner sur des données volumineuses, incomplètes ou incertaines. II.Systèmes experts Introduction

43 Comment définir un SE? Il est difficile de définir de manière précise et unanime ce que cest un SE. Une des définitions les plus courantes est celle de Feigenbaum qui stipule que : " Un système expert est un programme conçu pour raisonner habilement à propos de tâches dont on pense quelles requièrent une expertise humaine considérable". Cette définition se base sur la notion dhabilité de raisonnement, alors quelle peut sappliquer aussi bien aux SE quà dautres systèmes de résolution de problèmes. En outre, il faut avouer que les systèmes experts nutilisent que des schémas très rudimentaires de raisonnement. Néanmoins, en ce qui concerne lexpertise humaine requise, cette définition met le doigt implicitement sur le besoin de traduire et de modéliser le savoir-faire des experts ou spécialistes humains de façon à ce quune programmation sur des machines soit possible. II.Systèmes experts Introduction

44 Cette tâche de modélisation des connaissances dun expert relativement à un domaine particulier est souvent abordée comme une traduction de ces connaissances en un ensemble de règles. Chacune règle stipule quel genre daction un expert aurait entrepris pour faire face à une situation donnée (les mots action et situation doivent être compris dans le sens large des termes). Une action peut être de type procédurale ou purement déclarative comme lajout dune nouvelle connaissance. Une règle peut alors être formalisé comme suit : Si situation(s) alors action(s). II.Systèmes experts Introduction

45 Un SE peut donc être défini comme étant « un système informatique capable de mettre en œuvre des connaissances pour imiter le comportement et/ou le raisonnement des experts humains dans des domaines dexpertise qui sont souvent basés sur un gros volume de connaissances ». Parmi les premiers points quun concepteur de SE doit considérer cest la question portant sur la manière de représenter la grande quantité de connaissances que le système doit gérer. Du fait de la tendance à exprimer ces connaissances sous forme de règles, la plupart des SE optent soit pour une représentation à base de règles de production soit à base du langage des prédicats. Une fois le formalisme choisit, il reste à décider du langage spécifique à utiliser pour exprimer les connaissances. II.Systèmes experts Composants dun SE

46 Ces connaissances ont besoin dune structure daccueil - connue sous le nom de base de connaissances- où elles seront sauvegardées. La nature et les caractéristiques de cette base vont varier dun système à un autre. Le SE doit disposer, en outre, dun système de contrôle et de raisonnement sur ces connaissances capable de répondre aux questions qui seront posées par les futurs utilisateurs du système. Ce système est connu dans le jargon des SE sous le nom de moteur dinférence et il doit être assez général et indépendant du domaine concerné. Enfin, pour quun système expert soit un outil efficace, il doit être capable dinteragir avec ces utilisateurs dans le sens où il doit pouvoir : Fournir une interface pour acquérir ou modifier les connaissances et aussi pour recevoir les questions ; Expliquer son raisonnement et les réponses quil donne pour les questions. II.Systèmes experts Composants dun SE

47 Tout SE digne de ce nom doit suivre normalement le principe de fonctionnement suivant : II.Systèmes experts Fonctionnement dun SE

48 On remarque que la base de connaissances est elle-même composée de : une base de règles ; une base de faits. La base de règles modélise la connaissance générale de lexpert du domaine considéré et ce, sous forme de règles codées avec le langage utilisé par le système. La base de faits contient des connaissances plus spécifiques et qui concernent les informations connues sur le problème (le cas) en cours. II.Systèmes experts Fonctionnement dun SE

49 La base de faits est amenée à senrichir au fur et à mesure quun utilisateur ajoute des faits -via linterface- ou suite, éventuellement, aux réponses aux questions quil aurait posées. Un utilisateur (non-expert) peut également modifier ou supprimer des faits de la base de faits mais il ne doit pas toucher à la base de règles. Lexpert, lui, peut ajouter, modifier ou supprimer des règles de la base des règles. Signalons ici que les SE noffrent pas toujours cette possibilité de modification de la base de règles qui peut être figée une fois pour toute. II.Systèmes experts Fonctionnement dun SE

50 Le moteur d'inférence selon les questions posées par lutilisateur –via linterface- raisonne sur les informations contenues dans la base de connaissance afin daboutir à des déductions dont certaines seront fournies comme réponses –via linterface- aux questions posées et éventuellement sauvegardées dans la base de faits. Rappelons que l'indépendance entre la base de connaissances et le moteur d'inférence est une caractéristique essentielle des SE et cest elle qui permet de faire évoluer la base de connaissances du système sans avoir à agir sur le moteur dinférence qui peut être valide pour différents types de problèmes. Toutefois, il est souvent nécessaire d'organiser la base de connaissances, de réfléchir sur les stratégies d'utilisation des règles, pour faciliter la tâche au moteur dinférences. II.Systèmes experts Fonctionnement dun SE

51 Généralement un SE concerne un domaine d'application bien précis. Il est, dans ce cas, livré avec une base de règles préalablement remplie avec les règles qui traduisent le savoir-faire des experts du domaine concerné. Néanmoins, il existe sur le marché de nombreux SE généraux appelés également des générateurs de SE ou encore des noyaux. Il sagit, en effet, doutils de développement de SE particuliers. Un tel système contient une interface, un moteur d'inférences, un langage de codage des connaissances et une structure daccueil de ces dernières. II.Systèmes experts Fonctionnement dun SE

52 Un tel système permet de créer des SE distincts dont chacun est spécifique à un domaine particulier pour peu que le langage utilisé permette de décrire les connaissances du domaine. Voici quelques exemples de SE généraux : VP-Expert (valable pour des domaines peu complexes) PROLOG (ce langage de programmation logique peut être considéré comme un générateur de systèmes experts) SMECI (un générateur datant du milieu des années 80) II.Systèmes experts Fonctionnement dun SE

53 Cycle de travail Le moteur d'inférence (appelé parfois moteur de résolution) est le cœur dun SE. Il peut être indépendant du domaine d'application et il doit être capable dexploiter la base des connaissances afin de résoudre les problèmes posés par les utilisateurs. En effet, il doit être capable de voir quelles sont les règles applicables au vu de létat courant de la base des faits et des faits à établir (exprimant les problèmes /questions posés par lutilisateur). Ce processus de détection des règles applicables fait partie du cycle de travail dun moteur dinférence et particulièrement de sa phase dévaluation. La deuxième phase de ce cycle est la phase dexécution qui, comme son nom lindique, concerne lexécution de la partie action des règles sélectionnées lors de la phase dévaluation et donc la modification de la base de faits. II.Systèmes experts Moteur dinférence

54 Cycle de travail La phase dévaluation seffectue généralement en trois étapes : La sélection : cette étape optionnelle concerne une première sélection dun sous- ensemble de règles dans la base des règles qui –à priori- mérite dêtre considéré dans létape suivante. Ce choix dépend de létat courant de la base de faits. Le filtrage (pattern matching) : Parmi lensemble retenu à létape précédente, cette étape retient un sous-ensemble, dit de conflit, qui contient seulement les règles effectivement applicables qui sont, généralement, celles dont le côté gauche (côté situation dit aussi prémisses) est satisfait au vu de létat actuel de la base de faits. La résolution de conflits : Parmi les règles retenues suite au filtrage, le moteur décide de la (des) règle(s) qui sera (seront) exécutée(s). La résolution de conflit est souvent indépendante du contexte dapplication et de la sémantique des règles, mais, elle est généralement guidée par des soucis defficacité (par exemple, choix des règles les moins complexes). Toutefois, des informations heuristiques ou des métarègles peuvent être exploitées pour fixer un ordre de priorité entre ces règles. II.Systèmes experts Moteurs dinférence

55 Cycle de travail II.Systèmes experts Moteurs dinférence Dans la figure ci-contre, il est illustré comment, en général, un moteur d'inférence enchaîne des cycles de travail composés de deux phases. Larrêt de ce cycle peut survenir dans : la phase dévaluation (par exemple, dans le cas dabsence de règles applicables à la situation en cours) la phase dexécution (par exemple, dans le cas de lexécution dune règle dont la partie action commande larrêt du cycle).

56 Caractéristiques Lobjectif recherché par un moteur dinférence lorsquil enchaîne des cycles de travail est de trouver une solution au problème (question) posé. Ceci peut être modélisé comme le parcours dun arbre de recherche dont la racine correspond à létat initial de la base de faits et les différents arcs correspondent à lapplication dune règle particulière à un état de la base de faits. La manière dont cette recherche est effectuée dépend des caractéristiques du moteur dinférence utilisé qui peuvent être divisées en quatre catégories : Formalisme utilisé (généralement basé sur les logiques classiques ou ses extensions) ; Stratégie de recherche ou de résolution de conflit ; Type de raisonnement ; Régime de contrôle ; Mode de chaînage. II.Systèmes experts Moteurs dinférence

57 Stratégie de recherche Les stratégies les plus fréquentes sont les suivantes : Stratégie en profondeur d'abord ; Stratégie en largeur d'abord ; Stratégie LEX: règles triées par fraîcheur (recency) des faits de leurs conditions ; Stratégie basée sur la complexité: les règles dont le nombre de ces faits/conditions est le plus grand sont les plus prioritaires ; Stratégie basée sur la simplicité: les règles dont le nombre de leurs faits/conditions est le plus petit sont les plus prioritaires ; Stratégie basée sur les méta-règles. II.Systèmes experts Moteurs dinférence

58 Type de raisonnement Un moteur dinférence peut être basé sur une théorie logique monotone ou non. Lorsquun moteur adopte un raisonnement monotone, aucun fait établit (considéré comme vrai) et inséré dans la base de faits ne peut être nié (considéré comme faux) et retiré de la base de faits. Les moteurs dinférence monotones ne permettent pas de traiter convenablement les problèmes dynamiques dont la nature même fait que les faits changent en permanence. II.Systèmes experts Moteurs dinférence

59 Régime de contrôle Un moteur dinférence peut être caractérisé par sa conduite dans le cas où sa phase dexécution déboucherait sur un échec (par exemple, si R3 est vide). A ce niveau, il existe deux types de conduite : Les choix pris (ensemble R3 des règles à appliquer) ne sont jamais remis en cause et donc si R3 est vide ceci est traduit définitivement comme un échec. On dit alors que ce type de moteur suit un régime irrévocable. Lorsquon peut remettre en cause l'application d'une règle si ce choix débouche sur un échec, le régime appliqué est dit par tentatives et il se base sur le principe de retour arrière (backtracking) pour essayer une règle écartée. Les moteurs dinférence qui adoptent un régime par tentatives suivent généralement des stratégies en profondeur d'abord puisque avec une stratégie en largeur le retour arrière est, en principe, inutile. II.Systèmes experts Moteurs dinférence

60 Mode de chaînage Trois modes de chaînage peuvent être utilisés : le chaînage avant ; le chaînage arrière ; le chaînage mixte. II.Systèmes experts Moteurs dinférence

61 Chaînage avant Dans ce mode (connu aussi comme le mode guidé par les données), le moteur d'inférence procède comme suit : Il ne sélectionne que les règles dont les conditions (prémisses) sont satisfaites au vu de létat de la base de faits pour arriver au but recherché (un fait qui répond à la question posée). Il applique ensuite une de ces règles afin dajouter dautres faits à la base. Cet enchaînement est réitéré jusqu'à ce que plus aucun fait nouveau ne puisse être déduit (on parle alors de saturation) ou que le but soit atteint. Le chaînage avant procède généralement par régime irrévocable et monotone et il a lavantage dêtre simple à implémenter tout en permettant de répondre plus rapidement à tout nouveau fait ajouté. Il est, toutefois, sujet au risque de lexplosion combinatoire car il sélectionne toutes les règles même celles sans intérêt pour la résolution du but. II.Systèmes experts Modes de chaînage

62 Chaînage avant Fonctionnement : II.Systèmes experts Modes de chaînage

63 Chaînage arrière Un moteur d'inférence qui suit ce mode de chaînage, part du but et essaie de remonter aux faits pour le prouver (parcours guidé par le but). En effet, le moteur sélectionne les règles dont la partie action (ou conclusion) correspond au but recherché. Les prémisses/conditions (partie situation) de ces règles deviennent elles aussi des sous buts à prouver et ainsi de suite. Cet enchaînement sarrête lorsque tous les sous buts sont prouvés- le but est alors lui aussi prouvé - ou lorsquil nest plus possible de sélectionner des règles. Le chaînage arrière nécessite un régime de contrôle par tentatives. Le moteur d'inférence opère alors un retour arrière (backtracking) pour remettre en cause l'application d'une règle qui débouche sur un échec et pour essayer une règle écartée précédemment. II.Systèmes experts Modes de chaînage

64 Chaînage arrière Fonctionnement: II.Systèmes experts Modes de chaînage

65 Chaînage mixte Le chaînage mixte est une combinaison du chaînage avant et du chaînage arrière. Un moteur qui suit ce mode opère généralement comme suit : Tant que des règles sont applicables (conditions satisfaites), il procède par chaînage avant jusquà satisfaction du but ou jusquà saturation de la base de faits ; Si le but nest toujours pas prouvé, il choisit alors une règle dont la partie conclusion correspond au but et essaie de prouver ses prémisses inconnues par chaînage arrière en veillant à modifier la base de faits à chaque nouveau sous but prouvé; Si le but nest toujours pas prouvé, il repart en chaînage avant en tenant compte des nouveaux faits prouvés et éventuellement en demandant de nouveaux faits à lutilisateur et ainsi de suite jusquà ce que le but soit prouvé ou jusquà ce quaucune règle ne soit applicable. II.Systèmes experts Modes de chaînage

66 Remarques finales Le chaînage avant est recommandé lorsque le nombre de buts possibles est très élevé ou lorsquon ne connaît pas a priori le but à prouver. Il est aussi préconisé si lon souhaite obtenir le maximum de faits correspondant à une situation donnée. Le chaînage arrière peut être amélioré et étendu en impliquant lutilisateur lorsque l'ensemble des règles applicables est vide et ce, de manière interactive, en lui demandant si certains faits (ceux qui sont susceptibles de satisfaire le but) peuvent être ajoutés. Le chaînage arrière a lavantage dêtre plus efficace que le chaînage avant puisque lon napplique que les règles qui sont directement utiles pour la résolution des buts à prouver. Cependant, il requiert une implémentation beaucoup plus complexe que celle du chaînage avant. II.Systèmes experts Modes de chaînage

67 Conclusion En résumé, un système expert est composé généralement de : Un langage basé sur un formalisme de représentation déclarative pour exprimer les connaissances du domaine ; Une base de connaissances pour sauvegarder ces connaissances ; Un moteur dinférence pour le contrôle et le raisonnement sur ces connaissances ; Une interface dinteraction (si possible conviviale et intelligente) avec les utilisateurs. Les SE ne sont plus en vogue de nos jours, mais ils restent utiles dans des domaines dexpertise où ils sont considérés comme des outils daide à la décision. La tendance actuelle est de remplacer le terme SE par SBC, qui est plus général et reflète mieux la nature de ces systèmes. II.Systèmes experts

68 Introduction Dans lère des TIC et dInternet, le volume dinformations dont on dispose ne fait quaccroitre de façon vertigineuse; Le texte (en langue naturelle) en reste la forme la plus répandue même si limage, laudio et la vidéo sont de plus en plus utilisés. Des applications visant à tirer profit de cet amas dinformations sous forme textuelle sont en plein essor : la recherche dinformation, la traduction automatique, la correction d'orthographe, la lecture optique, le Textmining, la veille (technologique, économique, …), Apprentissage automatique, la classification, etc. Ces applications ont toutes besoin doutils de compréhension et de traitement des langues naturelles (TLN). Des applications de reconnaissance vocale, de synthèse de la parole, dIHM ont- elles aussi besoin de TLN. III. Traitement des langues naturelles

69 Introduction (suite) Une langue naturelle, contrairement à un langage formelle (ex. Un langage de programmation) qui est complètement codifié, déterministe et totalement figé (pour une version donnée), comporte des ambiguïtés et évolue en permanence dans le temps tout en respectant un ensemble de règles (ex. Grammaire, conjugaison, etc). Le TLN (ou TAL ou linguistique informatique ou computationnelle) est un champ détude commun à plusieurs disciplines (IA, Informatique, Linguistique, statistiques, etc.) dont la naissance remonte aux années 40 (à lépoque de la guerre mondiale). Après plus de 60 ans dexistence, les progrès au niveau du TLN restent -quand même- en-deçà des premières attentes et prédictions. III. Traitement des langues naturelles

70 Analyse vs Génération Des applications comme la correction d'orthographe, la lecture optique ou le Textmining ont besoin doutils TLN danalyse et de compréhension de texte donné en entrée, alors quune application comme la dictée automatique ou la synthèse de la parole requièrent la génération de texte ou de parole. La traduction automatique et les IHM sont des exemples dapplication qui font appel à la fois à des outils danalyse et de génération. III. Traitement des langues naturelles

71 Analyse : Principales étapes Segmentation : Extraction des mots dune phrase et des phrases dun texte (en se basant sur les caractères de ponctuation et les espaces) Analyse morphologique/lexicale : Etiquetage des mots qui constituent une phrase. Elle consiste à déterminer les informations grammaticales (comme le nombre, le genre, la personne, etc) associées à chaque mot considéré séparément. Analyse Syntaxique (parsing) : Extraction des relations grammaticales liant les mots et les groupes de mots entre eux. Comme par exemple, celles liant un verbe, à son sujet et ses compléments ou un nom à son adjectif ou à son déterminant. Analyse sémantique : Analyse du sens dune phrase en se basant sur une structure représentant le sens des mots (exp. Un réseau sémantique, une ontologie) Analyse pragmatique : Mise en contexte des phrases dun texte en les interprétant en fonction des connaissances générales sur le monde et le contexte dutilisation. III. Traitement des langues naturelles

72 Analyse : Principales étapes (suite) Si lentrée est sous forme audio une étape danalyse phonétique est nécessaire. Si le système est multilingue, une étape didentification de la langue est nécessaire. Ce schéma montre un ordre séquentiel de ces différents niveaux danalyse, mais en réalité, il existe une interdépendance et complémentarité entre ces niveaux. Lapproche séquentielle reste la plus simple à implémenter mais aussi la moins efficace. III. Traitement des langues naturelles

73 TLN numérique et statistique Dans ce chapitre on présente le TLN dit symbolique ou linguistique. Il existe aussi un autre paradigme de TLN, il sagit de TLN qui se base sur les méthodes statistiques ou connexionnistes comme lapprentissage statistique, les réseaux de neurones pour la classification, etc. Ces méthodes sont utilisées pour outrepasser les limitations inhérentes aux approches symboliques à base de règles. Par exemple, il est possible deffectuer un repérage des rôles sémantiques des mots dans une phrase en se basant sur une méthode dapprentissage statistique (quon effectue au préalable sur un Corpus du domaine étudié). Les réseaux de neurones peuvent être utilisés pour la reconnaissance de la parole, l'identification de caractères manuscrits, et aussi pour l'analyse morphologique. III. Traitement des langues naturelles

74 Analyse morphologique (1/2) Les mots dune langue sont souvent composés à partir dunités plus petites appelées morphèmes, qui représentent les plus petites unités ayant un sens. Exemple: inutiles in (préfixe) + utile + s (suffixe) Les préfixes, suffixes et infixes sont des morphèmes grammaticaux qui se combinent avec des morphèmes lexicaux (ou la base lexicale) pour former des mots plus complexes essentiellement via deux opérations : La flexion : elle ne change pas la catégorie syntaxique dun mot (exp modification du genre ou nombre) : petit petits La dérivation : elle crée un nouveau mot avec un sens nouveau et éventuellement avec une catégorie syntaxique différente : terre terrassement LAnalyse morphologique dun mot permet de le décomposer en une base et des affixes qui permettent de renseigner sur la catégorie syntaxique du mot. III. Traitement des langues naturelles

75 Analyse morphologique (2/2) Un mot (isolé de son contexte) peut avoir plusieurs décompositions. Exemple : le mot portes peut se décomposer de deux façons : portes = port[er] (Verbe) + es (2ème personne du singulier au présent) portes = porte (Nom) + s (pluriel) Heureusement, grand nombre de ces ambiguïtés peuvent être résolues au niveau de lanalyse syntaxique. LAnalyse morphologique se base sur un lexique qui représente lensemble de tous les mots dune langue avec leurs propriétés linguistiques. Elle exploite donc des connaissances linguistiques. Des automates à états-finis sont souvent utilisés dans cette phase. III. Traitement des langues naturelles

76 Analyse syntaxique (1/6) Dans une langue, les mots se combinent selon des règles précises pour former des constituants de plus en plus complexes jusquà la phrase. Une phrase peut comporter des sous-phrases liées par des relations de subordination, coordination ou de juxtaposition. Il existe des combinaisons de mots/sous-phrases correctes et dautres non. Des ambiguïtés lexicales peuvent être résolues au niveau syntaxique, par exemple dans Les grandes portes du château le mot portes va être considéré commeporte (Nom) + s (pluriel) au lieu de port[er] (Verbe) + es (2 ème pers/sing au présent). La structure hiérarchique des différents constituants dune phrase est souvent représentée sous forme dun arbre syntaxique. Cet arbre pour une phrase donnée nest pas toujours unique en raison des ambiguïtés morphosyntaxiques. Généralement, la sortie dun analyseur syntaxique est une forêt darbres. Plus la phrase est longue plus la forêt est dense. III. Traitement des langues naturelles

77 Analyse syntaxique (2/6) LAnalyse syntaxique est lune des étapes les mieux automatisées en TLN. Elle se base sur des connaissances linguistiques (ex. grammaires hors-contexte) pour produire les arbres syntaxiques (ou syntagmatiques). Un arbre syntaxique dune phrase a pour feuilles les mots de la phrase. Généralement, chaque feuille est reliée par un arc à sa fonction grammaticale dans la phrase et étiquetée par ses propriétés linguistique (résultat de lanalyse morphologique/lexicale). Les nœuds faisant partie dune même sous-phrase nominale (resp. verbale ou prépositionnelle) seront rattachés à un nœud parent de type (PN) (resp. PV ou PP) La racine de larbre est traditionnellement représentée par S. III. Traitement des langues naturelles

78 Analyse syntaxique (3/6) Exemple de règles -de production- dune grammaire hors contexte : S PN PVNP DET N | DET ADJ N PV V PN | VDET le| la | l ADJ grand | petit |..N chat | chien| carrotte V manger| … Lanalyse syntaxique basée sur ce genre de grammaires est généralement simple à implémenter et elle dispose actuellement dalgorithmes efficaces. Il est possible de faire cette analyse de manière ascendante, descendante ou hybride. Plus la grammaire est basée sur un alphabets bien riche plus lanalyse est fine. III. Traitement des langues naturelles

79 Analyse syntaxique (4/6) Exemple 1: Quel arbre choisir pour la phrase ? Je mange les spaghetti au restaurant III. Traitement des langues naturelles Je mange (les spaghetti) (au restaurant) Je mange (les spaghetti au restaurant)

80 Analyse syntaxique (5/6) Exemple 2: Quel arbre choisir pour la phrase ? Je mange les spaghetti au thon III. Traitement des langues naturelles Je mange (les spaghetti) (au thon) Je mange (les spaghetti au thon)

81 Analyse syntaxique (6/6) Exemple dun arbre syntaxique (ou arbre de dépendance) plus complexe: A quelle heure démarre le premier examen de rattrapage demain matin ? III. Traitement des langues naturelles à premier(m,sg) Det N PN V N PP ADV le(m,sg) ADJ S démarrer (3,sg,ind,pres) PP quel(f,sg) heure(f,sg) Det examen(m,sg) N N PN rattrapage(m,sg) PREP de demain matin PV

82 Analyse sémantique (1/3) Une phrase correcte syntaxiquement peut navoir aucun sens (exp: Le doigt a mangé les cheveux) sauf peut être dans un contexte fantaisiste. Avec les mêmes mots on peut former des phrases correctes avec des sens différents, par exemple : Ali parle à Samir & Samir parle à Ali. Deux phrases différentes peuvent avoir le même sens, comme par exemple: Le lion a tué le mouton & Le mouton a été tué par le lion Lanalyse sémantique essaie de trouver les sens possibles pour une phrase en se basant aussi bien sur les sens de ses mots (à partir de lexiques et de thesaurus) et sa structure syntaxique (le résultat de lanalyse syntaxique). Elle soccupe aussi déliminer ou de réduire les ambiguïtés générées au niveau de lanalyse syntaxique. III. Traitement des langues naturelles

83 Analyse sémantique (2/3) Par exemple, pour chaque phrase analysée, lanalyseur sémantique va produire un graphe sémantique (exp. graphe conceptuel) ou une formule logique (prédicats+ arguments) qui représente le sens de la phrase (hors contexte) et ce de la façon la plus indépendante possible de sa structure syntaxique. Des thésaurus sont souvent exploités pour interpréter les phrases analysées. Un thésaurus est une sorte de catalogue structuré qui réunit de linformation sur les différents sens des mots et sur les relations quils entretiennent entre eux. Dans une phrase, les mots nont pas les mêmes rôles sémantiques, par exemple : « Je conduis mon fils à lécole » conduire(agent=je, bénéficiaire= mon fils, lieu=lécole) Le sujet est généralement lagent et le verbe correspond à laction effectuée par cet agent (représenté par le prédicat). III. Traitement des langues naturelles

84 Analyse sémantique (3/3) Le graphe sémantique (basé sur un langage de prédicat réduit) est calculé à partir de larbre syntaxique de dépendance. Chaque nœud de larbre syntaxique est parcouru et associé comme argument à un ou plusieurs prédicats. En présence de plusieurs arbres syntaxiques (ce qui est souvent le cas) des heuristiques et des méthodes de calcul dindice de vraisemblance sont souvent utilisées pour déterminer les arbres à retenir. La qualité des résultats de lanalyse sémantique dépend de la qualité de lanalyse syntaxique et de la couverture du thésaurus Le résultat de cette phase peut être transformé pour produire une représentation ontologique correspondante au domaine concerné. Actuellement, des résultats satisfaisants peuvent être obtenus si on se limite à un domaine de connaissances restreint. III. Traitement des langues naturelles

85 Analyse pragmatique (1/3) Dans une phrase, beaucoup dinformations sont implicites et ne peuvent être extraites que si on connait le contexte de la phrase et les connaissances se rapportant à ce contexte. Lanalyse pragmatique soccupe de létude de la sémantique dune phrase en tenant compte de son contexte. Elle traite les aspects complexes liés à la sémantique, comme les présuppositions, les implications de dialogue, les intonations (dans un discours oral), la situation dénonciation, etc. Une même phrase peut avoir des significations différentes, selon par exemple le cadre où elle est inscrite (histoire imaginaire, compte rendu, livre scientifique, discours politique, etc). Exemple : Il naime pas les avocats : avocat: fruit? Ou juriste? III. Traitement des langues naturelles

86 Analyse pragmatique (2/3) Cette phase vise à enlever les ambigüités qui peuvent rester suite à lanalyse sémantique en se servant de connaissances générales sur le monde ou sur le domaine/situation du discours. Exemple dambigüité : « Ali tira sur lanimal et son fils aussi » Ali a-t-il tiré sur son fils? ou cest son fils qui a tiré sur lanimal ? Les phrases suivantes dans le texte peuvent nous aider pour trancher. Un autre exemple : « Jai pris un biscuit du plat et je lai mangé » Nos connaissances sur le monde nous disent que le plat nest pas comestible contrairement au biscuit. III. Traitement des langues naturelles

87 Analyse pragmatique (3/3) Les phrases dun texte ou discours peuvent avoir des relations implicites quon peut inférer et utiliser pour les interpréter correctement. Par exemple : « Jai faim. Allons vite au Texaco le plus proche » Linterprétation de Texaco comme Restaurant peut être inférée grâce à la première phrase « Jai faim». Cette interprétation ne peut être inférée de lune des deux phrases séparément mais de leur juxtaposition. Plusieurs travaux de recherche se consacre à lanalyse pragmatique mais ce niveau reste le moins développé.. III. Traitement des langues naturelles

88 Conclusion Le traitement automatique des langues serait simple sans lambiguïté qui caractérise toutes les langues naturelles. Cette ambigüité se situe à tous les niveaux du traitement : Exemple (au niveau morphologique) : « Il a peu de livres » (livre (masculin) : bouquin ou livre (féminin) : devise?) Cette ambiguïté est la source principale des limitations rencontrées par les systèmes actuels de TLN. Si lentrée du système est vocale un autre niveau dambiguïté et de difficulté est introduit. Toutes ces ambiguïtés entraînent une complexité calculatoire. III. Traitement des langues naturelles

89 Conclusion (suite) Une autre difficulté rencontrée par les systèmes de TLN est le grand volume de connaissances dont ils ont besoin à chaque niveau du traitement (connaissances linguistiques et connaissances de culture générale ou spécifiques à un domaine). Ces connaissances doivent également être représentées par un formalisme et un langage convenable (cf. chapitre 1). Pour les systèmes multilingues (exp. Traduction automatique), les différents traitements à chaque niveau danalyse doivent se baser sur une représentation de connaissances la plus déclarative possible, permettant ainsi une séparation rigoureuse entre les algorithmes de traitement et les connaissances linguistiques exploitées. Les systèmes de TLN sont donc bien des SBC. III. Traitement des langues naturelles


Télécharger ppt "Systèmes à Base de Connaissances (SBC) Master 1 GI."

Présentations similaires


Annonces Google