Hôpital Bidule Le patient Donald Duck, né le 22/5/2064 souffre d’un œdème de Quincke, type II. CONCEPTION ET UTILISATION D’ONTOLOGIES MÉDICALES : APPLICATION À LA PNEUMOLOGIE Situation générale : L’accès aux connaissances médicales est un enjeu majeur pour les professions de santé. Face à la multiplication des sources d’informations potentiellement accessibles et face à l’augmentation vertigineuse de la production textuelle, il faut situer les limites actuelles des outils de traitement de l’information du côté de leur incapacité à prendre en compte les spécificités des vocabulaires des utilisateurs. Ainsi, le développement de ressources ontologiques facilitant l’usage des terminologies nationales et internationales dans le domaine de la médecine est un enjeu important que ce soit pour le recueil d’information (aide au codage des diagnostics et des actes) ou pour l’accès aux connaissances médicales (base de données bibliographique Medline, base de connaissances Vidal sur les médicaments…). Enfin, il est primordial de noter l’importance de telles recherches dans le cadre de la société de l’information, dans le contexte du Web sémantique. En effet, l’interopérabilité attendue des systèmes d’information de santé au sein du Web sémantique passe par la constitution de ressources terminologiques ou ontologiques (RTO) à partir de corpus, en particulier les ontologies. Avantages et utilisations de l’ontologie La classification commune des actes médicaux (CCAM) est un thésaurus construit sur le modèle ontologique. Il en a certaines des propriétés : l’exhaustivité, la bijectivité, le soucis du consensus (un acte pratiqué par plusieurs spécialités médicales a un libellé unique) et la non ambiguïté des libellés. Il ne permet pas pour autant de sauvegarder les liens de causalités menant des diverses hypothèses médicales aux diagnostics, ni d’ajouter des informations pertinentes aux libellés. La réalisation d’une ontologie de la pneumologie permet de pallier ces manques. Cette ontologie permettra de décrire, de façon précise et homogène, les diagnostics tout en gardant la trace des différents examens qui y auront conduit. À partir de là, les médecins pourront disposer un critère de confiance relatif au diagnostic de façon beaucoup plus précise que devant son seul énoncé. De plus, la représentation ontologique des connaissances garantit le maintien de la cohérence des axiomes et de l’intégrité du système, ainsi que l’extensibilité de la représentation sans modification de la structure, et l’indépendance maximale vis-à-vis de la syntaxe et de la sémantique des termes du domaine. 1. Constitution du corpus Il s’agit d’implémenter des analyseurs qui permettent de sélectionner, dans les comptes rendus d’hospitalisation, les informations pertinentes en fonction du domaine et de l’application visée, et cela en vue de l’extraction terminologique. Ces informations sont ensuite mises au format XML. 2. Analyse et extraction des termes Pour développer notre ontologie, nous utilisons à la suite deux outils [3] de TAL : l’analyseur syntaxique de corpus spécialisés SYNTEX qui produira comme résultat un réseau de mots et de syntagmes, et le module d’analyse distributionnelle UPERY qui exploite l’ensemble des données du réseau pour proposer des regroupements de concepts. 3. Résultat On dispose d’un réseau de candidats termes, de leur regroupement contextuel et de leur lien au corpus. 1. Normalisation sémantique Pour parvenir à normaliser le sens des candidats termes, il faut nécessairement fixer leur contexte de référence. Pour cela il faut transformer le candidat terme en primitive du domaine en analysant leurs manifestations au corpus et à l’aide de la sémantique différentielle [4]. 2. Sémantique différentielle La mise en œuvre des quatre principes de la sémantique différentielle permet de construire l’arbre des primitives : le principe de communauté avec le père (le nœud fils hérite des propriétés du nœud père), le principe de différence avec le père (les propriétés propres au nœud fils qui le distinguent du nœud père), le principe de communauté avec les frères (les propriétés qui caractérisent les nœuds d’une même fratrie) et le principe de différence avec les frères (les propriétés qui distinguent le nœud de ses frères). 3. Résultat On obtient un arbre des primitives du domaine dans lequel la signification bien définie de chaque primitive exprime une connaissance. Pourtant, le travail de conceptualisation ne s’arrête pas là puisque ces primitives sont de nature linguistique et, par là même, toujours soumises au biais de l’interprétation. 1. Sémantiques extensionnelle et référentielle Il s’agit maintenant de passer des primitives aux concepts et il convient pour cela de mettre en œuvre une sémantique formelle de type extensionnel. Autrement dit, il s’agit de lier les primitives par référence à un ensemble d’objets du domaine. L’arbre ontologique sera alors composé de concepts formels définis en extension. L’utilisateur pourra facilement construire de nouveaux concepts formels en associant ceux déjà existant. 2. Résultat Le structure hiérarchique obtenue n’est plus un arbre mais un treillis. Corpus de connaissances Il est constitué de comptes rendus d’hospitalisation ONTOLOGIE INFORMATISÉE Ensemble des termes du domaine Le sens est encore ambigu et dépendant du contexte interprétatif du locuteur. Arbre des primitives du domaine Le contexte d’interprétation est maintenant fixé. Ontologie formelle Treillis des concepts définis et des relations qu’ils entretiennent. 1. Opérationalisation Dans cette dernière étape, on va chercher à donner aux concepts définis une signification pour le système informatique, en spécifiant le comportement de ces nouveaux objets informatiques. Pour cela, on va choisir d’exprimer les concepts dans un langage de représentation des connaissances opérationnel fondé formellement, faisant appel à des capacités d’inférence précises répondant aux besoins de l’ontologie. 2. Logiques de descriptions Ce langage sera fondé sur les logiques de description qui permettront, en particulier, de tester les relations de subsomption. L’ontologie sera ensuite mise à disposition dans le format OWL. Les quatre étapes de la méthodologie de construction poumon œdème asthme pathologie Hôpital Bidule Le patient Donald Duck, né le 22/5/2064 souffre d’un œdème de Quincke, type II. Hôpital Bidule Le patient Donald Duck, né le 22/5/2064 souffre d’un œdème de Quincke, type II. Hôpital Bidule Le patient Donald Duck, né le 22/5/2064 souffre d’un œdème de Quincke, type II. Exemple de concept défini L’hémopéritoine : « épanchement hématique localisé au niveau du péritoine » ETAT_PATHOLOGIQUE ETAT_PATHOLOGIQUE_LOCAL LESION épanchement épanchement liquidien épanchement hématique ANATOMIE ANA_TISSU_ENVEL duremère mésentère peau péritoine LOCALISATION à_côté_de à_l'extérieur_de au_dessus_de … au_niveau_de [Épanchement hématique] (au niveau de) [péritoine] Extrait de la hiérarchie des concepts Extrait de la hiérarchie des relations Un éditeur d’ontologies : DOE [5] Le terme « ontologie » est utilisé depuis le début des années 90 dans les domaines de l'intelligence artificielle, en particulier de l’ingénierie des connaissances et de la représentation des connaissances. Dans le cadre des recherches menées par les acteurs du Web sémantique, son champ d'application s'élargit considérablement et il fait désormais partie d'une terminologie couramment utilisée, notamment dans le secteur de la modélisation des systèmes d'information. Définition [1] Une ontologie implique ou comprend une certaine vue du monde par rapport à un domaine donné. Cette vue est souvent conçue comme un ensemble de concepts, leurs définitions et leurs interrelations. On appelle cela une conceptualisation. Pour aller plus loin Une ontologie décrit de manière générique les connaissances propres à un domaine donné et offre de celui-ci une compréhension consensuelle. Il s’agit donc d’une modélisation conceptuelle (non contextuelle et non ambiguë) dans laquelle le sens de chaque concept est déterminé par sa position dans une structure de type arborescente. In fine, une ontologie est un système formel implémentable dont l’objectif est de représenter les connaissances d’un domaine spécifique au moyen d’éléments de base, les concepts, définis et organisés les uns par rapport aux autres. Introduction : Une ontologie, mais de quoi s’agit-il ? Audrey Baneyx, INSERM ERM 202 J ean Charlet, STIM AP-HP & INSERM ERM 202 Contexte : Pourquoi les ontologies sont-elles nécessaires en médecine ? Ce travail de conception d’ontologies médicales s’inscrit dans le cadre, plus large, du projet national de recherche PERTOMed [2], financé par le CNRS. La principale motivation de ce projet est de développer une infrastructure proposant un ensemble de méthodes et d'outils opérationnels pour la production et l’utilisation de RTO dans le domaine médical. L’objectif de mon travail est de concevoir et développer un serveur de terminologies et les services linguistiques associés. Il s’agit de rechercher une architecture optimum pour ce serveur et de réfléchir aux problèmes logiques que posent les différentes alternatives de représentation des connaissances et les inférences en leur sein. Le premier de mes objectifs est de produire des ressources ontologiques dans différentes spécialités de la médecine dont la pneumologie. Ces ontologies sont construites en étroite collaboration avec des groupes d’utilisateurs, avec lesquels seront, en particulier, mises en place des procédures d’évaluation de ces ressources dans leur contexte d’usage. Le projet PERTOMed Production et évaluation de ressources terminologiques et ontologiques dans le domaine de la médecine - Service de Pneumologie et de réanimation, Groupe Hospitalier Pitié-Salpêtrière. - Société française de pneumologie. Collaborations [1] Charlet, L’ingénierie des connaissances : développement, résultat et perspectives pour la gestion des connaissances médicales. Habilitation à diriger des recherches, Paris 6, [2] [3] Bourigault et Fabre. Approche linguistique pour l'analyse syntaxique de corpus. In Cahiers de Grammaires, n° 25, 2000, Université Toulouse - Le Mirail. [4] Bachimont, 2000a. Engagement sémantique et engagement ontologique : conception et réalisation d’ontologies en ingénierie des connaissances. In J. Charlet, M. Zacklad, G. Kassel and D. Bourigault, editors, Ingénierie des Connaissances : Evolutions récentes et nouveaux défis. Eyrolles, [5] Troncy et Isaac, DOE : une mise en œuvre d’une méthode de structuration différentielle pour les ontologie, In IC Références