Algorithme de Lempel-Ziv et Arbre MESH Leïla Traoré - Vianney Gremmel - Marouane Zehni Nicolas Fournel - Maxime Chambreuil Emmanuel Ohana - Sébastien Le Digabel Mathieu Hautreux - Sébastien Pesquet UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002
Déroulement Objectifs L’arbre MESH Lempel-Ziv Problèmes à résoudre Architecture de l’application Bibliographie UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002
Objectifs Obtenir le sujet général d’un article médical Coloriser les mots importants de cet article : Appartenant à l’arbre MESH Appartenant à une liste de synonymes Appliquer l’algorithme de Lempel-Ziv pour créer un dictionnaire de mots MESH UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002
L’arbre MESH UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002
L’arbre MESH Arbre n-aire stockant des mots du vocabulaire médical Arbre permettant d’obtenir la corrélation entre 2 mots Cette corrélation est proportionnelle à la hauteur entre le niveau des mots et le premier nœud commun On transforme l’arbre en liste UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002
Exemple simplifié Traumatologie Cardiologie / Plaies et traumatismes Etat stress post-traumatique Appareil cardiovasculaire Cœur artificiel UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002
Utilisation de l’algorithme de Lempel-Ziv UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002
Lempel-Ziv En entrée : une liste de mots En sortie : un dictionnaire de mots « radicaux » « cardio » sera notre radical de cardiologue, cardiologie, cardiovasculaire, cardiofréquencemètre, etc… UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002
Problèmes à résoudre UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002
Problèmes à résoudre Le dictionnaire est-il statique ? OUI : Pourquoi garder les lettres dans le dictionnaire ? NON : le dictionnaire évolue pour ne garder que les radicaux qui apparaissent le plus souvent dans les articles… L’épuration du dictionnaire : Comment distinguer et éliminer les adresses inutiles ? Nombre de lettres du mots : éliminer les mots de 2 lettres Fréquence des mots dans l’article : éliminer les mots apparaissant moins de n fois L’adresse du mot dans le dictionnaire : éliminer les mots compris entre les adresses 27 et n UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002
Architecture de l’application UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002
Architecture de l’application 1ère phase : Lempel Ziv Arbre en liste MESH ListeMesh DicoMesh 2ème phase : Article avec les mots MESH en couleur DicoMesh Parcours & Colorisation Article (N&B) Article ou les mots Non-MESH sont remplacés par « * » UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002
Bibliographie UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002
Bibliographie http://www.chu-rouen.fr/ssf/santspe.html http://www.nlm.nih.gov/mesh/ http://dicdoc.kb.inserm.fr:2010/basismesh/mesh.html http://www.ohsu.edu/cliniweb/ UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002
Des questions ??? UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002