Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
1
Algorithme de Lempel-Ziv et Arbre MESH
Leïla Traoré - Vianney Gremmel - Marouane Zehni Nicolas Fournel - Maxime Chambreuil Emmanuel Ohana - Sébastien Le Digabel Matthieu Hautreux - Sébastien Pesquet UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003
2
Déroulement Objectifs L’arbre MESH et Lempel-Ziv Problèmes rencontrés
Le marquage de l’article Bibliographie UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003
3
Objectifs Obtenir le sujet général d’un article médical
Coloriser les mots importants de cet article : Appartenant à l’arbre MESH Appartenant à une liste de synonymes Appartenant à une liste de qualificatifs Appliquer l’algorithme de Lempel-Ziv pour créer un dictionnaire de mots MESH UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003
4
L’arbre MESH et Lempel-Ziv
UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003
5
Mot MESH | identifiant | mot MESH | identifiant | différence de niveau
L’arbre MESH C’est un fichier avec des lignes de la forme: Mot MESH | identifiant | mot MESH | identifiant | différence de niveau On ne récupère que la chaîne de caractères avant le « | » et on ajoute un espace devant le mot… UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003
6
Lempel-Ziv Durant l’exécution, on étudie une chaîne en connaissant le caractère précédent et le suivant : On sait si on est en début de mot On teste si la chaîne courante est dans le dictionnaire Si c’est le cas, on incrémente le compteur du mot du dico et on ajoute le caractère suivant à la chaîne Sinon on ajoute la chaîne dans le dico UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003
7
Problèmes rencontrés UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003
8
Problèmes rencontrés La taille des données de l’arbre Mesh
Initialement : 5 min d’exécution pour arriver à la lettre « c » Optimisation pendant l’exécution : on ne prend que les débuts de mots, pas de mot avec un espace, etc.… Suppression de l’affichage UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003
9
Le marquage de l’article
UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003
10
Récapitulatif On a : On doit : Un article
Un dictionnaire avec les mots MESH On doit : Récupérer le meme article avec les mots MESH marqués UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003
11
Obtenir le dictionnaire
On utilise le travail du 1er groupe, qui a travaillé sur l’épuration de l’arbre MESH On récupère un fichier texte On utilise la 2ème partie de l’algorithme de Lempel-Ziv UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003
12
Contraintes Le dictionnaire doit avoir une structure particulière
Le dictionnaire doit contenir l’alphabet, ainsi que tous les caractères utilisés dans l’article UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003
13
Remarques Nous n’appliquons pas l’algorithme de façon brute mais un dérivé : Le programme ne code pas à la volée, chaque mot est codé en fonction de sa place dans le fichier Le dictionnaire n’évolue pas car l’arbre MESH n’évolue pas non plus UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003
14
Comment ça se passe ? Super Programme 3,2,0,5,1,4… Article :
B 1 C 2 AA 3 AB 4 CB 5 CC 6 … … Super Programme 3,2,0,5,1,4… Article : AACACBBAB… UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003
15
Et ensuite ? Décodage des mots avec le dictionnaire
Si on connaît l’alphabet ( c’est le cas puisque chaque mot ne contient qu’une lettre ), on en déduit les mots qui appartiennent au dictionnaire en tant que tels. On les repère à l’aide de marqueurs (configurable) UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003
16
Et c’est tout ? Le plus gros du travail du premier groupe a été de trouver des règles de découpage des racines des termes de l’arbre Mesh. Notre dictionnaire comporte des racines (début de mots) Il faut donc pouvoir les repérer avec les mots qu’elles composent. Ex : « cardio » doit marquer « cardiologue » et « cardiogramme » UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003
17
Ca marche ? Oui ! Le programme repère sans difficulté tous les mots du dictionnaire dans un article Il faut bien saisir tout l’alphabet Attention à l’HTML !!! Le programme repère tout seul où s’arrête l’alphabet dans le dictionnaire. UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003
18
Bibliographie UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003
19
Bibliographie http://www.data-compression.com/lempelziv.html
UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003
20
Des questions ??? UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.