La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Algorithme de Lempel-Ziv et Arbre MESH

Présentations similaires


Présentation au sujet: "Algorithme de Lempel-Ziv et Arbre MESH"— Transcription de la présentation:

1 Algorithme de Lempel-Ziv et Arbre MESH
Leïla Traoré - Vianney Gremmel - Marouane Zehni Nicolas Fournel - Maxime Chambreuil Emmanuel Ohana - Sébastien Le Digabel Matthieu Hautreux - Sébastien Pesquet UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003

2 Déroulement Objectifs L’arbre MESH et Lempel-Ziv Problèmes rencontrés
Le marquage de l’article Bibliographie UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003

3 Objectifs Obtenir le sujet général d’un article médical
Coloriser les mots importants de cet article : Appartenant à l’arbre MESH Appartenant à une liste de synonymes Appartenant à une liste de qualificatifs Appliquer l’algorithme de Lempel-Ziv pour créer un dictionnaire de mots MESH UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003

4 L’arbre MESH et Lempel-Ziv
UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003

5 Mot MESH | identifiant | mot MESH | identifiant | différence de niveau
L’arbre MESH C’est un fichier avec des lignes de la forme: Mot MESH | identifiant | mot MESH | identifiant | différence de niveau On ne récupère que la chaîne de caractères avant le « | » et on ajoute un espace devant le mot… UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003

6 Lempel-Ziv Durant l’exécution, on étudie une chaîne en connaissant le caractère précédent et le suivant : On sait si on est en début de mot On teste si la chaîne courante est dans le dictionnaire Si c’est le cas, on incrémente le compteur du mot du dico et on ajoute le caractère suivant à la chaîne Sinon on ajoute la chaîne dans le dico UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003

7 Problèmes rencontrés UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003

8 Problèmes rencontrés La taille des données de l’arbre Mesh
Initialement : 5 min d’exécution pour arriver à la lettre « c » Optimisation pendant l’exécution : on ne prend que les débuts de mots, pas de mot avec un espace, etc.… Suppression de l’affichage UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003

9 Le marquage de l’article
UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003

10 Récapitulatif On a : On doit : Un article
Un dictionnaire avec les mots MESH On doit : Récupérer le meme article avec les mots MESH marqués UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003

11 Obtenir le dictionnaire
On utilise le travail du 1er groupe, qui a travaillé sur l’épuration de l’arbre MESH On récupère un fichier texte On utilise la 2ème partie de l’algorithme de Lempel-Ziv UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003

12 Contraintes Le dictionnaire doit avoir une structure particulière
Le dictionnaire doit contenir l’alphabet, ainsi que tous les caractères utilisés dans l’article UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003

13 Remarques Nous n’appliquons pas l’algorithme de façon brute mais un dérivé : Le programme ne code pas à la volée, chaque mot est codé en fonction de sa place dans le fichier Le dictionnaire n’évolue pas car l’arbre MESH n’évolue pas non plus UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003

14 Comment ça se passe ? Super Programme 3,2,0,5,1,4… Article :
B 1 C 2 AA 3 AB 4 CB 5 CC 6 … … Super Programme 3,2,0,5,1,4… Article : AACACBBAB… UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003

15 Et ensuite ? Décodage des mots avec le dictionnaire
Si on connaît l’alphabet ( c’est le cas puisque chaque mot ne contient qu’une lettre ), on en déduit les mots qui appartiennent au dictionnaire en tant que tels. On les repère à l’aide de marqueurs (configurable) UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003

16 Et c’est tout ? Le plus gros du travail du premier groupe a été de trouver des règles de découpage des racines des termes de l’arbre Mesh. Notre dictionnaire comporte des racines (début de mots) Il faut donc pouvoir les repérer avec les mots qu’elles composent. Ex : « cardio » doit marquer « cardiologue » et « cardiogramme » UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003

17 Ca marche ? Oui ! Le programme repère sans difficulté tous les mots du dictionnaire dans un article Il faut bien saisir tout l’alphabet Attention à l’HTML !!! Le programme repère tout seul où s’arrête l’alphabet dans le dictionnaire. UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003

18 Bibliographie UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003

19 Bibliographie http://www.data-compression.com/lempelziv.html
UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003

20 Des questions ??? UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 14 janvier 2003


Télécharger ppt "Algorithme de Lempel-Ziv et Arbre MESH"

Présentations similaires


Annonces Google