Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
Publié parAncel Beck Modifié depuis plus de 9 années
1
Anthony LECOT / Antoine CAUCHARD21 Juin 2004 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Differentiation article / rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes
2
Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes
3
Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Objectif du projet faciliter l'accès au contenu d'un site de pressefaciliter l'accès au contenu d'un site de presse par une étude terminologique de ce contenupar une étude terminologique de ce contenu en utilisant une interface graphique basée sur les termesen utilisant une interface graphique basée sur les termes
4
Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Les tâches préparatives Récupération du graphe de liens Différenciation article/rubrique Etude terminologique Les tâches d’interfacage Collecter les informations Créer l’interface Répartition des tâches
5
Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes
6
Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Page d’accueil 47 pages html 421 pages html 810 pages html Ouest France 32 1356 12877
7
Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Explications Un lien : texte de lien Un lien : texte de lien Le graphe de liensLe graphe de liens Éviter les redondances de grapheÉviter les redondances de graphe Eviter les liens inutilesEviter les liens inutiles Choisir une profondeurChoisir une profondeur
8
Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes
9
Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Différenciation d’un article Formule de tri sur la base de donnéesFormule de tri sur la base de données Comptage du nombre de mots lors de la phase d’indexationComptage du nombre de mots lors de la phase d’indexation - (liensSortants<moyenneLiensSortants) OU (nbOcc < moyenneOcc) - ET liensSortants > minLiensSortants
10
Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Différenciation d’une rubrique - liensSortants > moyenneLiensSortants - ET nbOcc >= moyenneOcc Formule de tri sur la base de donnéesFormule de tri sur la base de données Si un article est pointé par une rubrique (indexation)Si un article est pointé par une rubrique (indexation)
11
Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes
12
Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Indexation des articles Récupération d’un articleRécupération d’un article Algorithme d’indexation d’un articleAlgorithme d’indexation d’un article par un schéma:
13
Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Indexation des articles
14
Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Indexation des termes Stratégie pour récupérer les termes Stratégie pour récupérer les termes Mots pleins et mots vides, loi de Zipf
15
Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Indexation des termes Algorithme d’indexation des termes d’un Algorithme d’indexation des termes d’un article par un schéma: article par un schéma:
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.