La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Anthony LECOT / Antoine CAUCHARD21 Juin 2004 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions.

Présentations similaires


Présentation au sujet: "Anthony LECOT / Antoine CAUCHARD21 Juin 2004 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions."— Transcription de la présentation:

1 Anthony LECOT / Antoine CAUCHARD21 Juin 2004 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Differentiation article / rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes

2 Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes

3 Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Objectif du projet faciliter l'accès au contenu d'un site de pressefaciliter l'accès au contenu d'un site de presse par une étude terminologique de ce contenupar une étude terminologique de ce contenu en utilisant une interface graphique basée sur les termesen utilisant une interface graphique basée sur les termes

4 Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes  Les tâches préparatives  Récupération du graphe de liens  Différenciation article/rubrique  Etude terminologique  Les tâches d’interfacage  Collecter les informations  Créer l’interface Répartition des tâches

5 Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes

6 Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Page d’accueil 47 pages html 421 pages html 810 pages html Ouest France 32 1356 12877

7 Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Explications Un lien : texte de lien Un lien : texte de lien Le graphe de liensLe graphe de liens Éviter les redondances de grapheÉviter les redondances de graphe Eviter les liens inutilesEviter les liens inutiles Choisir une profondeurChoisir une profondeur

8 Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes

9 Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Différenciation d’un article Formule de tri sur la base de donnéesFormule de tri sur la base de données Comptage du nombre de mots lors de la phase d’indexationComptage du nombre de mots lors de la phase d’indexation - (liensSortants<moyenneLiensSortants) OU (nbOcc < moyenneOcc) - ET liensSortants > minLiensSortants

10 Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Différenciation d’une rubrique - liensSortants > moyenneLiensSortants - ET nbOcc >= moyenneOcc Formule de tri sur la base de donnéesFormule de tri sur la base de données Si un article est pointé par une rubrique (indexation)Si un article est pointé par une rubrique (indexation)

11 Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes

12 Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Indexation des articles Récupération d’un articleRécupération d’un article Algorithme d’indexation d’un articleAlgorithme d’indexation d’un article par un schéma:

13 Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Indexation des articles

14 Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Indexation des termes Stratégie pour récupérer les termes Stratégie pour récupérer les termes Mots pleins et mots vides, loi de Zipf

15 Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Indexation des termes Algorithme d’indexation des termes d’un Algorithme d’indexation des termes d’un article par un schéma: article par un schéma:


Télécharger ppt "Anthony LECOT / Antoine CAUCHARD21 Juin 2004 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions."

Présentations similaires


Annonces Google