La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

3. Differentiation article / rubrique

Présentations similaires


Présentation au sujet: "3. Differentiation article / rubrique"— Transcription de la présentation:

1 3. Differentiation article / rubrique
1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Differentiation article / rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Anthony LECOT / Antoine CAUCHARD 21 Juin 2004

2 PLAN 1. Introduction 1.1. Objectif du projet
1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Anthony LECOT / Antoine CAUCHARD 21 Juin 2004

3 Objectif du projet faciliter l'accès au contenu d'un site de presse
PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Objectif du projet faciliter l'accès au contenu d'un site de presse par une étude terminologique de ce contenu en utilisant une interface graphique basée sur les termes Anthony LECOT / Antoine CAUCHARD 21 Juin 2004

4 Répartition des tâches
PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Répartition des tâches Les tâches préparatives Récupération du graphe de liens Différenciation article/rubrique Etude terminologique Les tâches d’interfacage Collecter les informations Créer l’interface Anthony LECOT / Antoine CAUCHARD 21 Juin 2004

5 PLAN 1. Introduction 1.1. Objectif du projet
1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Anthony LECOT / Antoine CAUCHARD 21 Juin 2004

6 PLAN Ouest France 1. Introduction 1.1. Objectif du projet
1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Page d’accueil 32 47 pages html 1356 421 pages html 12877 810 pages html Anthony LECOT / Antoine CAUCHARD 21 Juin 2004

7 Explications PLAN Un lien : <a href=url>texte de lien</a>
1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Explications Un lien : <a href=url>texte de lien</a> Le graphe de liens Éviter les redondances de graphe Eviter les liens inutiles Choisir une profondeur Anthony LECOT / Antoine CAUCHARD 21 Juin 2004

8 PLAN 1. Introduction 1.1. Objectif du projet
1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Anthony LECOT / Antoine CAUCHARD 21 Juin 2004

9 Différenciation d’un article
PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes - (liensSortants<moyenneLiensSortants) OU (nbOcc < moyenneOcc) - ET liensSortants > minLiensSortants Formule de tri sur la base de données Comptage du nombre de mots lors de la phase d’indexation Anthony LECOT / Antoine CAUCHARD 21 Juin 2004

10 Différenciation d’une rubrique
PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes - liensSortants > moyenneLiensSortants - ET nbOcc >= moyenneOcc Formule de tri sur la base de données Si un article est pointé par une rubrique (indexation) Anthony LECOT / Antoine CAUCHARD 21 Juin 2004

11 PLAN 1. Introduction 1.1. Objectif du projet
1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Anthony LECOT / Antoine CAUCHARD 21 Juin 2004

12 Indexation des articles
Récupération d’un article Algorithme d’indexation d’un article par un schéma: PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Anthony LECOT / Antoine CAUCHARD 21 Juin 2004

13 Indexation des articles
PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Anthony LECOT / Antoine CAUCHARD 21 Juin 2004

14 Indexation des termes Stratégie pour récupérer les termes
Mots pleins et mots vides, loi de Zipf PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Anthony LECOT / Antoine CAUCHARD 21 Juin 2004

15 Indexation des termes Algorithme d’indexation des termes d’un PLAN
article par un schéma: PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Anthony LECOT / Antoine CAUCHARD 21 Juin 2004


Télécharger ppt "3. Differentiation article / rubrique"

Présentations similaires


Annonces Google