Anthony LECOT / Antoine CAUCHARD21 Juin Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Differentiation article / rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes
Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes
Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Objectif du projet faciliter l'accès au contenu d'un site de pressefaciliter l'accès au contenu d'un site de presse par une étude terminologique de ce contenupar une étude terminologique de ce contenu en utilisant une interface graphique basée sur les termesen utilisant une interface graphique basée sur les termes
Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Les tâches préparatives Récupération du graphe de liens Différenciation article/rubrique Etude terminologique Les tâches d’interfacage Collecter les informations Créer l’interface Répartition des tâches
Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes
Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Page d’accueil 47 pages html 421 pages html 810 pages html Ouest France
Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Explications Un lien : texte de lien Un lien : texte de lien Le graphe de liensLe graphe de liens Éviter les redondances de grapheÉviter les redondances de graphe Eviter les liens inutilesEviter les liens inutiles Choisir une profondeurChoisir une profondeur
Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes
Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Différenciation d’un article Formule de tri sur la base de donnéesFormule de tri sur la base de données Comptage du nombre de mots lors de la phase d’indexationComptage du nombre de mots lors de la phase d’indexation - (liensSortants<moyenneLiensSortants) OU (nbOcc < moyenneOcc) - ET liensSortants > minLiensSortants
Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Différenciation d’une rubrique - liensSortants > moyenneLiensSortants - ET nbOcc >= moyenneOcc Formule de tri sur la base de donnéesFormule de tri sur la base de données Si un article est pointé par une rubrique (indexation)Si un article est pointé par une rubrique (indexation)
Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes
Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Indexation des articles Récupération d’un articleRécupération d’un article Algorithme d’indexation d’un articleAlgorithme d’indexation d’un article par un schéma:
Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Indexation des articles
Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Indexation des termes Stratégie pour récupérer les termes Stratégie pour récupérer les termes Mots pleins et mots vides, loi de Zipf
Anthony LECOT / Antoine CAUCHARD21 Juin 2004 PLAN 1. Introduction 1.1. Objectif du projet 1.2. Répartition des tâches 2. Le Graphe des liens 2.1. Descriptions 2.2. Solutions 3. Différenciation article/rubrique 3.1. Article 3.2. Rubrique 4. Étude Terminologique 4.1. Indexation des articles 4.2. Indexation des termes Indexation des termes Algorithme d’indexation des termes d’un Algorithme d’indexation des termes d’un article par un schéma: article par un schéma: