Thibault ROY Université de Caen / Basse-Normandie Laboratoire GREYC – Equipe ISLanD Apport d’outils d’informatique documentaire à l’analyse de forums de.

Slides:



Advertisements
Présentations similaires
Création de matériaux pédagogiques et approche par tâches
Advertisements

Espaces numériques de travail 12 mars 2004 Une nouvelle approche sur les usages des T.I.C. Espace Numérique de Travail - Système dInformation Alain Mayeur.
Sandrine Peraldi (ISIT) Jean-Philippe KOTOWICZ (INSA Rouen)
Comment choisir une solution technologique de veille sur le marché ?
(2005) De Jacques Audran : maître de conférence
Guide rapide pour le gestionnaire Etape
2002 Compétitif XMiner : Plate-forme de structuration texte libre multi-approches par balisage XML de Tags Actifs Lobjectif du projet est de développer.
Cahier de textes Souhaitez-vous un cahier de texte en ligne???
Les outils du TAL Par RIGAUD Anaïs RALLIER Armelle SANTIAGO Gwendoline
Le web classeur Guide à l'usage des élèves. un support de classement et de conservation de vos informations en matière dorientation un outil permettant.
STSWEB Echanges avec SCOnet Les éléments de structure
Qu’est-ce qu’une étude de cas ? Comment construire une étude de cas ?
Animation pédagogique Grammaire C3 24 novembre 2007 Présentation du travail pour le groupe grammaire C3.
Les forums de discussion
Réunion académique des animateurs informatiques 22 janvier 2007
Un projet collectif pour le réseau : la production d’écrit
Présentation du Tableau de Bord Reims – Janvier 2011.
Utilisation du fil RSS du site du Master-Chimie d Aix-Marseille Université Tutoriel réalisé par Fabien.
Plateforme de revues et d’articles en sciences humaines et sociales
> a patent search service supplied by Patents & Technology Surveys Ltd PROFESSIONAL ONLINE PATENT INFORMATION SERVICE.
ASA Algerian scientific Abstracts المستخلصات العلمية الجزائرية
- Une approche de la formation par les activités, - Une entrée par les situations de travail mêlant des compétences de gestion et dadministration, - Lutilisation.
Lenseignement de Méthodologie documentaire. Pourquoi un enseignement de Méthodologie documentaire ? Vous êtes étudiants de LS1, LS3, LS5 ou MS1 inscrits.
Passer à la première page SYMPA Un nouveau service pour la diffusion et léchange d informations, sécurisé et adapté aux besoins de lacadémie.
Comités Techniques « Documentation/ Communication » Antenne de LIREPS – Grand Camp Les Abymes Mercredi 06 février 2013.
Les concepts développés dans ce document sont la propriété exclusive de BoostZone et sont soumis à copyright. PEPINIERES BOOSTZONE INSTITUTE POUR DES RESEAUX.
Thibault ROY Laboratoire GREYC Université de Caen / Basse-Normandie Une plate-forme logicielle dédiée à la cartographie de corpus Journées portes ouvertes.
Séminaire Normes et Standards 10 octobre 2003 L'école du futur dès aujourd'hui.
Plate-forme d’enseignement Moodle
Mon passeport pour l’orientation et la formation
Académie de Versailles - Inspection pédagogique régionale de lettres
12 mars 2008 Jean-Pierre AUBERTIN
Guide à l'usage des élèves
Service dInformation et dAnalyse des Logiciels Libres Éducatifs
MEN-MESR/STSI-SDTICE 1 Économie-Gestion – 16 et 17 décembre 2008 – Gaëlle Pennetier et Christophe Goidin Service dInformation et dAnalyse des Logiciels.
Date / references Systèmes Terre et Interarmées Projet OUTILEX Rapport détude final Octobre 2006.
WebCT 4.1 : Votre Intranet pédagogique
Service Informatique du Rectorat
La Scénarisation Pédagogique
13-14 juin 2007 Synthèse du groupe 2 Les équipes participantes 3D Geom.net : géométrie dans lespace APLUSIX : les expressions algébriques, les transformations.
CRDP de Poitou-Charentes
Méthodologie pour la structuration semi- automatique d’un corpus lexicographique bilingue : le cas du dictionnaire français-kabyle Mahfoud MAHTOUT Université.
Cerise Collège espaCE numéRIque de Suivi et d’Evaluation
ANEG: Site web renouvelé Organisation Planning. ANEG: Site web renouvelé Organisation: Il n’y aura pas de changements notables. –Ce qui était transmis.
LES INFOS de Philippe et Patrick Journal d'informations en ligne Infospp.free.fr Mai 2006.
CONSTRUIRE SON DIAPORAMA
Delicious est un outil du Web social, qui permet: La sauvegarde de liens (favoris ou bookmark) dans un espace en ligne et donc accessible depuis n'importe.
Ministère de l’enseignement Supérieur et de la Recherche Scientifique
17/04/ DIMOCODE. 2 Présentation DIMOCODE : Plate-forme de gestion documentaire Permet la dépose et l’indexation précise de documents Organisée autour.
Présentation du 05 avril 2006 L’intranet : une réalité pour les entreprises Espace sécurisé où sont stockés les documents internes Base de connaissances.
Ministère de la Fonction Publique et de la Modernisation de l’Administration Rencontre mensuelle avec les responsables informatiques des départements ministériels.
Thibault ROY Université de Caen / Basse-Normandie Laboratoire GREYC / Équipe ISLanD Le corpus comme environnement d’analyse et d’interactions pour l’utilisateur.
1 Apport des services Web dans l'amélioration de l’accès à l’information sur le Web. Christian Belbeze & Chantal Soulé-Dupuy Institut de Recherche en Informatique.
BAC STG GSI EPREUVE PRATIQUE.
Thibault ROY & Olivier SAGIT Exposé du mercredi 17 décembre 2003 Apprentissage Interactif Apprentissage avec SpamAssassin UFR de Sciences Département d’Informatique.
Équipe ISLanD Laboratoire GREYC Université de Caen / Basse-Normandie Des outils pour chercher sur la Toile Fête de la Science 2005.
Organisation et fonctionnement Un PN fonctionne avec un directeur et un CS, - directeur et CS sont nommés séparément par l’INSU - lors de sa première réunion.
Services en Text Mining. Introduction : Qui est Mentis ? Mentis a été fondée en 2005 comme une société spin-off du Laboratoire d'I ntelligence Artificielle.
TEXT MINING Fouille de textes
Travaux Parlementaires Guide d’utilisation 28/07/
Module 2 2. Communiquer par le biais de la messagerie interne.
EFI Introduction à l’adaptation sociale et scolaire EFI 2243 INTRODUCTION À L’ADAPTATION SOCIALE ET SCOLAIRE Plan de cours Site Web Formation des.
Partie 1 : clés de lecture d’un monde complexe
Démarche d’enseignement de l’APL : analyser
Présentation de Facebook
NEDERLEX : un outil en ligne d'aide à la lecture de textes en langue étrangère. G. Deville - M. Miceli (Ecole des Langues Vivantes - FUNDP) L. Dumortier.
Intervention ReRIP – 26 mars 2008 – Mathilde Guiné Le Réseau Tela Botanica Un réseau d’acteurs au service de la botanique francophone Le projet "Outils-réseaux"
CVM Université Hassan II Casablanca.Centre de Ressources Universitaires pour le E-Learning CRU1 Rencontre des responsables des CRU Axe I: Formation des.
La brique documentaire et le CDI Virtuel dans l'ENT.
Association régionale pour la formation, l’orientation et l’emploi Mode d’emploi Portail internet Aquitaine Cap Métiers Novembre 2011 Service éditions.
Transcription de la présentation:

Thibault ROY Université de Caen / Basse-Normandie Laboratoire GREYC – Equipe ISLanD Apport d’outils d’informatique documentaire à l’analyse de forums de discussion Intérêt de « vues » globales sur des forums de discussion IUFM de Rouen – 20 juin 2005

Thibault ROY – Université de Caen 2 Plan de la présentation 1. Cadre et objectifs 2. Outils logiciels utilisés 3. Quelques expériences réalisées avec ces outils 4. Conclusion et perspectives

Thibault ROY – Université de Caen 3 Plan de la présentation 1. Cadre et objectifs 2. Outils logiciels utilisés 3. Quelques expériences réalisées avec ces outils 4. Conclusion et perspectives

Thibault ROY – Université de Caen 4 Constat de départ De plus en plus de documents électroniques textuels (pages Web, s, messages de forums, etc.) : sur le Web, sur des réseaux universitaires, d’entreprises, etc. De plus en plus d’outils proposent des accès au « contenu » d’ensembles documentaires Le principal problème : outils peu transparents et aux résultats généralistes et discutables

Thibault ROY – Université de Caen 5 Cadre d’étude L’Informatique et le Traitement Automatique des Langues L’instrumentation pour la veille documentaire : Les analyses thématiques et sémantiques d’ensembles documentaires La prise en considération du point de vue de l’utilisateur sur la tâche L’utilisation de techniques de visualisation

Thibault ROY – Université de Caen 6 Objectifs visés dans l’analyse de forums de discussion A partir de thématiques intéressant un utilisateur dans l’analyse de forums : Proposer des interfaces de « lecture rapide » personnalisées de forums Observer la répartition de ces thématiques dans les discussions Mettre en évidence de la valeur ajoutée des outils dans de telles analyses

Thibault ROY – Université de Caen 7 Plan de la présentation 1. Cadre et objectifs 2. Outils logiciels utilisés 3. Quelques expériences réalisées avec ces outils 4. Conclusion et perspectives

Thibault ROY – Université de Caen 8 Outils logiciels utilisés MemLabor : Extraction de graphies répétées dans les documents d’un corpus ThemeEditor : Coloriage thématique de documents ProxiDocs : Cartographie et catégorisation thématique de corpus

Thibault ROY – Université de Caen 9 MemLabor (Perlerin 2002) Entrée : Un ensemble de textes Traitements réalisables : Extraction de graphies répétées dans le corpus avec filtrage par un anti-dictionnaire Hypothèse fondamentale exploitée dans MemLabor : Plus une graphie est répétée dans un corpus de textes, plus elle est susceptible d’être associée à l’un des thèmes abordés dans ce corpus Sortie : Une liste des graphies répétées dans le corpus classées par ordre décroissant de fréquence d’apparition

Thibault ROY – Université de Caen 10 ThemeEditor (Beust 2002) Entrée : Un ensemble de textes Traitements réalisés : Assistance à l’utilisateur pour le regroupement de graphies et de lexies en thèmes (regroupement non exclusif) Projection de ces thèmes sur les textes de l’ensemble à l’aide de techniques de coloriage Sorties : Des classes de mots relevant de mêmes thématiques Des documents coloriés « thématiquement »

Thibault ROY – Université de Caen 11 ProxiDocs (Roy 2005) Entrées : Des classes de mots relevant de mêmes thématiques Un ensemble de textes Traitements : Projection des textes vers des espaces à 2 ou 3 dimensions selon les thématiques abordées Catégorisation thématique des textes en un nombre de groupes choisis par l’utilisateur Sorties : Des représentations graphiques (que nous appelons des cartes) en 2 ou 3 dimensions mettant en évidence la répartition des thématiques de départ dans les textes de l’ensemble étudié

Thibault ROY – Université de Caen 12 Plan de la présentation 1. Cadre et objectifs 2. Outils logiciels utilisés 3. Quelques expériences réalisées avec ces outils 4. Conclusion et perspectives

Thibault ROY – Université de Caen 13 Première expérience : analyse d’un forum de discussion Le forum de discussion utilisé : Issu de la plate-forme INES Propose à des étudiants de DEUST Technicien des Systèmes d'Information et de Communication d’échanger des messages en rapport avec leur module de programmation Constitué d’environ 200 messages échangés entre le 18/02/2003 et le 27/04/2005 par 27 intervenants différents (enseignants et étudiants)

Thibault ROY – Université de Caen 14 Premier traitement : extraction des graphies répétées dans les messages Utilisation de MemLabor Entrées : Fichier XML décrivant le forum Liste de mots grammaticaux Sorties : …

Thibault ROY – Université de Caen 15

Thibault ROY – Université de Caen 16 Deuxième traitement : regroupement des graphies en thèmes et coloriage thématique des messages du forum Utilisation de ThemeEditor Entrée : Fichier XML décrivant le forum Sorties : Des thèmes construits par l’utilisateur selon son point de vue Des thèmes construits par l’utilisateur selon son point de vue Des messages du forum coloriés…

Thibault ROY – Université de Caen 17

Thibault ROY – Université de Caen 18 Troisième et dernier traitement : cartographie thématique du forum Utilisation de ProxiDocs Entrées : Fichier XML décrivant le forum Les thèmes construits par l’utilisateur avec ThemeEditor Sorties : Des cartes thématiques construites à partir du forum et des thèmes Des cartes thématiques construites à partir du forum et des thèmes

Thibault ROY – Université de Caen 19 Seconde expérience : analyse d’une liste de diffusion La liste de diffusion étudié : Contient environ 7000 messages entre le mars 1997 et novembre 1999 Regroupe des professeurs de Sciences Économiques et Sociales du second cycle sur différents sujets L’extrait analysé : Contient environ 2000 messages échangés entre le 1 er janvier 1998 et le 31 décembre 1998 Les thèmes construits avec ThemeEditor Les cartes construites avec ProxiDocs Cartes « classiques » Cartes « dynamiques »

Thibault ROY – Université de Caen 20 Plan de la présentation 1. Cadre et objectifs 2. Outils logiciels utilisés 3. Quelques expériences réalisées avec ces outils 4. Conclusion et perspectives

Thibault ROY – Université de Caen 21 Bilan des expériences précédentes Visualisation des principales thématiques intéressant l’utilisateur abordées dans les messages des forums Limites rencontrées : Perte (partielle) des fils de discussion Outils réellement exploitables sur des forums de taille moyenne (plus d’une centaine de messages) Pas de réelle expertise a priori des forums analysés

Thibault ROY – Université de Caen 22 Perspectives Proposer des vues à différents niveaux de granularité Exploiter la dynamique thématique temporelle des forums Aller vers une représentation plus fine des thématiques prises en considération dans les analyses Réaliser une véritable évaluation des outils dans des tâches d’analyses de forums

Thibault ROY – Université de Caen 23 Merci de votre attention Pour plus d’information sur ces outils :

Thibault ROY – Université de Caen 24

Thibault ROY – Université de Caen 25 Forums de discussion Espaces de discussion sur Internet ou sur des réseaux locaux : Fonctionnant de manière asynchrone Dans lesquels chacun est libre de consulter les messages et d'y répondre Généralement articulés autour d'un sujet ou plusieurs sujets donnés Dans certains cas, modérés et animés par des membres

Thibault ROY – Université de Caen 26 Listes de diffusion Forums de discussion d’un type particulier : Un abonnement à la liste est nécessaire Les messages circulent par s Chaque message est envoyé à toutes les personnes dont l’adresse électronique figure dans la liste de diffusion