SOUTENANCE D’HDR La recherche d’information sur Internet au prisme de la théorie des facettes Eric Boutin le 9 Octobre 2008.

Slides:



Advertisements
Présentations similaires
Qu’est-ce que LingPro ? LingPro est la branche ingénierie linguistique de i-KM La collaboration i-KM / LingPro est le résultat d’un partenariat sous forme.
Advertisements

Conférence « Compétences Informatiques » 10 avril 2006
© maxime moulins
Les déterminants des investissements des salariés dans les FCPE d’Actionnariat Salarié Monsieur le Président, messieurs les membres du jury, je vous remercie.
Du positionnement épistémologique à la méthodologie de recherche
des Structures de Santé
1 Conférence des Ministres de lagriculture de lAfrique de lOuest et du Centre de lAfrique de lOuest et du Centre Chargé Information Communication CMA/AOC.
1 COMMISSION AFRICAINE DES STATISTIQUES AGRICOLES (AFCAS) Accra, Ghana, 28 – 31 Octobre 2009 Paul NGOMA-KIMBATSA Statisticien Division de la Statistique.
Inventaire des Outils en ETP: étude transrégionale Marie-Lise LAIR, Centre de Recherche Public de la Santé, Luxembourg.
Territoire, bien-être et inclusion sociale Les outils de l'Intelligence Territoriale pour les acteurs à Seraing : entre appropriation des méthodes et acquisition.
ECONOMIE BTS 1&2 LES OBJECTIFS
QUELS TABLEAUX DE BORD POUR MANAGER LES PÔLES ?
Projet PATH-SSR Développement d’Indicateurs de Performance en SSR
Comment conserver les fondements de base de l’esprit scientifique?
Maladie d’Alzheimer L’état de la recherche en France
La Plateforme de travail collaboratif pour les pôles de compétitivité Rhônalpins Lionel Poinsot – Directeur de lENE TIC et Territoire // Lyon le 13 juin.
1 er décembre 2005Projet ILD&ISTC1 Langues et documents Perspectives.
BILAN L.E.R.M.A Gérard Hugues 8 février 2010.
Eric BONJOUR, Maryvonne DULMET
Indicateurs de position
A Post-Bac Portail unique dmission À partir du 20 janvier 2013 Inscription du 20 janvier au 20 mars 2013.
1 Démarche dinvestigation Epreuve Pratique en S. 2 Culture scientifique acquise au collège A lissue de ses études au collège, lélève doit sêtre construit.
Bruxelles Accès aux savoirs et à la culture : élément du bien être Prospective Research for Brussels
IronWEB : Une architecture distribuée
1 TICE 2000 / Troyes / octobre 2000 Des moteurs de recherche efficaces pour des systèmes hypertextes grâce aux contextes des nœuds Des moteurs de.
Journée détudes Observatoires Locaux de lInnovation 21 avril 2005 – Saint-Etienne CREUSET – BETA – OST - INIST Journée Observatoires Locaux de lInnovation.
DOSSIER TICE 2006 MASSON Wendy 1 ère année sciences du langage
LES METIERS ET LES DOMAINES DE LA RECHERCHE
Insertion professionnelle à PolytechLille – promo ,5 % de réponses Temps de recherche 50 % contrat signé avant sortie de Polytech 22,5 % moins de.
Safae LAQRICHI, Didier Gourc, François Marmier {safae
Conception d’une application de gestion de fiches études
Avis de lAQIISTI sur la formation infirmière en systèmes et technologies de linformation: composante essentielle au développement de la pratique infirmière.
Diane Giorgis - Catherine Darrot
Les personas : une méthode pour l’intelligence client ?
Sélection automatique d’index et de vues matérialisées
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
STI 2D Baccalauréat Sciences et Technologies de l’Industrie
Plateforme de revues et d’articles en sciences humaines et sociales
Educnet, le site de la SDTICE
La méthodologie………………………………………………………….. p3 Les résultats
Musée national dart moderne George Pompidou Quelles nouvelles technologies internet à lhorizon ?
GIDEM : Gestion intégrée
Laboratoire Sciences Pour l’Environnement
Tarif et qualification des traducteurs : des indicateurs de qualité ?
Groupe de travail Veille collective
Partenariat CGEM - Université
1 WALLONIE-BRUXELLES INTERNATIONAL PROGRAMME DE BOURSES A LETRANGER.
Adaptation et intégration d'un module du Langage Parlé Complété (LPC) dans l'agent conversationnel Greta Mohammed ZBAKH Encadré par Mme. Hela DAASSI M.
DEVELOPPEMENT DURABLE » « Penser global, agir local »
Séminaire de recherche méthodologique Jeudi 13 octobre 2005 Fabrice De Zanet Florence Stinglhamber Salvatore Tinnirello Responsable académique : Jean-Marie.
Vuibert Systèmes dinformation et management des organisations 6 e édition R. Reix – B. Fallery – M. Kalika – F. Rowe Chapitre 4 : Laide à la communication.
Recherche Documentaire et traitement de l’information
Sorel Tracy, le 15 octobre 2004 Stéphane Masson, Directeur adjoint – délégué aux partenariats La Cité des matières Une mise en culture des sciences et.
SCIENCES DE L ’INGENIEUR
ENT Espaces Numériques de Travail.
Date / references Systèmes Terre et Interarmées Projet OUTILEX Rapport détude final Octobre 2006.
1 M2-MC3-Parcours EIAH/DU-TICE Spécialité MC3
Guide de Préparation d’une soutenance du Projet de Fin d’Etudes
Journée de lancement du Réseau Thématique Pluridisciplinaire 32
La création de connaissance opérationnelle au Japon
EPSYLOG Présentation du Morgane Wüthrich
D.Delaunay-Verneuil - Technologies et handicap dans un centre de documentation (2008)1 CRÉATION DUN PÔLE DEXPERTISE « TECHNOLOGIES ET HANDICAP » DANS UN.
Détecter linnovant sur le web par des techniques non booléennes : méthode, outils, application Eric Boutin, USTV, Gabriel Gallezot,
P ROJETS P ILOTES Campus AAR Valérie LEGRAND 30 septembre 2014 ESCoM-AAR, Fondation Maison des Sciences de l’Homme.
Méthodologie de recherche 1ère partie
Master 2 COGNITION LANGAGE EMOTIONS, Spécialité CLE Responsable : Pr.F.Labrell Laboratoire d’adossement : CLEA (Cognition, Langage, Emotions et Acquisitions)
TEXT MINING Fouille de textes
Introduction à la rédaction Scientifique
PLAN DE L’EXPOSÉ 1) Introduction 2) Méthodologie
KOSMOS 1 Outils transversaux Module 7 1.L’annuaire 2.La recherche d’informations 3.La réservation de ressources.
Transcription de la présentation:

SOUTENANCE D’HDR La recherche d’information sur Internet au prisme de la théorie des facettes Eric Boutin le 9 Octobre 2008

Plan de l’exposé I- La recherche d’information sur Internet au prisme de la théorie des facettes Contexte Théorie des facettes Méthode expérimentale Résultats II- Projet de recherche Ancrage en SIC & transversalité Étude et utilisation des réseaux Méthodologie

Une démarche intuitive à l’origine de mon objet d’étude Une même requête… …différentes attentes Handicap Dossier de veille Exposé pour la maîtresse … Attaques Informationnelles

Intégration d’indicateurs au prototype Lisibilité Accessibilité Polarité Subjectivité … Indicateurs Facetmap

Problématique : Proposer un indicateur de pertinence centré sur l’utilisateur WEB Web Google : Une vision unique & globale du monde Objectif : plusieurs vues du monde … selon le contexte

Classifications : hiérarchique / à facettes (DDC) Exemple : code désignant les maladies virales du riz  633 189 8 633 = céréales 633.18 = riz 633.189 = maladies du riz 633.189.8 = maladies du riz d’origine virale « Pigeon hole » Ranganathan - 1924

Classifications : hiérarchique / à facettes (Colon) Exemple : code désignant les maladies virales du riz  EJ,381;421:5 Chaque objet est décrit par 5 facettes : P : personnalité M : matière E : énergie S : espace T : temps EJ = agriculture : facette principale 381 = riz : facette Personnalité 421 = maladie virale : facette Matière 5 = éradication : facette Énergie Démonstration de legos à l’origine de la théorie des facettes en 1924 D’après Garfield (1984)

Méthodologie PSYCHOLOGIE APPLIQUEE LINGUISTIQUE COMPUTATIONNELLE Marqueurs candidats Lisibilité Accessibilité Polarité Subjectivité Indicateurs outils dico Richesse lexicale Nombre de syllabes par mot Nombre de mots par phrase Université Descartes Dico occurrences Balise textuelle par image Contrastes entre couleurs Dico de valence Univ. Catho. de Louvain Dép. de psychologie Polarité des termes Rôle des pronoms personnels (je) Marques de ponctuation (!) Nombre d’adjectifs par phrase Verbe au conditionnel Adresse URL du site TextPipe Pro WebPipe Pro FOUILLE DE DONNEES TEXTUELLES

Méthode expérimentale : exemple polarité Aspiration de pages web WebPipe Pro Corpus de pages Dictionnaire De valence Dictionnaire langue Qualification automatique négative neutre positive négative Pages consensuelles Qualification humaine Test de Concordance De Kappa

Résultats par facette Lisibilité Accessibilité Polarité Subjectivité Pages consensuelles 80 % … 61 % Concordance Humain / Machine 66 % 65 % 85 %

Positionnement de ce travail Ancrage en SIC et transversalité S’adapter pour survivre Avoir des logiques transversales Étude et utilisation des réseaux Comprendre et traiter les réseaux Travailler en réseau Méthodologie Utiliser une méthodologie de constitution d’état de l’art Effectuer une veille scientifique efficace

La fragmentation des savoirs Quantité d’information disponible Temps D’après Swanson - 1986 Importance des logiques transversales

Logiques transversales de ce mémoire Application à la recherche d’information Documentation Théorie des facettes HDR Médecine psychologie Test de Kappa Usage des TIC Valence, subjectivité, lisibilité, accessibilité Science du web Linguistique computationnelle Psychologie

Logiques transversales de mon cursus Théorie de l’Engagement Information / Communication Théorie des organisations Sémiologie Culture COMMUNICATION 5 6 14 7 7 INFORMATION 7 5 9 cursus 1995-1997 1998-2000 2001-2003 2004-2006 2007-2008 PSYCHO ; SOCIO LINGUISTIQUE ; GESTION Linguistique Psychologie Sociologie Gestion

Logiques transversales des doctorants co-encadrés 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 Hajer, Maher, Dang Hanene Intelligence Economique et Territoriale Pedro Franck Philippe Roberto Pei C C C C Analyse réseau Jean Pierre Découverte de connaissances Jean Do Médiatisation Eve Guillaume Mohamed Sciences du web C Natacha Stéphane C Thèse en cotutelle

Réseau des collaborations depuis 1999 A : laboratoire Crrm ou doctorants de Luc Quoniam B laboratoire I3M site de Toulon + Gallezot C 2 chercheurs du Loria D Chercheurs de l’Université de Commerce du Vietnam E école normale de Shanghai Eric Boutin Légende Sociopro doctorant 45 collaborations MCF ou PR

Contrats de recherche Détermination automatique de la polarité de pages web sur le web chinois 2008 Découverte de connaissances dans le domaine médical 2005-2007 Prise en compte de facteurs colorimétriques dans l’indicateur de pertinence des moteurs de recherche 2006 2005 Étude du Web public en région PACA Élaboration d’un booster de pertinence de moteur de recherche 2000-2004

Construction de l’état de l’art : méthode Liste de réponses 1 2 3 4 5 6 7 8 9 10 … N disjoint Ma biblio 66 44 57 Interactions = collaboration, citation, concept commun

Vers une veille scientifique Front de recherche Base intellectuelle Analyse de citation Analyse réseau Indicateur de centralité

Limites, prolongements … perspectives Caractère réducteur des facettes Limite de l’interface Prolongements : Académiques : publications scientifiques Valorisation industrielle Perspectives de recherche : D’autres chantiers dans le domaine des sciences du web Collaborations internationales en Asie et au Maghreb