Appréhender dynamiquement les textes à plusieurs niveaux de détail

Slides:



Advertisements
Présentations similaires
Pays du Bessin au Virois Portail Internet du Pays
Advertisements

Création de matériaux pédagogiques et approche par tâches
Evaluation et suivi sont deux outils de management:
Algèbre de composants : une approche fonctionnelle à la sémantique de documents Bart Lamiroy LORIA/INPL QGar - École des Mines de Nancy.
Direction générale de la santé Mo VII-5-1 Des résultats évalués : vers un tableau de bord de la santé en France Lévaluation.
De linformation à la gestion des connaissances Introduction J. LINK-PEZET Dess SIAD Janvier 2001.
EMILE à l’ECOLE (2 ième année)
ENQUETE ANNUELLE DENTREPRISES DANS LE SECTEUR DU COMMERCE (EXERCICE 2004) ROYAUME DU MAROC HAUT COMMISSARIAT AU PLAN DIRECTION DE LA STATISTIQUE.
Aspects cognitifs de la gestion d’environnements dynamiques
Navigation Interactive dans les documents
Navigation Interactive dans les documents Brigitte Grau et Jean-Paul Sansonnet J.P. Fournier, N. Hernandez, M. Hurault-Plantet, J-C. Martin, G. Pitel,
Projet VISU Proposition d'interface & avancées personnelles.
2 et 3 juin 2004 Journées détude de lopération « sémantique et corpus » La place des méthodes quantitatives dans le travail du linguiste 1 Etude de la.
Le texte scientifique Vise une validité générale,
Indexation textuelle : Systèmes de recherche d’informations
- TUTORIAL MCIE - Méthode de Conception d’Interfaces Ergonomiques
Liens Hypertextes et Langage HTML
Une stratégie départementale pour le développement de lenseignement des langues vivantes à lEcole.
Conception de l’évaluation
Quelques règles à respecter pour concevoir une présentation dynamique et sobre Dans un cadre scolaire D. G. Formation APEP
Jean-Didier Dufour, enseignant en Sciences sociales
Le point sur les nouvelles épreuves du baccalauréat
La carte mentale.
Evaluation des besoins en renforcement des capacitEs
Présentation du Cadre Européen Commun de Référence des Langues
UE : 3.4. S4 Initiation à la démarche de recherche
HIERARCHIE DE L’INFORMATION
Le 25 mars 2014 Pôle Formation Insertion Langue Trigone- CIREL.
Recherche Documentaire et traitement de l’information
Développement d’un réseau social professionnel
Blagovesta Cholova POLI-D-404: Etude approfondie de questions de science politique Groupe ‘Populisme et partis populistes’ Blagovesta.
LA COMPREHENSION EN LECTURE
ÉPREUVE - ÉCONOMIE DROIT
Cadre européen commun de référence pour les langues
Initiation aux outils de recherche bibliographique dans le cadre de la réalisation dune séquence de formation à la recherche documentaire Luc Verdebout.
Thème 8 : l'observation et l'expérimentation
La métaphore dans lhypermédia : effets sur la navigation Etude empirique exploratoire.
Séance d'information aux étudiants Présentation préparée par: Ghyslain Gagnon Professeur au département de génie électrique ELE792PROJET DE FIN D'ÉTUDES.
Présentation du mémoire
Pour une lecture efficace
Département fédéral de l’intérieur DFI Office fédéral de la statistique OFS Rapport sur le développement durable 2012 – Le système d’indicateurs MONET.
Dans cet article, une nouvelle approche relative à l’indexation de la bande sonore de documents audiovisuels est proposée, son but est de détecter les.
Méthodologie de recherche
LA COMPREHENSION 10 Décembre REFLEXIONS PREALABLES Récolter/recueillir des informations  Aspect fonctionnel, nécessaire mais pas exclusif.  Mobiliser.
Rédaction d’un écrit de gestion Commission professionnelle du Secrétariat général Boîte à outils - le mercredi 9 avril 2008 Jacques Richer - CSSMI Commission.
Les épreuves du BTS Systèmes photoniques
CUCS Source : les Cahiers de l’AVISE N°5 : Evaluer l’utilité sociale de son activité - conduire une démarche d’auto-évaluation DÉVELOPPER UNE.
Arkhênum Patrimoine du Futur. Répartitions par types d’erreurs mineures.
Journées de Rochebrune, 26 janvier 2006, Analyse cognitive de la demande Journées de Rochebrune Journées de Rochebrune Rencontres interdisciplinaires sur.
Stage « Lire-écrire au cycle 2 dans un contexte bilingue »
Projet ELLEN Interface d’aide à la reformulation et au reformatage de documents encyclopédiques structurés Philippe VIENNET Christophe COURTAUX Alexis.
L’ergonomie des IHM : pourquoi, comment ?
Techniques documentaires et veille stratégique Anne Pajard, avril 2008
Thibault ROY Université de Caen / Basse-Normandie Laboratoire GREYC – Equipe ISLanD Apport d’outils d’informatique documentaire à l’analyse de forums de.
BACCALAUREAT PROFESSIONNEL 3 ANS MICROTECHNIQUES Quelques points clés.
Initiation a des recherches dans domaine de l’enseignement
STRATÉGIES EN LECTURE PLANIFIER MA LECTURE
Apprentissage semi-supervisé avec des modèles discriminants : application au résumé automatique de texte Massih-Réza Amini LIP6, Université de Paris VI.
Bilan du cours Information Spécialisée M1 RETIC. Objectifs du cours (annoncés) Acquérir une culture informationnelle en SIC ; Acquérir une culture informationnelle.
Démarche d’enseignement de l’APL : analyser
Introduction au HTML Qu’est ce que le HTML ?
Comment faire un résumé d’article ?
SBA 2016 M ANIFESTE /01/2016 – W ORKSHOP 1.
MES STRATÉGIES DE LECTURE
Enfant, élève, apprenant Un projet de recherche Bertrand DAUNAY Professeur en sciences de l’éducation, didactique du français Université Charles-de-Gaulle.
Lancement du projet de refonte du portail eaufrance Groupe de coordination inter bassins 28/01/2014 – Anne Macaire.
Modèle de présentation Forêt, économie verte et lutte contre la pauvreté Ce modèle est celui de la présentation du rapport d’atelier lors de la plénière.
KOSMOS 1 Les activités de l’enseignant Module 6 1.Le cahier de textes des classes 2.Le travail à faire et les corrections 3.Le classeur pédagogique 4.Les.
Le nouveau manuel de FLE allons-y!
1 Philippe TRIGANO - Université de Technologie de Compiègne - FRANCE Philippe TRIGANO INGÉNIERIE MULTIMÉDIA PÉDAGOGIQUE.
Transcription de la présentation:

Appréhender dynamiquement les textes à plusieurs niveaux de détail Lydia-Mai Ho-Dac, Marie-Paule Jacques, Marie-Paule Pery-Woodley, Thomas Porquet et Josette Rebeyrolle, (ERSS), Mustapha Mojahid et Jacques Virbel (IRIT), Brigitte Grau, Christian Jacquemin, Michèle Jardino et Jean-Philippe Merienne (LIMSI), Massih-Reza Amini et Patrick Gallinari (LIP6), Thierry Baccino et Bérénice Closson (LPEQ)

Introduction Qu’apportent ou qu’exigent les nouvelles interfaces d’accès aux documents ? Quelles analyses (semi-)automatiques développer pour préparer ? Quels outils développer pour faciliter ? Quelles observations faire pour évaluer ? Sous la poussée des jeux, les technologies des cartes graphiques ont beaucoup évolué et offrent désormais des techniques d'affichage pour la visualisation dynamique de documents intégrant la transparence, la spatialisation, le flou, le rendu à plusieurs niveaux de détail, l'orientation tridimensionnnelle. Ces technologies offrent donc de nouvelles possibilités d'accès et de parcours (par ex. Small, 1990). Celles-ci autorisent des appréhensions évolutives en profondeur et en largeur du texte en fonction du texte lui-même et/ou de son parcours par l'utilisateur-lecteur. Il peut s'agir d'une forme de prise de connaissance efficace dans le cas de documents longs pour lesquels la forme « rouleau » (vs "codex") ou la structuration hypertextuelle peuvent ne s'avérer que partiellement satisfaisantes.

Plan Linguistique: nouvelles lectures et analyse des titres Informatique: segmentation automatique Psychologie: observation des stratégies de lecture Sous la poussée des jeux, les technologies des cartes graphiques ont beaucoup évolué et offrent désormais des techniques d'affichage pour la visualisation dynamique de documents intégrant la transparence, la spatialisation, le flou, le rendu à plusieurs niveaux de détail, l'orientation tridimensionnnelle. Ces technologies offrent donc de nouvelles possibilités d'accès et de parcours (par ex. Small, 1990). Celles-ci autorisent des appréhensions évolutives en profondeur et en largeur du texte en fonction du texte lui-même et/ou de son parcours par l'utilisateur-lecteur. Il peut s'agir d'une forme de prise de connaissance efficace dans le cas de documents longs pour lesquels la forme « rouleau » (vs "codex") ou la structuration hypertextuelle peuvent ne s'avérer que partiellement satisfaisantes.

Dynamisation de la lecture Analyse linguistique des titres

DYNAMISATION Affichage - Accès - Parcours Nouvelles technologies d’affichage pour la visualisation dynamique des documents transparence, spatialisation, flou, rendu à plusieurs niveaux de détail, orientation tridimensionnelle Nouvelles possibilités de prise de connaissance (accès et parcours) ≠ rouleau, codex, hypertexte Sous la poussée des jeux, les technologies des cartes graphiques ont beaucoup évolué et offrent désormais des techniques d'affichage pour la visualisation dynamique de documents intégrant la transparence, la spatialisation, le flou, le rendu à plusieurs niveaux de détail, l'orientation tridimensionnnelle. Ces technologies offrent donc de nouvelles possibilités d'accès et de parcours (par ex. Small, 1990). Celles-ci autorisent des appréhensions évolutives en profondeur et en largeur du texte en fonction du texte lui-même et/ou de son parcours par l'utilisateur-lecteur. Il peut s'agir d'une forme de prise de connaissance efficace dans le cas de documents longs pour lesquels la forme « rouleau » (vs "codex") ou la structuration hypertextuelle peuvent ne s'avérer que partiellement satisfaisantes.

ECONOMIE de la FACE VISUELLE des DOCUMENTS (1) Cinq composantes importantes : contexte technique ou économique de production, impact de valeurs culturelles, esthétiques ou expressives, genre rédactionnel, efficacité communicationnelle, contribution au sens du texte Dépendances et intrications —> Analyse ciblée vers le (re)traitement à des fins de dynamisation L’ANALYSE des DOCUMEBNTS en vue de leur AFFICHAGE DYNAMIQUE DOIT TENIR COMPTE DE DEUX ELEMENTS CORRELES : 1) L'immense majorité des documents, de facture "classique" ou en référence implicite à l'écrit sur papier, présentent des modes de structurations et de manifestations visuelles directement déterminées par ce contexte. OR, la face visuelle des textes, i.e. : le mode de présentation de l’information textuelle, comporte pour l'essentiel cinq composantes principales : le contexte technique ou économique de production, l'impact de valeurs culturelles, esthétiques ou expressives, le genre rédactionnel, l’efficacité communicationnelle et la contribution au sens du texte. Ces cinq composantes entretiennent de multiples dépendances, et sont par le fait intriquées les unes aux autres. Ces dispositifs dans leur ensemble sont associés à une acception statique et inerte du texte en tant qu'objet intangible, mais ils sont si profondément intériorisés dans les pratiques, des auteurs comme des lecteurs (et positivement sanctionnées par une expérience multiséculaire), qu'il paraîtrait aventureux de les ignorer dans la dynamisation de l'affichage, ou même de sous-estimer leur impact dans l'accès aux textes. —> Il est donc nécessaire de les réanalyser en fonction de leur rôle et de leur économie propres, dans la perspective de leur manipulation et de leur éventuel retraitement à des fins de dynamisation.

ECONOMIE de la FACE VISUELLE des DOCUMENTS (2) Présentation « inerte » / anticipation de processus d’utilisations variées lecture suivie exhaustive lecture par sauts de niveaux relecture consultation rétrospective ponctuelle « feuilleter » « lecture en diagonale » (superlecture) recherche ciblée inédite … Importance des systèmes de titres 2) Si la conception classique du texte ne permet pas d'organiser une dynamique de sa présentation, elle permet en revanche d'anticiper sur des dynamiques d'utilisation telles que la lecture suivie exhaustive de première prise de connaissance, mais aussi la relecture, le parcours de type "feuilleter", la "superlecture" (dite aussi lecture en diagonale), la consultation rétrospective, la recherche inédite ciblée, etc. Les mises en saillance visuelle, les segmentions et les typages de « passages », et les systèmes de titres jouent un rôle fonctionnel de signalisation capital —>Nécessité et intérêt de tenir compte de ce savoir introduit dans la facture même des textes pour concevoir l’instrumentation des usages dans le contexte informatisé.

Analyse linguistique des titres Les titres ont un rôle triple : délimiter des segments, informer sur le contenu de ces segments, les relier. 3.4 BESOINS DES USAGERS ; PROPOSITION DE DEFINITION D' UN CAHIER DES CHARGES DE L' INFORMATION A DELIVRER 3.4.1 BESOINS DES USAGERS L'étude devra permettre d'identifier les besoins réels des usagers en information : […] 3.4.2 CAHIER DES CHARGES DE L' INFORMATION ROUTIERE Le titulaire devra […], proposer un cahier des charges de l' information routière […] 1ère phrase + exemple : justification de pourquoi l’analyse des titres Puces : objectifs : 1 mettre en évidence des corrélations entre la forme des titres et leurs fonctions et particulièrement par rapport à l’organisation du contenu textuel 2 d’où le travail sur les liens entre titre et texte (reprise des éléments du titre et annonce du titre). caractérisation formelle et fonctionnelle des titres étude du lien entre titre et texte

Caractérisation formelle Un ensemble de formes diversifiées SN La géographie stratégique de l’ère nucléaire SV Penser la guerre totale SP Pour une "mondialisation durable" Phrase La place du pétrole dans le bilan énergétique est stable Coordination Recul de la pauvreté et inégalité internationale Ponctuation Décolonisation : une déconstruction politique et militaire Après le rapport Rumsfeld, les réorganisations en cours Une part de l’analyse a consisté à repérer finement les différentes formes possibles des titres, dont il y a ici des exemples. Les raisons de cet intérêt pour la forme des titres résident dans l’hypothèse de l’existence de corrélations entre la forme et le rang, sur lesquelles nous travaillons actuellement, et de corrélations entre le genre discursif et la forme, c’est là encore un travail en cours. corrélation rang/forme corrélation genre discursif/forme

Caractérisation fonctionnelle Le titre est-il un point d'accès pertinent pour le texte ? => analyser les fonctions des titres par rapport au contenu entre le titre et le texte qui précède entre le titre et te texte qui suit Observer les liens L’analyse linguistique a surtout visé une caractérisation fonctionnelle des titres, destinée à répondre à la question de savoir si les titres constituent des points d’entrée pertinents pour un accès sélectif au contenu textuel. Il s’agit donc de saisir comment les titres participent à la construction et à l’organisation du contenu du texte. Pour cela, l’analyse s’est focalisée sur les liens entre le titre et ce qui le précède et entre le titre et ce qui le suit. A l’heure actuelle, ce sont ces liens qui ont été exploités, à travers une focalisation sur le fait que le titre donne lieu à des reprises ou non dans le texte. Par une classification des types de reprises, nous avons visé une typologie fonctionnelle des titres, c’est ce qui est expliqué maintenant. classification formelle des types de reprises typologie fonctionnelle

Classification formelle des types de reprises Focalisation sur éléments formels : reprises / anaphores des titres formes des reprises localisation des reprises fonction syntaxique des reprises (sujet) On fait l’hypothèse que pour cerner la fonction du titre, il faut regarder ce que deviennent les éléments dont il est constitué dans la section titrée et que la manière dont ces éléments sont ou ne sont pas repris révèle l’implication du titre dans la construction et l’organisation du contenu textuel. Ont donc été définis un certain nombre de traits formels qui servent de base à un classement des reprises. Sans entrer dans le détail, ce sont des traits comme la forme des reprises, leur localisation, leur fonction syntaxique. Ce classement a permis l’élaboration d’une typologie fonctionnelle des titres qui se distribuent de manière scalaire entre deux pôles opposant les titres référentiels et les titres thématiques. typologie fonctionnelle des titres : émergence de deux pôles

Titres réferentiels fonction : préciser le ou les référents dont la suite du texte va parler. processus interprétatif : attirer l’attention du lecteur sur un ou des référents du discours particulier(s) 2.2.4 BULLETIN PREVISIONNEL Ce bulletin est transmis par télécopieur au CIGT 31 du lundi au samedi vers 16h00. Il recense, pour la zone d’action du CRICR du Sud-Ouest, les perturbations (travaux, manifestations,...) attendues pour le lendemain, l’état prévisionnel du trafic du lendemain […]

Titres thématiques fonction : délimiter un cadre thématique dans lequel s’inscrit ce dont on va parler : un domaine d’activité, un domaine de connaissances, un point de vue, une situation spatio-temporelle, etc., spécifiques. processus interprétatif : canaliser certaines des connaissances d’arrière-plan du lecteur. 4.1.3. D’un point de vue technique Premièrement, l’interface a été conçue pour inciter les étudiants à utiliser certains outils (même si l’on savait à l’avance que, en toute hypothèse, les étudiants font ce qu’ils veulent ; ainsi, certains ont utilisé un outil externe de mail) ; [...]

Perspectives des travaux linguistiques (1) Vers des méthodes et outils d’encadrement et d’étagement des textes: Diversification de types fonctionnels de titres Objets intermédiaires entre titres et résumés (surtitres, accroches, chapeaux, etc.) Objets intermédiaires entre corps et annexes Des pistes possibles 1) L’observation de la pratique empirique du logiciel Powerpoint (et malgré certains limites, cf. Tufte 2000) peut être suggestive par rapport aux aspects qui permettent d’animer l’introduction et l’évolution de n’importe quel chunk de texte, et la reprojection aisée, à l’identique ou non, de n’importe quel élément (par ex. : une table des matières reprojetée à chaque changement de partie, l’item dénotant celle où l’on arrive étant distingué dans la table ; ou bien une extension généralisée des titres courants). 2) De nombreux magazines de grande diffusion (par ex. Télérama, le Monde2, etc.) ont développé des designs originaux d’accès et de parcours des textes, qui tiennent compte de ce que les lecteurs sont susceptibles de pratiquer plusieurs types de lectures, dont la lecture suivie et exhaustive n’est qu’un cas très particulier, et dont la plupart correspondent à des formes différentes des activités « feuilleter » et « parcourir ». Dans ce contexte, un même article peut être signalisé par un ensemble d’OT spécifiques, et qui vont du résumé au titre classiques, en passant par diverses sortes de sur-titres (ou avant- titres), sous-titres, inter-titres, accroches, exergues et (auto)citations, manchettes, encarts, incipits en saillance, etc. Seuls certains sous- ensembles de ces procédés sont réputés efficaces pour un niveau de lecture donné, mais ensemble ils constituent un dispositif d’étagement d’extension de l’information. 3) Les mêmes types de publication ont aussi développé des formes nouvelles de tables de matières, qui comportent non seulement les titres d’articles ou de rubriques régulières, mais un grand nombre de données supplémentaires : l’intérêt ou l’importance ou la nouveauté, etc. (qui peut être rendu par des procédés TD, par ex. la couleur des caractères ou de leurs fonds, qui se rajoutent à ceux qui rendent la structure hiérarchique), la nature (« enquête », « lecture », etc.), la longueur, le focus majeur (par un résumé en trois lignes associé à l’item), etc.

Perspectives des travaux linguistiques (2) liens titre / texte suivant, vers une typologie fonctionnelle automatique liens titre / texte précédent, effet d'annonce liens entre titres titres et autres modes de structuration (cadres de discours) La description du rôle fonctionnel des titres doit être maintenant complétée par : L’automatisation du repérage des traits qui caractérisent les reprises, ce qui permettrait de déterminer automatiquement les types de titres. L’analyse des liens entre le titre et ce qui le précède, selon les mêmes modalités que celle des reprises. L’analyse des liens entre les différents titres d’un même document. Enfin, d’autres structures, comme les introducteurs de cadre de discours, jouent également un rôle dans l’organisation du contenu textuel, il faudrait examiner leurs interactions avec les titres.

Segmentation thématique de textes

Segmentation de textes Différentes approches Méthodes linguistiques Entités textuelles de base: mots ou groupes de mots Méthodes statistiques Entités textuelles de base: phrases ou paragraphes Les techniques d’apprentissage pour la segmentation de textes prônent une approche supervisé. Notre approche est à base d’apprentissage non- supervisé pour la segmentation thématique de textes Entités textuelles de base: paragraphes

Notre approche pour la segmentation Représentation des paragraphes dans l’espace des concepts Regroupement des paragraphes avec l’algorithme CEM similaire à l’algorithme EM t1 t2 t3 t4 Mots d1 d2 d3 Paragraphes t1 t2 t3 t4 d1 d2 d3 Mots Paragraphes "Concepts" c1 c2 c1 c2

Apprendre des concepts de mots Un concept: Groupement de mots formé à partir de la co-occurrence des mots dans les paragraphes Chaque mot w du vocabulaire est d’abord caractérisé par un vecteur représentant le nombre d’occurrence de w dans chaque paragraphe Chaque mot w est supposé être généré indépendamment par un mélange de densité de Gaussiennes hypersphériques

Les concepts sont trouvés en utilisant l’algorithme X-moyennes L’algorithme est une extension de l’algorithme des K- moyennes pour lequel le nombre de clusters est trouvé au lieu d’être fixé à l’avance -4 -2 2 4 6 BIC3+BIC4≤BIC2 BIC1 BIC2 BIC3, BIC4 BIC5, BIC6 BIC5+BIC6≥BIC1

Un exemple de groupement de mots trouvé

Groupement des paragraphes Les paragraphes sont supposés être générés indépendamment par un mélange de densités Les paramètres du mélange sont estimés en maximisant la vraisemblance classifiante avec l’algorithme CEM. L’algorithme K-moyennes est une instance de l’algorithme CEM dans lequel les densités sont supposées être des gaussiennes.

Expériences La collection 7sectors du projet Web-KB 3417 html articles, taille du vocabulaire : 16525, # de concepts trouvés: 217.

Evaluation Une comparaison entre notre approche (COS), l’algorithme CEM avec une représentation sac-de-mots des paragraphes (B0W) et l’algorithme de Salton et al. (c) : # de paragraphes correctement assignés à c (c) : # de paragraphes incorrectement assignés à c (c) : # de paragraphes incorrectement non-assignés à c

Evaluation (2)

Conclusions sur la segmentation thématique La segmentation thématique basée sur l’extraction de paragraphes avec une méthode d’apprentissage non- supervisé. Donne de bonnes performances comparée à l’algorithme de Salton et al. et un autre algorithme à base d’apprentissage non-supervisé Explication à base de variables Latentes.

Analyse oculométrique de la lecture dynamique spatialisée

Objectifs de l'expérimentation Quel est l’impact de la visualisation dynamique des documents Stratégies de lecture différentes ? Modulation dans la prise d’information et/ou la navigation ? Analyse des parcours oculaires sur 3 types d’interfaces:

Interfaces (visualisation dynamique) Interface simple Interface plate Interface 3D 24 textes: 12 textes (contenu connu: psychologie) 12 textes (contenu général) Appréhender dynamiquement les textes à plusieurs niveaux de détail Pages Contextuelles

Textes Niveau 1 Niveau 2 Niveau 3 Texte texte Texte Niveau 1 Niveau 2 Niveau 3 Les textes étaient présentés sur 3 niveaux et contenaient 9 pages Chaque page était accessible par un lien hypertextuel

Enregistrement des mouvements Méthodologie Mesures: Nombre moyen de pages lues Taux d’erreurs à un questionnaire Nombre et durées des fixations par page Analyse des scanpaths (trajectoires) Enregistrement des mouvements des yeux

Résultats Pour un niveau de compréhension identique. Le nombre moyen de pages lues: 3D < Simple < Plate [F(2,21) = 4.54 p<.025] Les lecteurs sont capables de moduler (i.e adapter) leur prise d’information uniquement sur l’Interface 3D. Niv 1 (Titre) < Niv 3 (Contenu) Identique pour les autres Interfaces

Interprétation La présence de pages contextuelles sur l’Interface 3D facilite l’intégration des informations par: Un repérage du paragraphe lu à l’intérieur du document Une représentation de la structure textuelle qui permet de moduler la prise d’information (i.e, accorder plus d’importance à certaines informations nécessaires à la compréhension).

Conclusion - perspectives Analyse des mécanismes cognitifs de lecture augmentée sur support électronique Réalisation de nouveaux terminaux pour l'accès aux documents avec des métaphores graphiques intuitives Automatisation et raffinement des outils d'indexation et d'analyse textuelle donnant représentations multi-niveaux

Références autour du projet Baccino, T. (2004). La lecture électronique, Presses Universitaires de Grenoble, Coll. Sciences et Technologies de la Connaissance. (254 pages). Caillet M., Pessiot, J.-F., Amini, M.-R. & Gallinari, P. (2004). Unsupervised Learning with Term Clustering for Thematic Text Segmentation, Actes de la 7ème Conférence Internationale en Recherche d’Information Assisté par Ordinateur, RIAO. pp. 1-11. Jacques, M.-P., Ho-Dac, L.-M. & Rebeyrolle, J. (2004). Quelques aspects méthodologiques d’une étude de la fonction discursive des titres en corpus. Actes Journée ATALA Modéliser et décrire l'organisation discursive à l'heure du document numérique, Semaine du Document Numérique, 22 juin 2004, La Rochelle. Merienne, J.-Ph. et Jacquemin, C., (2003). Large XML Document Manager and Visualizer. In Proceedings, EUROGRAPHICS 2003, Granada, Spain. Virbel J (ed.) (2002) Inscription Spatiale du Langage. Actes des Journées « Cognitique », Toulouse, IRIT, janvier 2002.