Projet VISU Proposition d'interface & avancées personnelles
Proposition dinterface
Proposition d'interface Résumé des mails de C. Jacquemin (LIMSI – 16/09/2003) et T. Baccino (LPEQ – 17/09/2003). Etude des différences entre une interface plane et une interface en perspective. Objectif : "Rôle de la mise en espace et des informations linguistiques dans l'accès à l'information".
Type de document utilisé Documents hiérarchisés Composés : –D'une racine (Niveau 1) contenant deux liens menant vers –2 pages intermédiaires (niveau 2) avec 2-3 liens allant vers –5-6 pages terminales (niveau 3).
Schéma général Niveau 1 Niveau 3 Niveau 2
Un exemple (1) Page racine (Niveau 1) Liens
Un exemple (2) Pages intermédiaires 1 & 2
Un exemple (3) Pages terminales (Niveau 3) issues de la première page intermédiaire
Un exemple (4) Pages terminales (Niveau 3) issues de la seconde page intermédiaire
3 interfaces à comparer (1) Interface page à page : –Sans contexte droit & gauche –Passage d'une page à l'autre par glissement latéral
3 interfaces à comparer (2) Interface "Mur en perspective" : –Au centre (à plat), le niveau visualisé –A gauche (en perspective), le niveau supérieur (si il y en a un) –A droite (en perspective), le niveau inférieur (si il y en a un)
3 interfaces à comparer (3) Interface avec contexte sans distorsion de perspective : –Du même type que la seconde –S'appuie sur la structure hiérarchique du document –Les trois niveaux sont plats : il n'y a plus de perspective à gauche & à droite
Expérience du LPEQ : Textes proposés 24 textes : –12 documents connus pour des étudiants de psychologie –12 documents moins connus Longueur des textes : 5-6 pages Textes analysés à l'aide de l'analyse sémantique latente (LSA) : –Textes calibrés sémantiquement intratexte (au sein des 5 pages) –et intertexte (pour une même discipline)
Facteurs expérimentaux & sujets Sujets : des étudiants en psychologie Facteurs expérimentaux : –Présentation visuelle (glissement latéral, …) : facteur intersujets : étude de la mise en place de stratégies de navigation –Connaissance du domaine (connu VS. non- connu) : facteur intrasujet Tâche : tâche de lecture avec enregistrements oculaires
Textes proposés (2) Taille : 20 lignes environ Découpés en 5-6 pages Le texte a un titre Chaque page a aussi un titre Score LSA : proximité (de –1à +1) entre le titre et le texte de la page
Exemple de texte L'âge adulte L'âge adulte (0,15) : Quand nous sommes adultes, l'âge ne permet plus de prédire avec précision ce que seront nos expériences et nos traits. Pourtant d'une certaine façon, notre corps, notre esprit et nos relations restent soumis à des changements prévisibles. Aussi longtemps que nous vivons, nous nous adaptons. Changements physiques (0,31) : Le déclin physique à peine perceptible qui survient au début de l'âge adulte commence à s'accélérer au moment de la maturité. Chez la femme, le changement physique le plus signifiant de la vie adulte est la ménopause, qui est le plus souvent une transition douce plutôt qu'une rupture brutale. Après 65 ans (0,01) : Les capacités perceptives, la force et la résistance diminuent mais les maladies bénignes sont moins nombreuses. Les processus neuronaux ralentissent, mais le cerveau reste sain excepté pour ceux qui souffrent de troubles cérébraux tels que la détérioration progressive entraînée par la maladie d'Alzheimer. Changements cognitifs (0,08) : Au fils des ans, la mémoire de reconnaissance reste performante, alors que la capacité de rappel commence à décliner en particulier en ce qui concerne des informations qui n'ont pas de sens. Les études portant sur l'évolution de l'intelligence avec l'âge se sont déroulées en plusieurs étapes. Études sur l'intelligence (0,25) : Des études transversales ont montré un déclin intellectuel net après le début de l'âge adulte. Des études longitudinales ont suggéré une stabilité intellectuelle tout au long de l'existence. Les conceptions actuelles semblent indiquer que si l'intelligence fluide décline avec l'âge, ce n'est pas le cas de l'intelligence cristallisée.
Place du linguistique ? Analyse par J. Virbel des textes proposés par le LPEQ. Utilisation du travail sur les titres possible : –Les textes proposés en contiennent à 3 niveaux –Possibilité de structuration des textes à l'aide des titres –Utilisation du repérage des reprises et des renvois
Remarques générales Besoin de faire le point avec les laboratoires impliqués Mise en place d'un moyen efficace pour rester "au courant" : –Exemple : Mailing-list pour le suivi des correspondances.
Base de Données "Titres" Avancées
Base de données "Titres" : jusqu'à maintenant Contient des informations sur les titres de deux fichiers : –Le chapitre Entité / Association de P. Rigaux. –L'HDR de C. Jacquemin. Informations sur les reprises des titres et la forme des titres
Lacunes de la base Pas de repérage de la position des reprises Recensement des annonces non effectué Pas de repérage des reprises anaphoriques Pas de gestion des doublons
Travail effectué dernièrement Les programmes d'extraction en Perl ont été améliorés à plusieurs niveaux Amélioration majeure : extraction des renvois et des annonces de titres En ce qui concerne les renvois (à un numéro de titre) : aucun n'a été trouvé Par contre, de nombreuses annonces ont été extraites
Les différentes unités extraites Pour chaque titre, recherche & extraction : –Des titres complet : ce sont les titres entiers qui sont recherchés dans les textes. –Des parties de titres : pour les titres contenant deux parties séparées par ":", recherche et extraction de chaque partie Exemple : pour le titre "Le modèle E/A : Présentation informelle", recherche de "Le modèle E/A" et "Présentation informelle"
Les différentes unités extraites (2) Pour chaque titre, recherche & extraction : –Des mots du titre : tous les mots (hors mots vides) des titres sont cherchés Exemple : pour le titre "Entités, attributs et identifiants", le programme recherche les mots "entités", "attributs" et "identifiants"
Les différentes unités extraites (3) Pour chaque titre, recherche & extraction : –Des groupes nominaux des titres (si il y en a) Exemple : pour le titre "Avantage et inconvénients du modèle E/A", le programme recherche les occurrences de "modèle E/A" Les autres extractions étaient gérées dans les anciens programmes. L'extraction des groupes nominaux est un ajout récent.
Pendant la recherche Les programmes recherchent et extraient ces annonces et ces reprises : –Sans tenir compte de la casse –En indiquant, pour les annonces, si elles appartiennent elles-mêmes à un titre –En indiquant le numéro de ligne de la forme trouvée (ainsi que la position des titres et la taille des segments titrés) –En continuant à chercher sur une ligne même si une reprise ou une annonce y a déjà été trouvée (à l'aide de fonctions récursives)
Singuliers / Pluriels Les algorithmes permettant de faire des recherches sans tenir compte du genre sont quasiment finis Exemple : à partir du titre " Principes généraux ", trouver les occurrences de : –principes généraux –principe général –principes –principe –généraux –général
Au final : un exemple Titre : " Le modèle E/A : Présentation informelle " Formes cherchées (en majuscules ou minuscules): –le modèle e/a : présentation informelle –le modèle e/a & les modèles e/a –présentation informelle & présentations informelles –modèle e/a & modèles e/a –modèle(s), e/a, présentation(s), informelle(s)
Pour le chapitre E/A Dans ce texte, les programmes recherchent également pour les occurrences (nombreuses) de " E/A " : –e/a & E/A –(e|E)ntité/(a|A)ssociation –(e|E)ntité & (e|E)ntités –(a|A)ssociation & (a|A)ssociations
Après l'extraction Mise en forme du fichier de sortie pour un renseignement automatique de la base Elimination des doublons : –Si, sur une même ligne, une expression est trouvée, les reprises / annonces moins importantes ne seront pas gardées –Exemple : pour le titre " Le modèle E/A ", si une ligne contient " le modèle E/A ", les reprises " modèle E/A ", " modèle " et " E/A " ne seront pas gardées pour cette ligne.
Ce qu'il reste à faire Terminer le traitement de la distinction singulier / pluriel Numérotation en phrases et non plus en lignes Renseignement de la base de données "Titres" avec les nouveaux fichiers de sortie
Dernières remarques Un manuel de la base est quasiment achevé Il contient des instructions pour consulter la base et créer des requêtes Plusieurs requêtes ont été créées pour l'observation de la base d'un point de vue quantitatif (en croisant des données de plusieurs champs et tables) Il reste toujours à faire une analyse linguistique de la base Plus globalement, il faut se poser la question du travail sur les titres dans le projet VISU