Analyse et structuration thématiques

Slides:



Advertisements
Présentations similaires
MOT Éditeur de modèles de connaissances par objets typés
Advertisements

E1 E1 E1 E1 E1 E1 E1 E1 E2 E2 E2 E2 E2 E2 E3 E3 E3 E3 E3 E4 E4 E4 E4
Comment réussir la lecture approfondie ?
Algèbre de composants : une approche fonctionnelle à la sémantique de documents Bart Lamiroy LORIA/INPL QGar - École des Mines de Nancy.
De la mise en page à la mise en écran : le cas des colonnes
Entre construction théorique et mise en œuvre opérationnelle
Reference Model of Open Distributed Processing
Navigation Interactive dans les documents
Navigation Interactive dans les documents Brigitte Grau et Jean-Paul Sansonnet J.P. Fournier, N. Hernandez, M. Hurault-Plantet, J-C. Martin, G. Pitel,
Projet VISU Proposition d'interface & avancées personnelles.
OLST — Université de Montréal
Littérature et réseau Favoriser la compréhension autrement
Apprentissage initial de la lecture
Le remplacement moléculaire
1 TICE 2000 / Troyes / octobre 2000 Des moteurs de recherche efficaces pour des systèmes hypertextes grâce aux contextes des nœuds Des moteurs de.
Modélisation des systèmes non linéaires par des SIFs
ETAPES DE LA RECHERCHE DOCUMENTAIRE
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
La compréhension en lecture
4 ème Journée thématique des Experts Bologne Vers une utilisation systématique des acquis dapprentissage (…) Namur, 1 février 2012 Atelier 3 Lenseignement.
Le logiciel CMAP Tools : ce qu’il est, ses fonctionnalités
INTELLIGENCE COLLECTIVE : RENCONTRES 2006Nîmes mai 2006 CENTRE DE RECHERCHE LGI2P 1- Doctorante Ecole des mines de Paris, 2- Maitre de Conférences.
TPE Les élèves mènent à bien une production originale, concrète et choisie par eux Ils développent des compétences individuelles à travers un travail de.
Processus DE Capitalisation
Eric Guilbert, Marc Daniel *, Eric Saux
Segmentation thématique de textes : au-delà de la récurrence lexicale
Pour l’utilisation de l’Analyse en Constituants Immédiats
SOCLE COMMUN LIRE ET COMPRENDRE
LA COMPREHENSION EN LECTURE
LE DISCOURS ARGUMENTATIF
Entre construction théorique et mise en œuvre opérationnelle
Algorithme pour le web Géraldine Schneider
Des hypertextes utilisables Cours Ergonomie des Interactions Personne-Machine 15 octobre 2008 Présentation réalisée par Mireille Bétrancourt (
Le Sémiographe Outil générique pour effectuer des opérations texte sens texte ou texte sens actions
Chapitre 2 La description du langage
LE JUGEMENT ET LE RAISONNEMENT CLINIQUES AIDE SOIGNANT
E5 - MANAGEMENT ET GESTION D’ACTIVITÉS TECHNICO-COMMERCIALES (Coef. 4)
TRAITEMENT INSTRUMENTÉ DE CORPUS
Segmentation (1ère partie)
Construire un exposé  Pourquoi ? - but et objectif ?  Pour qui ? - analyse des auditeurs  Quoi ? - essence du message  Dans quel ordre ?
Manuel Kervarker.org : l'accueil
Page 1 BTS COMPTABILITE ET GESTION DES ORGANISATIONS.
Évaluation 2 Aide mémoire. Éléments de contenu Au moins une question mobilisatrice Domaine de formation général (axe de développement) Compétence transversale.
Théories, formalismes, modèles Sylvain Kahane Modyco, Université Paris 10 - Nanterre Mosaïque, Paris, 1/12/2006.
L’épreuve orale de sciences pour la session 2015
 J'aborde le texte de façon active et critique.  J'ai conscience de mes connaissances et de mes habiletés et je les applique pour mieux pénétrer le.
LA COMPREHENSION 10 Décembre REFLEXIONS PREALABLES Récolter/recueillir des informations  Aspect fonctionnel, nécessaire mais pas exclusif.  Mobiliser.
04/12/2012 Serge Villette CETE de l’Ouest 1 L’intégration du Développement durable dans l’évaluation des projets d’infrastructures portuaires ou fluviales.
Bureautique M1 Mise en forme évoluée 2.
Explorer le texte 2.
Segmentation morphologique à partir de corpus Delphine Bernhard Laboratoire TIMC-IMAG, Grenoble
Correspondance - Équivalence
Repérage Orthographique Collectif au CM2
« Vite fait, bien fait !» ou comment exploiter efficacement le temps
L’analyse de système : le cas des hypertextes Cours Ergonomie des Interactions Personne-Machine 28 octobre 2009 Présentation réalisée par Mireille Bétrancourt.
Des hypertextes utilisables Cours Ergonomie des Interaction Personne-Machine 17 octobre 2007 Présentation réalisée par Mireille Bétrancourt (
20/06/2015propagation de signatures lexicales dans le graphe du Web 1 Propagation de signatures lexicales dans le graphe du Web M. Bouklit M. Lafourcade.
Les balises sémantiques
L’enseignement de l’Analyse Fonctionnelle et Structurelle S 5 en S. T
Option scientifique Classes de 2de 6 et 7 2ème trimestre Thème : Croissance et mouvement.
Consolidation de grands réseaux lexicaux
Cours staf /02/ M. Bétrancourt & N. Deschryver Mireille Bétrancourt STAF 15 Les Hypertextes facilitent-ils l’acquisition de connaissances.
Webmarketing 13 octobre 2015.
Introduction à la Recherche
Par Amélie Dupuis Français 101
Les temps du passé en didactique intégrée
Séminaire national - BTS CI – Décembre 2007 Prospection et suivi de clientèle Atelier D.
L’objectif premier => nous rencontrer pour prendre connaissances des activités, des compétences et de l’expérience de chacun et mesurer le potentiel de.
+ Marketing & aspects juridiques AA: Recherche documentaire.
CURSUL 9 VI. LES COMPÉTENCES DE L’APPRENANT Le Développement des compétences linguistiques, sociolinguistiques, pragmatiques.
Transcription de la présentation:

Analyse et structuration thématiques Stratégie pour des textes courts : maximum 10 pages Texte long (un rapport): considéré comme un ensemble de textes courts Délimités en fonction du plan

Les données Le texte annoté par le repérage de marques linguistiques : Introducteurs de cadre Annonces thématiques Marqueurs d'intégration linéaire : phrases liées Le texte balisé par Anathème : Un segment = un regroupement d'unité élémentaires (alignement sur des phrases) Les débuts et fin de segment

Analyse thématique (1) Fondée sur la cohésion lexicale : Des mots qui se répètent dans des zones consécutives forment un segment thématiquement homogène Principe : association d'un vecteur de mots à chaque zone Repérage de ruptures par calcul de distance

Analyse thématique (2) Efficace sur des textes scientifiques Application du même principe sur des textes narratifs Prise en compte de proximités sémantiques Enrichissement des vecteurs par des mots liés issus d'un réseau de collocations Et encore d'autres méthodes ...

Texte balisé en segments Architecture Analyse linguistique (ContextO) Analyse Thématique Texte annoté Texte balisé Intégration  Collaboration entre les deux analyses Texte balisé en segments Structuration

Structuration des textes Le texte est segmenté en différentes parties liées à des sujets consécutifs différents La structure thématique du texte est de type "emboîtée" : Sujet 1 Sujet2 => on ne revient pas au sujet 2 par la suite La structuration repose sur des ressemblances lexicales Quand on reparle d'un sujet après une déviation ou un changement de thème, on réutilise des termes préalablement introduits

Principe de la structuration Description des segments par l vecteur de mots = "moyenne" des vecteurs des unités de base qui le compose. Evaluation de la distance entre segments Choix de la plus forte liaison => le segment reprend un thème Mise en boite des segments compris entre les 2 segments sélectionnés Réitération sur les segments contigus restant

Conclusion La méthode ne donne pas d'indication sur le type de lien hiérarchique lors d'un emboîtement : on sait que les sujets sont différents Envisager d'autres méthodes de construction de la structure d'un texte Tenir compte des marques linguistiques Exemples Marques intégration linéaire => niveau d'emboitement Marque de résultats => existence d'une hypothèse dans la même boite

Présentation à l'utilisateur Différents niveaux d'abstraction/de granularité La structure en boite, chacune caractérisée par son thème Un groupe nominal pertinent Un GN mis en contexte phrase un segment Retour au texte