Outil de statistique textuelle FALLET Justine CRUAUD Marion

Slides:



Advertisements
Présentations similaires
Internet : serveurs Web
Advertisements

[Nom du site] Sujet personnalisé A Sujet personnalisé B Statistiques essentielles Liens préférés à visiter Tapez votre message de bienvenue ici. Vous pouvez.
De la mise en page à la mise en écran : le cas des colonnes
UNIVERSITÉ PARIS 3 ─ SORBONNE NOUVELLE
UV Libre : Refonte du site web ASI Maxime CHAMBREUIL – ASI 3 – Décembre 2001.
Réunion dinterlocuteurs – Strasbourg – 19 et 20 janvier 2010 Devenir de lopération Arrêt de cette opération en Nouveau dispositif pour permettre.
Tutoriel SPIP Rédacteur.
Utilisation de l’outil Firebug
Analyse et structuration thématiques
Université Paris 3 La Dictée vocale SLFD Johanna Deron.
ANDRE Marine DABIN Julie WATERLOT Amandine
SYSTRAN Un outil du TAL Victoria AUPERT Marjorie LORSUNG.
Les outils du TAL Par RIGAUD Anaïs RALLIER Armelle SANTIAGO Gwendoline
MIKHAYLOVA Vera Exposé Java principe de fonctionnement Lundi 17 mai 2004 DEUG 1ère année Science du langage Paris III.
Programmation et projet encadré
Présenté par Martine Toda
Utilisation de corpus de langage oral avec d’autres logiciels
Cordial, le TAL et les aides à la rédaction
Fonctionnement de eaoréponses sur un exercice simple Cliquer pour changer de page.
Concevoir un site Web de A à Z Ce cours permet à létudiant de réaliser de façon professionnelle un site internet de A à Z.
Plateforme de revues et d’articles en sciences humaines et sociales
Exposé Duan Kun Alexandra Moraru M2 Pro Traductique, INALCO
Université de La Rochelle Saisie et Mise à jour des fiches ECTS le 05/12/2001.
Le traitement des résultats
Textométrie : point de vue linguistique des données
Identifier ce qui peut gêner ou bloquer votre référencement Sébastien Billard, consultant référencement.
EXERCICES SUR INTERNET
Dossier de Lecture Par Julie Dubé But : rassembler linformation pertinente à laide de fiches et indiquer les références exactes. Constituez un dossier.
Corpus parallèles et textométrie
Référencement Que peut faire baisser votre classement ?
RECHERCHER AVEC BCDI WEB
Service dInformation et dAnalyse des Logiciels Libres Éducatifs
Claire Gélinas-Chebat
La conception d hypermédias Cours Ergonomie des Interaction Personne-Machine 11 Janvier 2006 Présentation réalisée par Mireille Bétrancourt (
La conception d hypermédias Cours Ergonomie des Interaction Personne-Machine 6 Décembre 2006 Présentation réalisée par Mireille Bétrancourt (
Des hypertextes utilisables Cours Ergonomie des Interactions Personne-Machine 15 octobre 2008 Présentation réalisée par Mireille Bétrancourt (
Analyse Multidimensionnelle et Multimédia Ismaïl Biskri (. ) (
Introduction à lutilisation des corpus 1. Quest-ce quun corpus? Alexandra VOLANSCHI
Introduction à l’utilisation des corpus 1. Qu’est-ce qu’un corpus?
Introduction à lutilisation des corpus 2. Comment constituer un corpus?
Recherche par mots-clés vs recherche en langue naturelle.
Traitement Automatique des Langues appliqué à l’Acquisition du Langage Apports d’une pluridisciplinarité Luiggi SANSONETTI EA 2290 SYLED – EA 170 CALIPSO.
Kit du producteur de contenus web
Méthodologie pour la structuration semi- automatique d’un corpus lexicographique bilingue : le cas du dictionnaire français-kabyle Mahfoud MAHTOUT Université.
Les réseaux - Internet Historique Réseau local Internet Les protocoles
Claire Gélinas-Chebat
Internet : serveurs Web  Clients et serveurs : le navigateur  Sites Web et urls  Fichier source d’une page  Langage HTML 1.
Introduction à l’informatique en gestion 1 Plan de la leçon Modalités d’affichage La navigation Ouvrir/Enregistrer La saisie La sélection La.
Parcours scolaires et réussite dans l’enseignement supérieur : l’évaluation des pratiques d’intervention Consortium de recherche et d’information sur la.
La Grille STARD à l’interface Anglais / LCA
Traitement de texte +.
Sylvie Charpentier, Conseillère pédagogique Libourne 2
Segmentation morphologique à partir de corpus Delphine Bernhard Laboratoire TIMC-IMAG, Grenoble
L’analyse lexicale Pr ZEGOUR DJAMEL EDDINE Ecole Supérieure d’Informatique (ESI)
Concevoir un site web de A a Z Cours 3. Aujourd’hui Découper sa page en tranche pour une intégration graphique optimale avec Photoshop L’intégration des.
Modélisation N-morphes en classification des textes de Wikipedia
Thibault ROY Université de Caen / Basse-Normandie Laboratoire GREYC – Equipe ISLanD Apport d’outils d’informatique documentaire à l’analyse de forums de.
L’analyse de système : le cas des hypertextes Cours Ergonomie des Interactions Personne-Machine 28 octobre 2009 Présentation réalisée par Mireille Bétrancourt.
Publication Flash sur Internet et Transfert avec Dreamweaver COM3562 Communication Multimédia MARS 2011.
Introduction à l’utilisation des corpus 1. Qu’est-ce qu’un corpus?
Le Traitement Automatique des Langues (TAL)
1 Tutoriel SPIP Rédacteur. 2 Sommaire Connexion Interface SPIP Menu SPIP Rédiger un article Interface de création d’un article Fonctionnalités de base.
Pierre Malenfant Technologie 9 École du Carrefour
Marie Pasquier (FT R&D, DIH/UCE & MoDyCo Paris X)
Principes de design accessible selon les standards SGQRI 008 Émilie Burelle 27 août 2010.
1 Présentation de DREAMWEAVER (1) Gaël TREMEAU GI05 Printemps 2006.
Présentation de Dreamveawer
SI 28 - Présentation Image Ready Aurélie Letenoux GSU 4.
LE SIMULATEUR DE MARCHE UN OUTIL APEC POUR EXPLORER SON MARCHE Le simulateur marché est un outil exclusif Apec, qui permet d’analyser ses débouchés en.
Révisions pour l’exam L2 Informatique Obligatoire.
Transcription de la présentation:

Outil de statistique textuelle FALLET Justine CRUAUD Marion LEXICO 3 Outil de statistique textuelle FALLET Justine CRUAUD Marion

Présentation Permet le découpage de corpus afin de les analyser Lexico 3 = édition 2001 du logiciel Lexico dont la première version remonte à 1991 Permet le découpage de corpus afin de les analyser Fonctionnalités : Segmentation Concordance Décompte portant sur les formes graphiques Analyse factorielle portant sur les formes et les segments répétés

Les corpus de texte 2) Délimiteurs, non délimiteurs L’analyse lexicométrique compare les décomptes réalisés à partir du repérage des occurrences d’unités lexicales dans un corpus de texte. 1) Corpus d’initiation 2) Délimiteurs, non délimiteurs 3) Minuscules, majuscules, apostrophes 4) Sections du texte 5) Clés / Balises

Exemples <Auteur : Nerval> Il est un air pour qui je donnerais tout Rossini tout Mozart tout Weber. <Auteur : Trenet> Y’a d’la joie ! Bonjour bonjour les hirondelles. Y’a d’la joie, dans le ciel par-dessus le toit. <Auteur : Brassens> La canne de Jeanne est morte eu gui l’an neuf, elle avait fait la veille merveille un œuf. Ici, la clé auteur permet de partager le corpus en trois parties afin de les comparer entre elles. On peut par exemple remplacer systématiquement toutes les majuscules du texte par une astérisque suivie d’une majuscule. Exemple : Chat devient *chat

Outils d'exploitation textuelle L’outil Concordance permet de visualiser toutes les occurrences d’une forme. Les Segments répétés sont des suites de formes dont la fréquence est supérieure à deux dans le corpus. L’outil Groupe de formes permet de constituer des types rassemblant des occurrences de formes graphiques différentes liées par une propriété commune (pluriel/singulier d’un même verbe, lien sémantique…) Par exemple pour rechercher tous les mots qui se termine par « tion » le motif à utiliser est « \*tion\ ».

Exemple

Outils d'analyse statistique 1) Découpage en partie Pour réaliser une partition du corpus, on sélectionne un type de clé; les différents contenus affectés à cette clé découpent alors le corpus en autant de parties différentes. 2) Spécificités L’analyse des spécificités permet de porter un jugement sur la fréquence de chacune des unités textuelles dans chacune des parties du corpus.

Outils de navigation lexicométrique 1) Carte de sections La Carte des sections permet une visualiser du corpus découpé en sections par la promotion d’un ou plusieurs caractères particuliers (paragraphe, point…) au statut de délimiteur de section. 2) Les fenêtres de travail

Pour en savoir plus... La source principale est le site Lexico 3 de l’université Paris III http://www.cavi.univ-paris3.fr/ilpga/ilpga/tal/lexicoWWW/