Base de Données "Titres" Projet "Visu" Réalisée dans le cadre de la maîtrise IL.

Slides:



Advertisements
Présentations similaires
Etudes de cas A vous de faire Bases de données DRES – B. TALON.
Advertisements

HTML Abda Anne Plan Présentation Structure Texte Listes Images Liens Tableaux Formulaires.
Le struts validator – framework de validation
Introduction Pour concrétiser l’enseignement assisté par ordinateur
Le publipostage La fonction de fusion permet de créer des documents identiques dans les grandes lignes que l’on personnalise automatiquement à chaque destinataires.
Projet VISU Proposition d'interface & avancées personnelles.
XML Un format d'échange et un langage de présentation des données associé au HTML.
Design Pattern MVC En PHP5.
Logiciel de base de données
Écrire un article pour informer
CREATION DE FEUILLE DE STYLE pour structuré le document XML
Formation Microsoft® Office Access 2007
JLMVPC Saisir une commande.
Les requêtes La Requête est une méthode pour afficher les enregistrements qui répondent à des conditions spécifiques. La requête est donc un filtre.
Développement d’applications web
HISTORISATION.
Professeure : Kaoutar Année Scolaire : 2012 / 2013
Vice-rectorat de Mayotte
Database B2 2 MIP Paris.
Recherche d’information & Représentation des Connaissances
Créer un index.
Le langage PHP 5.
Recherche avancée multi-champs EBSCOhost
La subordination complétive
Le Travail Collaboratif ...
Publispostage Menu Outils / Lettres et publipostage
REPRISE DES DONNEES DE BASE
1. I. Logo II. Base de données III. Lettre de relance IV. Fiche récapitulative du dossier affaire V. Fiche de remboursement des frais VI. Mode opératoire.
EPID-CPI-ISAIP Philippe Bancquart - mise à jour 24/02/ page 1 Procédures stockées CPI-SQLServer.
CHAINE DE CARACTERES : Définition :
Maîtriser le langage HTML Les Formulaires. Dans cette section on verra comment diviser un formulaire en plusieurs blocs principaux avec un titre pour.
Moteur de RechercheMoteur de recherche "from scratch"
Moteur de recherche d’information
Moteur de recherche d’information
Le formulaire Les chaînes de requêtes. Les chaînes de requêtes (QueryStrings) correspondent à des informations associées à l'adresse URL avec un point.
Démonstrateur Lingway
PhP-MySQL Pagora 2012/2013 CTD 1 - Presentation de moi ^^
Les concepts et les méthodes des bases de données
Initiation aux bases de données et à la programmation événementielle
Adaptée du cours de Richard Grin
PRESENTATION DES DONNEES BTS SIO. INTRODUCTION Une fois la base et les tables créées, il faut pouvoir les exploiter. L’utilisateur final aura besoin de.
Dans la barre des messages, cliquez sur Activer la modification,
Méthodologie pour la structuration semi- automatique d’un corpus lexicographique bilingue : le cas du dictionnaire français-kabyle Mahfoud MAHTOUT Université.
B4 Mise en forme d’un texte long – D.MARKOWSKI Mettre en forme son guide du bon usage Question 4 Question 5 Question 6 Question 7 Question 8 et 9 Question.
PROGRAMMATION INFORMATIQUE D’INGÉNIERIE II PRO-1024.
Travail réalisé par: Sandy Thiry et Anaïs Mathieu.
PROGRAMMATION INFORMATIQUE D’INGÉNIERIE II
L. Gzara, E. Khouri, M Tollenaere 1 MSI 2A ICL – Initiation ACCESS Interfaces 2014 Initiation MS Access 2010 Interfaces – Formulaires Dynamique des données.
GSD langue française - Boumerdès 19 et 30 avril 2013
Technologies web et web sémantique TP3 - XML. XML eXtensible Markup Language (langage extensible de balisage) – Caractéristiques: méta-langage = un langage.
 Requêtes MySQL en PHP Introduction
Application de gestion des retards
PROGRAMMATION INFORMATIQUE D’INGÉNIERIE II PRO-1024.
Initiation à Access: Interfaces
Jean Paul CHANLON IUT1 Grenoble Génie Mécanique et Productique
Modélisation des documents: DTD et Schéma
24 avril 2015 TITRE DE LA PRÉSENTATION. TITRE 1 = 25 pts TITRE 2 = 20 pts  Texte courant = 18 pts 24 avril
eXtensible Markup Language. Généralités sur le XML.
Les balises sémantiques
Comprendre le SGBDR Microsoft Access – partie 2
BASES ET BANQUES DE DONNEES Objectifs de l’enseignement
Séminaire de rentrée cours de programmation web & Wordpress
Chapitre 1 – Les Nombres Entiers
Initiation aux bases de données et à la programmation événementielle
Générateur d’applications WEB de gestion de données Maître/détails.
Les calques Les Template (modèles) Les Comportements Les scénarios Les formulaires Les CSS Le serveur Web de l’UTC Présentation.
CATALOGUE DES FORMATIONS WORD 2007 – Formateur : TAFOUREAU Laurent mercredi 23 mars 2016.
1 Initiation aux bases de données et à la programmation événementielle VBA sous ACCESS Cours N° 4 Support de cours rédigé par Bernard COFFIN Université.
1 Programmation Web Programmation WAMP/LAMP Premiers principes.
TITRE DE LA PRÉSENTATION
Transcription de la présentation:

Base de Données "Titres" Projet "Visu" Réalisée dans le cadre de la maîtrise IL

Objectifs Réaliser une base de données contenant différentes informations sur les titres des textes d'un corpus : –Forme des titres (avec différents niveaux de détail) –Niveau de hiérarchie –Reprises (occurrences et position)

Etapes du travail Constitution d'un corpus de départ Extraction des titres (Perl) Extraction des informations sur les titres (Perl) Extraction des reprises (Perl) Conditionnement des données extraites pour Access Fabrication et remplissage de la base

Corpus de départ Constitué de 2 textes : –L'HDR de C. Jacquemin ( mots) –Le chapitre E/A de P. Rigaux (6315 mots) Format des textes : balisage XML

Perl (1) Programmes pour extraire les informations des textes : –Utilisation d'expressions régulières –Utilisation des balises pour le repérage et l'extraction des titres et de leur niveau de hiérarchie –Repérage et extraction des reprises totales et des mots composant les titres

Perl (2) Stockage dans des fichiers "texte brut" Mise en forme des information pour automatiser le renseignement de la base de données : Information 1Information 2Information 3 Tab etc. La tabulation servira à séparer les différents champs dans la table

La base de données Composée de tables, de requêtes et de formulaires Les tables contiennent toutes les informations extraites par les programmes perl Les enregistrements sont créés à partir des tables et servent à organiser les informations d'une ou plusieurs tables ou d'autres requêtes Les formulaires permettent de présenter les informations ou de faciliter l'entrée de nouvelles informations dans la base

Les tables La base contient 11 tables : –La table Titres qui contient 6 champs : texteniveauoccurrencerepriseformeN° Id –La table Reprise qui contient 6 champs : occurrencereprisepositionposition chiffréetypeN° Id –La table Corpus qui contient 6 champs : corpustextetailletypegenreN° Id –8 tables Forme (SN, SP, SV, SAdj, Formel, >Syntagme, Phrase, PropSub) : Ex : Forme_SN : texteoccurrencetype de SNN° Id

Les requêtes Les tables et les requêtes sont liées entre elles Les requêtes permettent d'organiser les informations de la base Exemple : Requête pour savoir combien de SN introduits par un article défini sont présents dans chaque texte du corpus

Les formulaires Ils permettent de mettre en forme et de présenter les informations de la table Ils permettent aussi de rentrer de nouvelles informations dans la table

Objectifs (ce qu'il reste à faire) Renseigner la "position chiffrée" dans la base pour les reprises Inclure dans la base les annonces de titre Inclure dans la base les reprises anaphoriques Adapter la base aux besoins du projet Ajouter des textes au corpus Analyser la base