La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Silfide : ressources, outils et normalisation Laurent Romary Laboratoire Loria Nancy.

Présentations similaires


Présentation au sujet: "Silfide : ressources, outils et normalisation Laurent Romary Laboratoire Loria Nancy."— Transcription de la présentation:

1 Silfide : ressources, outils et normalisation Laurent Romary Laboratoire Loria Nancy

2 Silfide - présentation Serveur Interactif pour la Langue Française, son Identité, sa Diffusion, son Etude Projet commun lancé au début de 1996 xCNRS (Centre National de la Recherche Scientifique) xAupelfUref (Association des Universités Partiellement ou Entièrement de Langue Française) Équipes : Loria, INaLF, CLIPS, LIMSI, LPL

3 Principaux objectifs zcoordonner les efforts de la communauté académique dans le domaine des ressources linguistiques zdévelopper et promouvoir des actions de normalisation zprocurer un accès libre aux ressources et aux services associés

4 Contexte zRessources linguistiques yTextes (littérature,théâtre, poésie, journaux, etc.) yTranscriptions (e.g. dialogues) yDictionnaires, lexiques zUtilisateurs yLexicographes, linguistes, informaticiens yOutils divers (e.g. étiqueteurs morpho- syntaxiques)

5 Un constat zcoût intellectuel et financier de la création des données zquelle documentation associée à ces données ? zcomment utiliser ces données (outils) ? Normaliser pour mieux utiliser et partager nos données.

6 TEI (Text Encoding Initiative) Origine : réunion de novembre 1987 au Vassar College (Poughkeepsie, New York) Directives de codage des textes électroniques sur la base de SGML Institutions scientifiques : ACH, ALLC, ACL Guidelines for Electronic Text Encoding and Interchange (TEI P3) eds. : Michael Sperberg-McQueen et Lou Burnard

7 TEI - Contenu Recommandations ynorme SGML (Standard Generalized Markup Language) ymodularité de la DTD TEI xun jeu de balises "noyau" (core tag set) : en-tête, divisions, paragraphes etc. xdes ensembles de balises de base (base tag sets) : prose, poésie en vers, dictionnaires, etc. xdes jeux de balises additionnelles (additional tag sets) : liens hypertextuels etc. Conséquence : une famille de DTD TEI

8 TEI - Documentation des textes Identification et suivi des textes xcf. catalogage des documents électroniques (ex. Silfide) xcf. échange des documents électroniques Comment : en-tête TEI (TeiHeader) xaspects bibliographiques du document source (auteur, éditeur, édition, etc.) xaspects propres au document électronique (aspects bibliographiques, codage, historique des révisions etc.)

9 TEI - Pièces de théâtre zinterventions et indications scéniques Paul Il fait chaud aujourdhui… Paul allume une cigarette zremarque : déclaration des personnages dans une

10 TEI - Transcriptions de loral ztours de parole, segments France Telecom, bonjour. Que désirez-vous? zremarque : ypossibilités de coder les pauses, transitions, superpositions, bruits, difficultés de transcription etc.

11 TEI - Dictionnaires zstructure minimale dune entrée : mot-vedette, indications grammaticales, définition, exemples table n.f. Pièce de mobilier… Une table de cuisine

12 Silfide - du point de vue de lutilisateur zpas de balise SGML… zun scénario en deux temps ySélection de ressources : construction dun corpus de travail (panier) yRequêtes sur le contenu : utilisation doutils en ligne sur ce corpus

13 Sélection des ressources Liste des sélections Le petit Prince… Le Père Goriot… ksqjdhlksqjhd ksjqdhlkqj … Titre Auteur Requête complexe Recherche panier SélectionTravail en ligne Résultat

14 Et XML arriva... Où linternet donne raison à la démarche de la TEI

15 Un rapide état des lieux - 1 zXML yUne recommandation du W3C simplifiant SGML yUn gain en souplesse et en puissance xDocument bien formé/valide zDes interfaces de programmation yAPI DOM : modèle arborescent yAPI SAX : accès par évènements

16 Un rapide état des lieus - 2 zDes recommandations associées yXpath Un langage généralisé d accès à la structure d un document XML /body//div/q[lan=de] y, XSL xUn langage de transformation et de présentation xUn système à base de règle exprimées en XML xLes bases d une BD orientée XML?

17 Mise en réseau de serveurs Silfide DB1 Serveur 1 DB2 Serveur 2 DB3 Serveur 3 DB4 Serveur 4 Client (navigateur) http Point d accès local

18 Usage généralisé de XML zInformations utilisateurs zGestion de l espace de travail yParamètres de session y« Panier » zRequêtes zListes de résultats

19 Silfide et XML… DB1 Server 1 DB2 Server 2 DB3 Server 3 DB4 Server 4 User Client Local access point

20 Bilan : apports d XML zUniformisation des formats yContenus « utiles » (adapter la TEI…) yGestion des échanges zFractionnement et recomposition yUtilisation des documents par parties xE.g. : entrée d un dictionnaire yRésultat >> document xApplications : commandes en « pipe » (cf. HCRC)

21 Bilan : apports d XML - 2 zDe premiers composants réutilisables yParseurs XML yInterpréteur de requêtes sur des documents structurés yAu delà?

22 Et maintenant ? Pistes de développement des efforts de normalisation

23 Développements en cours - 1 zRessources primaires yInitiative INaLF-Loria de rétro-conversion de textes issus de Frantext xThéâtre, poésie etc. xDes bases éditoriales codifiées et simplifiées (en- tête minimal) yUne prise de conscience du besoin de normalisation : IRESCO, Paris IV, etc.

24 Développements en cours - 2 zAnnotation externe yCf. CES/Eagles - avènement de Xpath yExemple: alignement de textes multilingues yAnnotation de la référence yMLIS/Mate: une initiative européenne dans le domaine de l étude du dialogue

25 Développements en cours - 3 zRessources pour l Informatique linguistique yTerminologie/lexicographie multilingue xMARTIF (ISO 12200, expérimenté dans MLIS/Dhydro) yLexique syntaxique xTAGML

26 Perspectives zStabiliser une « couche basse » yAPI d accès aux mots d un texte yEntrées/Sorties d étiqueteurs morpho- syntaxiques yArchitectures de ressources lexico- grammaticales

27 Moyens zAccroître la normalisation des données et des interfaces yDes rencontres régulières (au delà de cette journée « découverte ») yUn vrai GT sur ce thème zAboutir à une base commune pour: yÉchanger des données primaires yÉchanger des composants yÉvaluer nos systèmes


Télécharger ppt "Silfide : ressources, outils et normalisation Laurent Romary Laboratoire Loria Nancy."

Présentations similaires


Annonces Google