Titre de la diapositive Unité mixte de recherche 7118 Accueil diaporama.

Slides:



Advertisements
Présentations similaires
1Er Partie Intervenants : Nuno Barata Alain Joly Thierry Belvigne
Advertisements

UR1, CRI, Thierry Bédouin, le 21 Mai 2007 Journée Couperin du 21 Mai 2007 Thierry Bédouin, directeur du CRI de Rennes 1 Les publications scientifiques,
Sandrine Peraldi (ISIT) Jean-Philippe KOTOWICZ (INSA Rouen)
Algèbre de composants : une approche fonctionnelle à la sémantique de documents Bart Lamiroy LORIA/INPL QGar - École des Mines de Nancy.
Les principes généraux Les objectifs du dispositif Le b2i et les défis sur Internet Une visite concrète.
1 Balisage automatique de dictionnaires anciens : une application dINTEX Agnès Tutin Unité Mixte de Recherche SILEX, CNRS & Université de Grenoble III.
UNIVERSITÉ PARIS 3 ─ SORBONNE NOUVELLE
Agréger les infos SITRA et réservation sur mon site
Une solution personnalisable et extensible
Urbanisation de Systèmes d'Information
Dalila CHIADMIIFISI TIC et le développement de la recherche scientifique Revue scientifique : le modèle du libre accès Dalila Chiadmi.
Exposé de Système - Informatique et Réseau
1 Évaluation des acquis des élèves Janvier 2010 Circonscription Caen Ouest Evaluations nationales 2010 évolution des protocoles Inspection Education Nationale.
INTRODUCTION Définition : Cordial c’est un correcteur orthographique et grammaticaux des textes. Les pluspart des logiciels de traitement de texte possèdent.
SYSTRAN Un outil du TAL Victoria AUPERT Marjorie LORSUNG.
Dématérialisation des échanges entre les commanditaires et les laboratoires Etude de faisabilité Table ronde EDI laboratoires 17 septembre 2002.
FACTIVA Présentation et guide d’utilisation
Plateforme de revues et d’articles en sciences humaines et sociales
La GSL : un outil pour mutualiser linformation scientifique Guilde des Doctorants © Guilde des Doctorants – 2001.
Quelles ressources sur linternet ? Méthodologie de recherche et validation de linformation Jean-Philippe Accart Bibliothèque nationale suisse Service de.
> a patent search service supplied by Patents & Technology Surveys Ltd PROFESSIONAL ONLINE PATENT INFORMATION SERVICE.
Développement d’applications web
Construire une base de données bibliographiques Elaborer un site web
Chapitre 4 : la gestion électronique des documents
Limpact de la technologie sur la gestion de données terminologiques : lexemple du Visuel Anne Rouleau, rédactrice en chef Les Éditions Québec Amérique.
Université de La Rochelle Saisie et Mise à jour des fiches ECTS le 05/12/2001.
Lycée Louis Vincent Séance 1
COPIL SINP 28/03/2014 PRÉSENTATION DES APPLICATIONS OGAM (WEB ET NOMADE)
ARCHOS CONSEIL Date : 24 – 03 – 2004 Portail National Synthèse du projet et piste de partenariat public / privé Nabil HAFFAD - Manager.
Le Travail Collaboratif ...
Bases de données lexicales
Université de La Rochelle Saisie et Mise à jour des fiches ECTS le 01/12/2000.
VOC 1 CE2 Je sais utiliser des mots de la vie quotidienne.
Présentation des outils de recherche dinformations scientifiques.
MOT Éditeur de modèles de connaissances par objets typés
Ingrid Geretschläger and Jocelyne Jerdelet/CERN ETT-SIS-DM1 La litterature grise : importation et gestion au SIS u Dans le passé, échange entre.
Natalie Meystre Maciej Macowicz Conférence des Webmasters 22 mars 2005 Moteurs de recherche, meta-moteurs.
Évaluations nationales cm Réunions de directions et animation pédagogique du 13/01/10 Circonscription de PontChateau Briere – VG-
Jura.be, Jurisquare Des outils complémentaires ?
Forum des Industries de la Langue, 17 mars 2010
Déposer ses publications dans HAL pour valoriser la recherche au CHEC. Enjeux, méthodologies, services.
Introduction à lutilisation des corpus 1. Quest-ce quun corpus? Alexandra VOLANSCHI
Introduction à l’utilisation des corpus 1. Qu’est-ce qu’un corpus?
Introduction à lutilisation des corpus 2. Comment constituer un corpus?
Consulter un document Module 2 Déroulement :
L’activité de référencement dans une Web agency – Stage de 4 mois –
Méthodologie pour la structuration semi- automatique d’un corpus lexicographique bilingue : le cas du dictionnaire français-kabyle Mahfoud MAHTOUT Université.
Atelier de formation Animation: CEMIS Québec - Chaudière-Appalaches Avril - Mai 2000 Les TIC dans la réforme: qu'en est-il vraiment?
Les réseaux - Internet Historique Réseau local Internet Les protocoles
Tous droits réservés 04 octobre 2005© présente Les Moteurs de Recherche.
Fédération de Tir de la Broye Présentation du nouveau programme de gestion des sociétés de tir de gestion des sociétés de tir et.
L’ ACCESSIBILITE « C’est mettre le Web et ses services à la disposition de tous les individus, quels que soient leur matériel ou logiciel, leur infrastructure.
Technologies web et web sémantique TP3 - XML. XML eXtensible Markup Language (langage extensible de balisage) – Caractéristiques: méta-langage = un langage.
Martine Toussaint Desir
LA RECHERCHE DOCUMENTAIRE
Agence fédérale pour la Sécurité de la Chaîne alimentaire Un nouveau site pour l’AFSCA ? CC du 28 mai 2008 Agence fédérale pour la Sécurité de la Chaîne.
Thibault ROY Université de Caen / Basse-Normandie Laboratoire GREYC – Equipe ISLanD Apport d’outils d’informatique documentaire à l’analyse de forums de.
Module : Langage XML (21h)
Écriture Interactive Différenciation Contenant / Contenu
G ROUPE IRIUM ™ N°1 européen des PGI pour Distributeurs, Loueurs & Importateurs de Machines Les Bases de Connaissances Knowledge Base Maxime HILAIRE 07/05/2008.
Introduction à l’utilisation des corpus 1. Qu’est-ce qu’un corpus?
Le Traitement Automatique des Langues (TAL)
Savoir-être : Fréquenter le CDI
Séquence pédagogique épreuve orale du CAPES de Documentation
Présentation des outils de recherche d’informations scientifiques.
Mémoire de fin d’études
Atelier n°3 : Schéma de diffusion des données sur l’eau dans les bassins 24 mars 2011.
KOSMOS 1 Outils transversaux Module 7 1.L’annuaire 2.La recherche d’informations 3.La réservation de ressources.
ARIANE : Interopérabilité sémantique et accès aux sources d'information sur Internet Sylvain Aymard, Michel Joubert, Dominique Fieschi, Marius Fieschi.
CURSUL 9 VI. LES COMPÉTENCES DE L’APPRENANT Le Développement des compétences linguistiques, sociolinguistiques, pragmatiques.
Transcription de la présentation:

Titre de la diapositive Unité mixte de recherche 7118 Accueil diaporama Apport et usages des dictionnaires électroniques : lexemple du TLFi Jean-Marie Pierrel

Dictionnaires informatisés et dictionnaires informatiques Dictionnaires informatisés : version électronique dun dictionnaire papier –Très adaptés à des usages humains –Des possibilités dapplications informatiques Dictionnaires informatiques : la version informatique est la version de base, le plus souvent il nexiste pas de version papier –Très adaptés à des traitements informatisés –Des possibilités dexploitation par un humain

Avantages de dictionnaires informatisés La même qualité quun dictionnaire papier Des parcours complètement nouveaux au sein de dictionnaires informatisés –Accès tolérant : trouver un mot que je ne sais pas orthographié –Accès à un mot dont je connais que le sens mais dont jai oublié la forme « Maigreur extrême » –Des recherches de mots liés à un même champ lexical

Un exemple : Le TLFi : Trésor de la Langue Française informatisé Suite logique du Trésor de la Langue Française Une base de données lexicales en même temps quune base de connaissances finement structurée sur le lexique de notre langue Une disponibilité de lensemble du TLF – Mots « Vedettes » – définitions (avec les mots cachés) – exemples dusage

Spécificités du TLFi 40 objets méta textuels différents –vedettes, codes grammaticaux, indications de domaines –définitions, exemples avec leurs sources, etc. –indicateurs stylistiques, sémantiques Structuration et hiérarchisation des objets textuels Grande diversité des rubriques proposées –synchronie, diachronie, –étymologie, –Usage, prononciation, –bibliographie…

Du TLF au TLFi TLF TLFi : retro conversion Un respect complet de la version papier –Le TLFi est la version informatisée du TLF papier Un balisage fin de lensemble du texte –Repérage des divers objets textuels du dictionnaire –36,5 Millions de balise XML introduites dans le texte du dictionnaire –Texte initial (Limage du document papier)Texte initial –Texte Balisé (le fichier XML correspondantTexte Balisé

Des ressources spécifiques développées pour linterface du TLFi Les ressources spécifiques, développées pour laccès au contenu du TLF : –Une base de données phonétiques (+ de entrées) –Un « phonétiseur » (module de type Text To Speech) –Une base de données lexicales –Un module danalyse morphologique Exemple de fonctionnement : de jenero à général –jenero -> jénéro (module de correction des accents) –jénéro -> forme phonétique (module TTS) –forme phonétique -> généraux (base de données phonétiques) –généraux -> général (base de données lexicales)

Conséquences sur les usages Accès à très haut niveau de tolérance : –Insensibilité aux accents –Insensibilité aux fautes courantes dorthographe –Traitement phonétique de la demande de lutilisateur –Traitement morphologique –Correction automatique ou forcée des fautes Possibilité daccès à partir de formes et non plus uniquement de lemmes ou de vedettes

Spécificités daccès au TLFi Procédures daccès diversifiées pour une consultation humaine –Consultation simple Par vedette, avec possibilité de mise en évidence dobjets –Requête élémentaire Exploitant la structure du dictionnaire –Requête complexe Croisement de multiples critères Hyper navigation simplifiée à lintérieur du dictionnaire et avec dautres ressources requêtes XML pour une intégration dans une chaîne de traitement automatique

Exemples de recherches dans le TLFI (1) Recherche dun mot –Système de correction automatique (forcée ou non) Exemple : etique -> étique ou éthique –A partir dune forme : Sussiez -> savoir Recherche dune expression –Ex. : « droit daînesse », « le trompette » ; –les expressions avec « queue » (24 réponses) Exploitation de la structure du dictionnaire –Les syntagmes construits avec droit (174 dont 87 syntagmes définis) [domaine : droit ; syntagme : droit] –Les verbes ayant un sens spécifique en marine et concernant le maniement des voiles (61 verbes ayant une définition spécifique en marine) [code grammatical : verbe ; domaine : marine ; définition : &mvoile (voile ou voiles)]

Une vision concrète par lexemple :

Disponibilité du TLFi Une version Cédérom chez CNRS Editions Version PC Windows Version Mac OS X –Avec un intégration aux outils bureautiques Une version internet –

Augmentation considérable des accès Actuellement sous le Web : –Plus de requêtes servies par jour Dont via le CNRTL Diffusion du Cédérom –Plus de exemplaires vendus Plusieurs dizaines de milliers de référencements sous le web

Quels sont les utilisateurs ? Les objectif initiaux du dictionnaire papier –« le témoin objectif et impartial du vocabulaire français, ; un exemple de lexicographie scientifique moderne ». La perception du TLF papier –Un dictionnaire réservé pour une élite 16 volumes à un coût denviron 1500 Le TLFi et ses usages aujourdhui –1/3 professionnels de lécrit –1/3 enseignants et chercheurs –1/3 Monsieur tout le monde –Plus un attrait ludique pour les jeunes