Building an Electronic Dictionary of Computer Science Terminology

Slides:



Advertisements
Présentations similaires
Cours n° 1 Introduction à la programmation
Advertisements

Les présentateurs doivent souvent transmettre des informations techniques à des auditeurs qui connaissent moins bien le sujet et le vocabulaire spécifique.
1.Introduction à la programmation
Introduction au langage C
Architecture de machines Principes généraux
ARCHITECTURE INTERNE d’un MICROPROCESSEUR
Informatique Deug2 Sciences Eco S. Maabout 2004/2005.
Structures de données et complexité
Département Informatique Responsable :M. Huchard Responsables adjoints : A. Jean-Marie, F. Koriche, P. Séébold.
JADT'04 - Mars 2004, Belgique 1 EXIT: un système itératif pour l'extraction de la terminologie du domaine à partir de corpus spécialisés Mathieu Roche,
Olivier Bournez Professeur à l’Ecole Polytechnique
Introduction à l’Algorithmique
Genre et nombre des noms
Exposé de Système - Informatique et Réseau
Architecture et programmation des ordinateurs
Girard Pia & Laffont Caroline
Informatique parallèle hautes performances
Indexation textuelle : Systèmes de recherche d’informations
M. P. I. Mesures Physiques & Informatique
ESIEE Paris © Denis BUREAU I N Initiation à la programmation avec le langage Java.
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
L’observation réfléchie de la langue au cycle 3
Le Téléphone Russe Le Téléphone Russe. Le Téléphone Russe Le Téléphone Russe.
Chapitre n°2 : Architecture d'un ordinateur
CHAINE DE CARACTERES : Définition :
Reconnaissance Vocale
IFT313 Introduction aux langages formels Froduald Kabanza Département dinformatique Université de Sherbrooke Grammaires attribuées.
Présentation du mémoire
Yasmina ABBAS EDF - Division Recherche et Développement (Division R&D)
Introduction IFT6800 Jian-Yun Nie.
L'apport des grammaires catégorielles dans l'extraction multilingues des termes complexes (*)(**) Ismaïl Biskri, (**) Jean-Guy Meunier, (*) Sylvain Joyal,
Chapitre 3 Syntaxe et sémantique.
Introduction théorie et pratique
Les Sciences de l’Ingénieur
Adaptée du cours de Richard Grin
NORMALISATION DES LANGAGES DE PROGRAMMATION des Automates Programmables Industriels CEI Jean-Jacques DUMÉRY -1-
SIMON-VERMOT Christophe. ET2
Introduction IFT6800 – E2008 Pierre Poulin.
NORMALISATION DES LANGAGES DE PROGRAMMATION des Automates Programmables Industriels CEI
Logique programmée & Microprocesseurs
Cours Architecture des Systèmes Informatiques
Cours de programmation web
Algorithmes et Programmation
Un survol du language C.
CoRRecT : Démarche coopérative pour l’évaluation de systèmes de reconnaissance de termes Chantal Enguehard IRIN – Université de Nantes 2 rue de la Houssinière.
1 Extension du modèle de composants CORBA avec accès concurrent à des données partagées Travail réalisé par : Landry BREUIL PFE, ISIMA Encadrants : Gabriel.
D.E ZEGOUR Ecole Supérieure d’Informatique. Problèmes de décision Concepts de base Expressions régulières Notation particulière pour exprimer certaines.
AUTOMATES PROGRAMMABLES INDUSTRIELS
Mon cahier de réussite Classe de CM
L’analyse lexicale Pr ZEGOUR DJAMEL EDDINE Ecole Supérieure d’Informatique (ESI)
Combinatoire, Informatique et Physique des liens anciens et étroits Quels langages communs ? Gérard H. E. Duchamp Savantes Banlieues Octobre 2005.
1 École des Mines de Saint-Etienne. 158, cours Fauriel Saint-Etienne Cedex 2. Tél Fax Jean-Jacques Girardot
Dominique LAURENT Patrick SEGUELA
La Magie du Calcul Gérard H. E. Duchamp (Université Paris XIII) Equipe AAA le 08 juin 2006.
Architecture matérielle Qu’est ce qu’un ordinateur ?
Initiation au JavaScript
Algorithme de Huffman Mis au point en 1952 par David Huffman
Calcul symbolique Christophe Tollu Frédéric Toumazet Gérard H. E. Duchamp … + Séminaire CIP.
Informatique et Science du Numérique
UE MAREP Cours 12 : Révisions
UE MAREP Cours 1 : Algèbre de Boole et entiers naturels
Le Traitement Automatique des Langues (TAL)
Codage de l’information
Pierre Malenfant Technologie 9 École du Carrefour
Chapitre 4 La représentation des nombres.
Philippe Gandy - 1 septembre 2015 Basé sur les notes de cours de Daniel Morin et Roch Leclerc.
Initiation aux bases de données et à la programmation événementielle
Organisation de la mémoire pour le langage minimal Pr ZEGOUR DJAMEL EDDINE Ecole Supérieure d’Informatique (ESI)
Introduction au langage C
Imane Malass Icube, University of Strasbourg and CNRS 1 1 Développement d’un convertisseur de temps hybride avec une résolution de 10 ps et une large dynamique.
Transcription de la présentation:

Building an Electronic Dictionary of Computer Science Terminology Farida AOUGHLIS Université de Tizi ouzou Email:fariyamo@yahoo.fr

PLAN Introduction. Terminologie,noms composés. Extraction automatique de terminologie. Extraction manuelle de terminologie. Dictionnaire des termes de l’informatique: DELAC_INF. Extraction automatique des termes de longueur 2. Conclusion.

TERMINOLOGIE, NOMS COMPOSES Terme Nom composé Dictionnaire spécialisé

Extraction automatique de terminologie Approches linguistiques ou syntaxiques Approches statistiques ou numériques Approches mixtes ou hybrides

Approches linguistiques TERMINO David S.,1990 LEXTER Bourigault D.,1995 FASTER Jacquemin C.,1997 XTERM Cerbah F.,1999 LEXPRO Savary A.,2000 fffff

Approches statistiques ANA Enguehard C., 1992 MANTEX Oueslati R., 1999

Approches mixtes XTRACT Smadja F., 1993 ACABIT Daille B., 1994 ASIUM Faure D., 1998

Extraction manuelle de termes Collecte d’ouvrages Extraction Acquisition

Dictionnaire des termes de l’informatique DELAC_INF

Différentes classes recensées Composants binaires : 2 mots pleins Composants ternaires : 3 mots pleins Les plus longs : 4 mots pleins Les plus longs : 5 mots pleins

Composés de longueur 2 NA Adressage absolu NN Mémoire tampon NPN Adressage par octets NDN Allocation de ressources AN Arrière-plan PN Sous programme

Composés de longueur 2 (suite) NPV Demande pour émettre NCN Sauvegarde et restauration VPN Désactiver par commentaires APN Lié au calcul XN Pseudo langage XA Non valide

Composés de longueur 3 NAPN Allocation dynamique de mémoire NPNPN Allocation de ressources en batch NPAA Algorithme du premier adapté NPXA Algorithme du mieux adapté NPXN Appel de sous programme NPNA Architecture à mémoire partagée NPAN Bit de demi retenue

Composés de longueur 3 (suite) NXA Interruption non masquable NACA Unité arithmétique et logique NNN Bus Local PCI NAA Circuit intégré décimal XNPN Non retour à zéro

Composés les plus longs NX4 Algorithme préemptif à priorités dynamiques NX5 Traitement différé à flot de travail unique

Répartition des classes de longueur 2

Répartition des classes de longueur 3

Codification d’une entrée Pour le terme arbre de décision : %arbre[N1]/de/décision,.N+NDN :ms/+ ;un/inform/ /DON89 N1 code du 1er nom du terme / pour séparer chaque champ .N classe possible si on a seulement champ comme terme + ou bien NDN classe du terme complet ms genre et nombre du terme masculin,singulier -+ flexion en genre , pas de féminin – flexion en nombre , pluriel + un : déterminant utilisé inform : information sémantique : le terme est un terme d’informatique DON89 : origine du terme extrait manuellement (bibliographie) Dans le fichier des formes fléchies DELACF_INF nous aurons  les entrées : arbre de décision,arbre de décision.N+NDN+z0:ms/un arbres de décision,arbre de décision.N+NDN+z0:mp/un

Extrait de la liste des termes %langage(N1)/adapté(A32)/au/calculateur,.N+NAPN:ms/-+;un %langage(N1)/adapté(A32)/aux/problèmes/de/gestion,.N+NX4 :ms/-+;un %langage(N1)/algébrique(A31),.N+NA:ms/-+;un/ / Cegos80 %langage(N1)/algorithmique(A31),.N+NA:ms/-+;un/ / Cegos80 %langage(N1)/artificiel(A40),.N+NA:ms/-+;un/ / Cegos80 %langage(N1)/bas/niveau,.N+NAN:ms/-+;un/ / Cegos80 %langage(N1)/conversationnel(A40),.N+NA:ms/-+;un/ / Cegos80 %langage(N1)/de/assemblage,.N+NDN:ms/-+;un/ / Cegos80 %langage(N1)/de/balisage,.N+NDN:ms/-+;un/ / Cegos80 %langage(N1)/de/commande,.N+NDN:ms/-+;un/ / Cegos80 %langage(N1)/de/compilation,.N+NDN:ms/-+;un/ / Cegos80 %langage(N1)/de/description/de/page/HTML,.N+NX4:ms/-+;un %langage(N1)/de/description/des/données,.N+NPNPN:ms/-+;un/ / Cegos80 %langage(N1)/de/manipulation/des/données,.N+NPNPN:ms/-+;un/ / Cegos80

Acquisition automatique de termes de longueur 2 Patrons syntaxiques ATN utilisés Traitement phrase par phrase Le terminologue valide ou rejette les candidats termes Les termes simples peuvent être rajoutés Voir adaptation INTEX

Conclusion & Perspectives