KHALFALLAH HAMMOUDA Faten

Slides:



Advertisements
Présentations similaires
Sintaks : Tentative de guide de mise en œuvre Michel Hassenforder.
Advertisements

Prof. Assist. Dr Penphan THIPKONG
Urbanisation de Systèmes d'Information
Entre construction théorique et mise en œuvre opérationnelle
UML - Présentation.
DEME - La méthode d’enquête – introduction
Exemple : Itinéraire de lecture.
TRAITEMENT AUTOMATIQUE DES LANGUES : LES PRINCIPAUX PROGRAMMES
Par Aline Mahot et Charlyne Routier
INTRODUCTION.
Cordial, le TAL et les aides à la rédaction
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
L’observation réfléchie de la langue au cycle 3
Initiation au système d’information et aux bases de données
Initiation au système d’information et aux bases de données
Initiation à la conception de systèmes d'information
May 4th – 5th 2009, Rabat, Morocco Inès ZALILA & Kais HADDAR
Building an Electronic Dictionary of Computer Science Terminology
Annotations sémantiques pour le domaine des biopuces
Olivier CANTIN, Tassadit AMGHAR, Bernard LEVRAT
Recherche Documentaire et traitement de l’information
Entre construction théorique et mise en œuvre opérationnelle
Reconnaissance Vocale
Introduction à la recherche en science politique
1 CSI3525: Concepts des Languages de Programmation Notes # 3: Description Syntaxique des Languages.
Les applications évoluées (traduction automatique) nécessitent beaucoup d'informations lexicales : délimitation des mots composés, lemmes... Cela fait.
Date / references Systèmes Terre et Interarmées Projet OUTILEX Rapport détude final Octobre 2006.
Article présentée par : Étudiante en 2ème année mastère F.S.T. Tunisie
Thales Research and Technology Filtrage et Extraction dInformation 1 Évaluation comparative de ressources générales et de ressources spécifiques pour l'extraction.
Yasmina ABBAS EDF - Division Recherche et Développement (Division R&D)
Forum des Industries de la Langue, 17 mars 2010
Module 5 : Publication de ressources dans Active Directory
Chapitre 3 Syntaxe et sémantique.
Reconnaissance automatique des expressions elliptiques arabes
Chapitre 2 La description du langage
8èmes Journées INTEX/NooJ
LA DIFFÉRENCE ENTRE L’ÉTUDE D’UNE PHRASE ET D’UN ENONCÉ
Technique du résumé de synthèse de l’exposé écrit
Les techniques des moteurs de recherche
Patrons de conceptions de créations
Paradigmes des Langages de Programmation
L’observation réfléchie de la langue
Algorithmes et Programmation
Le programme de 2 AM 2e Exposé Lien compétence globale
CoRRecT : Démarche coopérative pour l’évaluation de systèmes de reconnaissance de termes Chantal Enguehard IRIN – Université de Nantes 2 rue de la Houssinière.
Recherche en corpus de réponses à des questions définitoires Véronique Malaisé Thierry Delbecque Pierre Zweigenbaum TALN 2005, Dourdan.
© Petko ValtchevUniversité de Montréal Février IFT 2251 Génie Logiciel Conception Hiver 2002 Petko Valtchev.
04/12/2012 Serge Villette CETE de l’Ouest 1 L’intégration du Développement durable dans l’évaluation des projets d’infrastructures portuaires ou fluviales.
CONSTRUCTION D’UN REFERENTIEL
Intégration de schémas
1 Management des unités commerciales Management des unités commerciales LANGUE VIVANTE ÉTRANGÈRE I - coefficient 3 L’usage d’un dictionnaire bilingue est.
Initiation à la conception des systèmes d'informations
Dominique LAURENT Patrick SEGUELA
Recherche d’information
Techniques documentaires et veille stratégique Anne Pajard, avril 2008
T . P . E Travaux Personnels Encadrés
Modélisation des documents: DTD et Schéma
TEXT MINING Fouille de textes
JDD 2005 Utilisation et Constitution de Ressources Sémantiques pour la Recherche d'Informations Précises. Vincent Barbier, groupe LIR Langues, Information.
Didactique(s) Introduction
Le Traitement Automatique des Langues (TAL)
Nouvelles Technologies Internet & Mobile
Journée Des Doctorants 2004
Vers l’exploitation de grandes masses de données Encadré par : Mme L.Lamarini Présenté par: Rhaz Yassine Smiri Safae Un article de: Raphaeil Féraud,Maroc.
Pierre Malenfant Technologie 9 École du Carrefour
INTRODUCTION AUX BASES DE DONNEES
Architectures articulant des représentations hétérogènes L’exemple de Gate (Mini tutoriel, journée Atala du 12 février 2005) Thierry Poibeau LIPN (CNRS.
LES TEXTES ET LES SHADOKS (Docs d’application et d’accompagnement)
1 4th International Conference on Arabic Language Processing, May 2–3, 2012, Rabat, Morocco Titre Mohamed El Amine ABDERRAHIM Mohamed Alaedine ABDERRAHIM.
CURSUL 9 VI. LES COMPÉTENCES DE L’APPRENANT Le Développement des compétences linguistiques, sociolinguistiques, pragmatiques.
Transcription de la présentation:

KHALFALLAH HAMMOUDA Faten Exposé Construction d’un dictionnaire de noms composés en arabes KHALFALLAH HAMMOUDA Faten

plan Introduction Etat de l’art Noms composés arabes Transducteurs NooJ Démarche proposée Expérimentation et évaluation Conclusion et perspectives 31/03/2017 2

Introduction Le traitement automatique de la langue naturelle (TALN) touche plusieurs domaines Noms composés fréquents dans les corpus Traitement de noms composés: Facilite l’analyse syntaxique Facilite la traduction automatique d’une langue à autre (i,.e, عروس البحر  épouse de mer) Extraction d’informations Nombreux travaux tiennent compte des problèmes de composition dans les langues naturelles

Introduction Problématiques Comment effectuer ce recensement? Comment fixer l’approche à utiliser? Le nombre variant de composants de noms composés. Manque de consensus. Variété de langues

Introduction Recenser l’ensemble de noms composés arabes Objectifs Recenser l’ensemble de noms composés arabes à partir d’un corpus Construire des transducteurs en se basant sur une liste de règles grammaticales et lexicales Faire les exploiter sur la plateforme NOOJ

plan Introduction Etat de l’art Noms composés arabes Transducteurs NooJ Démarche proposée Expérimentation et évaluation Conclusion et perspectives 31/03/2017

Etat de l’art Plusieurs travaux ont été effectués dans le cadre des aspects de la composition nominale Bourigault(1994), un terme complexe doit contenir au moins une tête et une expansion. i,.e. الشاشة الصغيرة Bauer(1988), la composition est « la formation d’un Nouveau lexème par l’adjonction de deux lexèmes ou plus», mais il ne définit pas clairement le lexème Benveniste (1974) donne le critère de référence de la Composition « il y a composition quand deux termes identifiables pour le locuteur se conjoignent en une unité nouvelle à signifiant unique et constant » i,.e. portefeuille

Etat de l’art Il existe 3 approches pour l’extraction Approche statistique Nakagawa et Mori (1998) Approche linguistique Bourigault (1994), Savary (2000) Approche mixte Daille (1994), Smadja (1993)

plan Introduction Etat de l’art Noms composés arabes Transducteurs NooJ Démarche proposée Expérimentation et évaluation Conclusion et perspectives 31/03/2017 9

Noms composés arabes Un nom composé arabe est une suite de noms qui ne peuvent pas être séparés par un autre mot.[A.Abdelwehed] Exemples: حارس المرمى , gardien الشاشة الصغيرة , télévision

Noms composés arabes Typologie Le composé annexe "الاضافي المركب " Le composé référentiel " الاسنادي المركب " Le composé substitutif " المركب البدلي " Le composé confirmatif " المركب التوكيدي " Le composé simili-référentiel " شبه الاســنادي المركب " Le composé descriptif " النعتي المركب " La filiation " الكــنية "

Noms composés arabes Typologie Les noms composés arabes peuvent être: Nom propre composé (عبد الرحمان, محمد علي,عبد الكريم) Nom nom nom*(رئيس محــكمة، رئيس نادي الطفولة) Nom* nom propre (الملك حسين، حارس المرمى شكري الواعر)

Noms composés arabes Composé annexe مركب إضافي un annexant مضاف Annexé مضاف إليه un annexant doit être toujours simple ne permet pas l’ajout de l’article الــ ni le duel ‘ المثنّى ‘ un annexé peut être simple ou complexe permet l’ajout de l’article الــ et le duel ‘ المثنّى ‘ I,.e. رئيس الخارجيّة رئيس خارجيّة

Corrélatif de l’attribut Noms composés arabes Composé référentiel مركب إسنادي Attribut مسند Corrélatif de l’attribut مسند إليه Syntagme nominal (i,.e, الشاشة الصغيرة ) Syntagme verbal (i,.e, تأبّط شرّا ) Permet l’ajout ou l’absence du déterminant الــ dans les deux parties du composé ensemble

مــركّــب بدلي Composé substitutif Noms composés arabes بدل substitutif مــركّــب بدلي Composé substitutif مبدل منه substitué مفرد simple مركب composé إضافي annexe نعتي descriptif Exemples: الخليفة الأموي عــقــبة ابن نافع

مــركّــب نعتي composé descriptif Composé prépositionnel Noms composés arabes مفرد simple مــركّــب نعتي composé descriptif مركب composé مركب اسمي Composé nominal مركب حرفي بالجر Composé prépositionnel مركب موصولي اسمي Composé relationnel nominal مركب اسنادي Composé référentiel نعت + منعوت Exemples: الشاشة الصغيرة خفيف الروح

مــركّـب توكيدي Composé confirmatif مفعول به Patient direct Noms composés arabes مــركّـب توكيدي Composé confirmatif فاعلAgent مفعول به Patient direct مبتدأPrimat خبرPrédicat تمييز Distinctif نعت Descriptif

Noms composés arabes Ambiguïtés Plusieurs cas sémantiques peuvent produire des ambiguïtés Polysémie دخل محمد صالح مفتاح الملعب Mohamedsalah a entré au terrain أدخل محمد صالح مفتاح البيت في القفل Mohamedsalah a entré la clé de la maison dans le canon تسلم محمّد صالح مفتاح المنزل Mohamed salah a pris la clé de la maison comportement des verbes transitivité

Noms composés arabes Solutions? Synonymie كان النّبيّ المصطفى كريما نبيلا كان الرّسول كريما نبيلا Le prophète était généreux et noble سافر حسن مع أخيه Hasan a voyagé avec son frère سافر أبو علي مع أخيه Abou Ali a voyagé avec son frère Textes voyellés Dictionnaire de déclencheurs Construire des règles par des grammaires locales Solutions?

plan Introduction Etat de l’art Noms composés arabes Transducteurs NooJ Démarche proposée Expérimentation et évaluation Conclusion et perspectives 31/03/2017 20

Transducteurs NooJ Transducteur Dispositif algorithmique qui présente un ensemble de séquences en entrée et associe des séquences produites en sortie Permet de modifier les séquences en entrée (effacement, remplacement)

Transducteurs NooJ

Transducteurs NooJ

Transducteurs NooJ

Transducteurs NooJ

Transducteurs NooJ

plan Introduction Etat de l’art Noms composés arabes Transducteurs NooJ Démarche proposée Expérimentation et évaluation Conclusion et perspectives 31/03/2017 27

Processus d’évaluation Démarche proposée Règles lexicales Processus de filtrage Corpus Liste de noms composés candidats Processus d’évaluation Package de transducteurs Opération d’analyse Dictionnaire de noms composés Liste de noms Composés finale

Démarche proposée Choix du domaine Formation manuelle d’un corpus composé d’un nombre volumineux de mots Le fait d’avoir un très grand corpus nous permet d’avoir le maximum des cas possibles de noms composés Choix du domaine de sport

Démarche proposée

plan Introduction Etat de l’art Noms composés arabes Transducteurs NooJ Démarche proposée Expérimentation et évaluation Conclusion et perspectives 31/03/2017 31

Expérimentation et évaluation

Expérimentation et évaluation Evaluation Silence Nbre de corpus 1 corpus Nbre de textes 78 textes Nbre de mots 25000 mots R= 2000/2500 0,8 (80%) P= 2000/ 2800 0,71 (71%) F_mesure 0,74(74%) Bruit Rappel Précision F-mesure

plan Introduction Etat de l’art Noms composés arabes Transducteurs NooJ Démarche proposée Expérimentation et évaluation Conclusion et perspectives 31/03/2017 34

Conclusion Etat de l’art des approches existantes Définition de concept de noms composés arabes Description de quelques ambiguïtés liées à la reconnaissance des noms composés arabes Construction de transducteurs pour l’extraction

Perspectives Transformer le dictionnaire en format .xml Analyse sémantique

Merci pour votre attention 37