Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
Publié parDanielle Roux Modifié depuis plus de 10 années
1
TALAf 2014 Vers la Mise en place d’un lexique basé sur LMF pour la langue Wolof. 1 21 ème Traitement Automatique des Langues Naturelles, Marseille, 2014 Mouhamadou KHOULE, Mouhamad Ndiankho THIAM, El hadji Mamadou NGUER LANI, Université Gaston Berger de Saint Louis du Sénégal,
2
PLAN Introduction Introduction Travaux antérieurs sur les lexiques pour la langue Wolof Travaux antérieurs sur les lexiques pour la langue Wolof Vers une élaboration du lexique basé sur LMF. Vers une élaboration du lexique basé sur LMF. Conclusion et perspectives. Conclusion et perspectives. 2
3
Introduction Contexte. Au Sénégal, vingt cinq (25) langues endogènes, selon la Direction de l’Alphabétisation et des Langues Nationales, cohabitent avec le français, l’arabe et d’autres langues étrangères. 80 % 80 % de la population ne comprennent pas le français (seule langue officielle). Pour pallier à ce problème il s’avère nécessaire d’utiliser les langues nationales comme le wolof compris par plus de 80 % de la population 3
4
Introduction Contexte ( Contexte (Sur la vitalité du Wolof) C'est la langue la plus parlée au Sénégal. Elle s'impose de plus en plus dans les débats télévisés, les émissions radio et les panneaux publicitaires. Elle est parmi les langues nationales ayant fait l’objet de plus d’études et de recherche. Elle devance les autres sur les contenus. En effet elle est la seule langue nationale présente sur Wikipedia, sur les outils de Windows et sur ceux de Google. La constitution, le coran et la bible sont entièrement traduits en Wolof. Elle fait partie avec le Pulaar des langues nationales choisies par l’Académie Africaine des Langues (Acalan.org) Etc. 4
5
Introduction Problématique. wolof Néanmoins, comparée aux langues étrangères comme le français et l’anglais, le wolof n’a pas profité des avancées du TALN dont la principale base de travail est le lexique. lexique une étude linguistique Notons qu’un tel lexique, qui n’est toujours pas mis en place pour la langue Wolof, requiert au préalable une étude linguistique de la structuration des données de cette langue. 5
6
Introduction Solution proposée. (Cissé et al. 2007) base de données multifonctionnelle Mettre en place un lexique pour la langue Wolof en partant du travail de restructuration effectué dans (Cissé et al. 2007) pour la mise au point d’une base de données multifonctionnelle pour cette langue. fiches lexicales Cette base de données lexicale est composée d’un ensemble de fiches lexicales. Notons que certaines informations morphologiques relatives au lexème ne sont pas disponibles sur les fiches lexicales. beaucoup de répétitions De plus il y’a beaucoup de répétitions au niveau des entrées lexicales de la base. 6
7
Introduction Méthodologie LMF Structurer ces fiches lexicales suivant le standard LMF (Lexical Markcup Framework). Dans la suite du document, nous présenterons d’abord: (Cissé et al., 2007 les travaux effectués dans (Cissé et al., 2007 ), ensuite nous parlerons du standard LMF pour enfin terminer par la structuration des fiches en suivant l’esprit LMF. L’objectif final consiste à exporter l’ensemble des fiches structurées au format LMF dans une base de données lexicale qui servira de base de travail pour la mise en œuvre d’un correcteur orthographique interactif pour la langue wolof. 7
8
Travaux antérieurs sur les lexiques pour la langue Wolof A notre connaissance (Cissé et al. 2007) est le seul projet de mise au point d’une base de données lexicale multifonctionnelle Il est question dans ce projet de constituer une base de données lexicale à partir de laquelle extraire à la fois un dictionnaire unilingue wolof et un dictionnaire bilingue wolof/français. Il se fixe parmi ses objectifs de produire des sorties XML et de concevoir des modèles XSL pour l’interrogation. 8
9
Travaux antérieurs sur les lexiques pour la langue Wolof La figure suivante présente une illustration d’une entrée ainsi que les champs qui lui sont associés. L’image est obtenue à partir de l’outil Toolbox que les concepteurs ont utilisé pour la conception de la base de données. 9
10
Travaux antérieurs sur les lexiques pour la langue Wolof Au niveau des entrées on note beaucoup de répétitions De plus certaines informations morphologiques du lexème telles que les formes dérivées et fléchies n’y sont pas disponibles. 10
11
Structuration des fiches en suivant l’esprit LMF. Choix de LMF. Concernant les standards, nous avons porté notre choix sur LMF devenu norme ISO numéro 24613 :2008 en novembre 2008 pour plusieurs raisons. Tout d’abord les objectifs de LMF sont de fournir un modèle commun pour la création et l’utilisation de ressources lexicales, mais aussi de permettre l’interopérabilité entre ces ressources (Francopoulo et al. 2006). Elle permet la spécification de ressources linguistiques monolingues et multilingues destinées à l’usage éditorial et du TALN. Les langues couvertes par LMF ne se limitent pas aux langues européennes mais à toutes les langues naturelles. De plus elle assure une modélisation extensible et modulaire couvrant tous les niveaux de description linguistique (morphologique, syntaxiques, sémantique, etc.). 11
12
Présentation générale de LMF 12 LMF est une initiative au sein de l'ISO en faveur de la normalisation de la représentation des ressources lexicales. méta-modèle noyau obligatoire (Francopoulo et al. 2006). LMF propose un méta-modèle constitué d’un noyau obligatoire autour duquel gravitent des extensions (morphologique, syntaxique, sémantique et MRD) (Francopoulo et al. 2006).
13
Présentation générale de LMF 13 Le noyau de LMF est présenté par la figure suivante. L’objet «Lexical Entry » contient un ou plusieurs objets « Form » et un ou plusieurs objets « Sense». On structure maintenant les fiches en suivant ce méta-modèle.
14
Structuration des fiches 14 Les fiches produites dans les travaux dans (Cissé et al.2007) sont disponibles au format XML. On les structurer au format LMF en suivant les deux étapes suivantes. Etape 1: Ajout des balises de structuration (voir diapo 14). Etape 2: Passage au format LMF. (Voir diapo 15) balise «fiche» la balise «bloc-vedette» l’objet « form» la balise «bloc-sémantique» En faisant correspondre la balise «fiche» à l’objet «Lexical Entry», la balise «bloc-vedette» à l’objet « form» et la balise «bloc-sémantique» à l’objet «Sense» en prenant juste les informations dont nous avons besoin au niveau de la fiche lexicale. Nous ajouterons ensuite certaines balises de restructuration pour prendre en compte les formes fléchies et les formes dérivées
15
askan ɐ sk ɐ n turu bokkaale w- Mbooleem ñi bokk dëkkandoo Texte juridique Déclaration universelle des droits de l'homme (http://www.unhchr.ch/udhr/lang/wol.htm) Njaboot nekk na meññeef gu am solo ci askan wi. population nom La progéniture constitue une ressource importante pour la population askan askan ɐ sk ɐ n turu bokkaale w- Mbooleem ñi bokk dëkkandoo Texte juridique Déclaration universelle des droits de l'homme (http://www.unhchr.ch/udhr/lang/wol.htm) Njaboot nekk na meññeef gu am solo ci askan wi. population nom La progéniture constitue une ressource importante pour la population askan 15
16
16
17
Conclusion Objectif: (Cissé et al. 2007) Objectif: mettre en place un lexique basé sur LMF pour la langue Wolof en partant des résultats de (Cissé et al. 2007) dont le but principal est l’étude de la structuration de la langue Wolof et la mise au point de base de données multifonctionnelle. restructuré ces fiches lexicales Méthode: restructuré ces fiches lexicales en différents blocs pour ensuite proposer une méthode de conversion de ses fiches lexicales en suivant des formes fléchies et dérivées le standard LMF, tout en y ajoutant certaines balises pour la prise en charge des formes fléchies et dérivées relatives au lexème. 17
18
Apports et Perspectives Ce lexique constitue une base de travail nécessaire pour le développement d’un correcteur interactif et un traducteur automatique pour cette langue. Dans nos futurs travaux, nous comptons automatiser la structuration des fiches selon LMF en utilisant une feuille de style XSLT, pour mettre en place une base de données lexicale normalisée LMF pour la langue Wolof Concevoir un outil d’intégration des différentes fiches lexicales structurées suivant l’esprit LMF et un outil d’enrichissement et d’interrogation de la base de données normalisée. 18
19
19
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.