La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

8èmes Journées INTEX/NooJ

Présentations similaires


Présentation au sujet: "8èmes Journées INTEX/NooJ"— Transcription de la présentation:

1 8èmes Journées INTEX/NooJ
LEXIQUE ARABE ET ANALYSE MORPHOLOGIQUE Présenté par : Slim MESFAR Encadré par : Pr. Max SILBERZTEIN

2 Lexique arabe La chaîne globale de génération du lexique arabe se décompose en trois sous-chaînes: Sous-chaîne de génération verbale Sous-chaîne de génération nominale Sous-chaîne de génération des particules

3 Chaîne de génération verbale
ضَرَبَ,V+FLX=Vdaraba1 ذَكَرَ,V+FLX=Vdakara2 كَتَبَ,V+FLX=Vdakara2 عَلَّمَ,V+FLX=Valama3 Saisie initiale Vdaraba1= # Voici les formes au présent de l’indicatif, voix active: <LW> (أَ<R><S>ْ<R><S>ِ<R><S>ُ/A+P+1+s +تَ<R><S>ْ<R><S>ِ<R><S>ُ/A+P+2+m+s) + # Voici les formes au passé, voix passive: (<L5>ُ<S><R>ِ<S><R><S>) (ْتُ/K+I+1+s + ْنَا/K+I+1+P) ; Verbes Classes flexionnelles Conjugaison Formes verbales fléchies

4 Chaîne de génération nominale
Verbes Saisie des primitifs Classes dérivationnelles Déverbaux Primitifs Fusion Grammaires morphologiques Formes nominales canoniques

5 Chaîne de génération des particules
Saisie manuelle de 300 particules voyellées: Adverbes, Prépositions, Conjonctions, Interjections, Pronoms personnels, Articles,

6 Informations linguistiques stockées
La simple reconnaissance des formes est insuffisante  Description, stockage d’informations Lemme Catégorie grammaticale Genre et nombre Transitivité

7 Analyse morphologique
Mot du texte Dictionnaire des particules Reconnaissance des segmentations Lexique formes simples fléchies Application des règles morpho-syntaxiques Grammaires morphologiques Informations linguistiques associées à la forme reconnue

8 Transitivité des verbes
 Possibilité de concaténer des pronoms personnels en tant que suffixes

9 Règles de réécriture Éliminer les incompatibilités morphologiques après décomposition Rétablir la bonne graphie On procède aux transformations suivantes: Ajout d’une lettre: parabuWhu  parabuWl + hu Substitution d’une lettre: sammalni  sammay + ni Suppression d’une lettre + Substitution d’une voyelle: parabotumuWha  parabotumo + ha Suppression de 3 lettres: laédfaganna  la + édfaga

10 Règles de réécriture : exemples

11 Règles d’harmonie vocalique
 Vérifier la compatibilité de la voyellation du radical avec celle du suffixe qui s'y rattache Exemples: kiTalBi + hi est une agglutination permise alors que kiTalBa + hi est interdite MagalNiY + hi est une agglutination permise alors que MagalNiY + hu est interdite gaçal + hu est une agglutination permise alors que gaçal + hi est interdite

12 Conclusion & Perspectives
Reconnaissance estimée à plus de 150 millions de formes à partir de dictionnaires de entrées Couverture autour de 80% lors de l’analyse d’un texte de occurrences. Traitement de textes partiellement voyellés ou non voyellés


Télécharger ppt "8èmes Journées INTEX/NooJ"

Présentations similaires


Annonces Google