8èmes Journées INTEX/NooJ

Slides:



Advertisements
Présentations similaires
Comment annoter ? sur 60 réponses
Advertisements

Objectifs de la séance Aujourd'hui, nous allons apprendre à distinguer certains homophones grammaticaux. A la fin de la séance, vous serez capables de.
ÉTUDE DE LA LANGUE : VOCABULAIRE
D’après un travail de Philippe Boisseau, IEN
TRAITEMENT AUTOMATIQUE DES LANGUES : LES PRINCIPAUX PROGRAMMES
SYSTRAN Un outil du TAL Victoria AUPERT Marjorie LORSUNG.
Par Aline Mahot et Charlyne Routier
Exemples de documents de travail
Travaux pratiques sur Nooj
Cours présentielle avec 1er année.
Cordial, le TAL et les aides à la rédaction
Quelques exemples de situations de travail ritualisées brèves...
LES REGLES DE BASE DE L’ORTHOGRAPHE
La base textuelle FRANTEXT
GRAM 1 CE2 Je sais transformer une phrase affirmative en phrase négative.
4 - Les automates et les lexiques morphologiques : le contenu mot fléchilemmepartie du discourstraits de flexion Habituellement, un lexique morphologique.
D1 - 19/05/2014 Le présent document contient des informations qui sont la propriété de France Télécom. L'acceptation de ce document par son destinataire.
Les genres littéraires
Tout savoir sur les classes de mots
Project de la langue française
Académie de Versailles - Inspection pédagogique régionale de lettres
Baccalauréat professionnel Gestion -- Administration
Maîtrise de la langue française
Nature ou fonction d’un mot
Βούλομαι, je veux A la découverte d’un verbe grec …
(A. Meurant - UCL )1 Grammaire de base et lecture de textes latins ( ) Premier baccalauréat en Philosophie et Lettres (Langues et littératures.
Les applications évoluées (traduction automatique) nécessitent beaucoup d'informations lexicales : délimitation des mots composés, lemmes... Cela fait.
OUTILEX Présentation des résultats
1 DTSI / Service Cognitique Robotique et Interaction OUTILEX Démonstrateur du CEA-LIST : moteur d'interrogation crosslingue (français, anglais, espagnol)
‘The Voice Company’ Du texte à la Parole
Forum des Industries de la Langue, 17 mars 2010
Reconnaissance automatique des expressions elliptiques arabes
Chapitre 2 La description du langage
LE DEVELOPPEMENT DU LANGAGE
(A. Meurant - UCL )1 Chapitre Quatrième Quelques définitions de base.
Présentation des objectifs de 2P
Qu'est ce que savoir lire ?
6th INTEX Workshop - Sofia, Bulgarie, May 2003 La Conjugaison des verbes arabes avec Intex Ibtihal FARAWI Laboratoire LASELDI Université de Franche.
Les étapes initiales du développement du langage ORAL
Le programme de 2 AM 2e Exposé Lien compétence globale
Formation VoiXtreme 5 route de Paisy, Dardilly Tél. : Fax. :
ETUDE DE LA LANGUE FRANCAISE Grammaire – Vocabulaire – Orthographe
Les classes grammaticales
Analyser un verbe, qu’est-ce que cela veut dire ?
Les classes de mots… en bref
Aujourd'hui, nous allons étudier les classes grammaticales des mots.
Mon cahier de réussite Classe de CM
Segmentation morphologique à partir de corpus Delphine Bernhard Laboratoire TIMC-IMAG, Grenoble
Programmation annuelle: Etude de la langue
Natures / classes grammaticales INTRODUCTION
Les classes de mots ou classes grammaticales
J’ai… poli Qui a… un verbe J’ai… par Qui a… une conjonction J’ai… bien Qui a… un pronom J’ai… nous Qui a… une préposition J’ai… chausson Qui a… un déterminant.
Toujours devant un verbe
LANGAGE ORAL STADES D’ACQUISITION
Le Traitement Automatique des Langues (TAL)
EDL GRAMMAIRE GRAMMAIRE CONJUGAISON CE1 GRAM 11 GRAM 12 GRAM 13
Traduction de l’Anglais vers l’Arabe
Quand j’écris un texte…
Module d’auto-apprentissage
Հայերէն Le module arménien de Nooj : dernières réalisations
Règles d’or à suivre en rédaction
Progression/Programmation – Français (1/3)
les mots variables et les mots invariables.
Etude de la capacité de fonctionnement imaginaire des infirmières avec des bébés prématurissimes E. Seye, E. Amrani (IDE, réanimation néonatale) V. Granboulan.
Circonscription Laval 2 Lexique, grammaire et production « Identifier le verbe au cycle 2 » Octobre 2011.
Cohérence textuelle GRAMMAIRE DU TEXTE TEXTE Progression Marques de relation Non-contradiction Pertinence Continuité Reprise de l’information.
La pédagogie de l’erreur
Mise en oeuvre d’un outil original d’aide en ligne à la lecture de textes en langue étrangère. G. Deville - M. Miceli (Ecole des Langues Vivantes - FUNDP)
UQÀM DDL-8430 didactique de la grammaire Analyse de matériel didactique Nouvelle grammaire pratique : 2ème année du 1 er cycle du secondaire Myriam Laporte.
Lingua francese III.
Transcription de la présentation:

8èmes Journées INTEX/NooJ LEXIQUE ARABE ET ANALYSE MORPHOLOGIQUE Présenté par : Slim MESFAR Encadré par : Pr. Max SILBERZTEIN

Lexique arabe La chaîne globale de génération du lexique arabe se décompose en trois sous-chaînes: Sous-chaîne de génération verbale Sous-chaîne de génération nominale Sous-chaîne de génération des particules

Chaîne de génération verbale ضَرَبَ,V+FLX=Vdaraba1 ذَكَرَ,V+FLX=Vdakara2 كَتَبَ,V+FLX=Vdakara2 عَلَّمَ,V+FLX=Valama3 … Saisie initiale Vdaraba1= # Voici les formes au présent de l’indicatif, voix active: <LW> (أَ<R><S>ْ<R><S>ِ<R><S>ُ/A+P+1+s +تَ<R><S>ْ<R><S>ِ<R><S>ُ/A+P+2+m+s) + # Voici les formes au passé, voix passive: (<L5>ُ<S><R>ِ<S><R><S>) (ْتُ/K+I+1+s + ْنَا/K+I+1+P) … ; Verbes Classes flexionnelles Conjugaison Formes verbales fléchies

Chaîne de génération nominale Verbes Saisie des primitifs Classes dérivationnelles Déverbaux Primitifs Fusion Grammaires morphologiques Formes nominales canoniques

Chaîne de génération des particules Saisie manuelle de 300 particules voyellées: Adverbes, Prépositions, Conjonctions, Interjections, Pronoms personnels, Articles, …

Informations linguistiques stockées La simple reconnaissance des formes est insuffisante  Description, stockage d’informations Lemme Catégorie grammaticale Genre et nombre Transitivité …

Analyse morphologique Mot du texte Dictionnaire des particules Reconnaissance des segmentations Lexique formes simples fléchies Application des règles morpho-syntaxiques Grammaires morphologiques Informations linguistiques associées à la forme reconnue

Transitivité des verbes  Possibilité de concaténer des pronoms personnels en tant que suffixes

Règles de réécriture Éliminer les incompatibilités morphologiques après décomposition Rétablir la bonne graphie On procède aux transformations suivantes: Ajout d’une lettre: parabuWhu  parabuWl + hu Substitution d’une lettre: sammalni  sammay + ni Suppression d’une lettre + Substitution d’une voyelle: parabotumuWha  parabotumo + ha Suppression de 3 lettres: laédfaganna  la + édfaga …

Règles de réécriture : exemples …

Règles d’harmonie vocalique  Vérifier la compatibilité de la voyellation du radical avec celle du suffixe qui s'y rattache Exemples: kiTalBi + hi est une agglutination permise alors que kiTalBa + hi est interdite MagalNiY + hi est une agglutination permise alors que MagalNiY + hu est interdite gaçal + hu est une agglutination permise alors que gaçal + hi est interdite

Conclusion & Perspectives Reconnaissance estimée à plus de 150 millions de formes à partir de dictionnaires de 25 000 entrées Couverture autour de 80% lors de l’analyse d’un texte de 50 000 occurrences. Traitement de textes partiellement voyellés ou non voyellés