La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

dlcnstrctn dcrps prlls

Présentations similaires


Présentation au sujet: "dlcnstrctn dcrps prlls"— Transcription de la présentation:

1 dlcnstrctn dcrps prlls
alxtrctn dtrmnlgs blngs : lsprblms spcfqs l’rb frncs stck crm - nlc atlr astct - hmmt - 20 ctbr 2002

2 De la construction de corpus parallèles
à l’extraction de terminologies bilingues : les problèmes spécifiques à l’arabe Francois Stuck CRIM - INALCO Atelier ASSTICCOT - Hammamet - 20 octobre 2002

3 Atelier ASSTICCOT - Hammamet - 20 octobre 2002
L’arabe n’est pas une langue indo-européenne ! La famille des langues sémitiques : des systèmes morphologiques non concaténatifs - à racines consonantiques - à patrons de dérivation lexicale des écritures non alphabétiques Atelier ASSTICCOT - Hammamet - 20 octobre 2002

4 Atelier ASSTICCOT - Hammamet - 20 octobre 2002
Phonologie de l’arabe    Système vocalique minimum : /a/ /i/ /u/ Opposition des voyelles courtes / longues Richesse consonantique : des phonèmes spécifiques (glottales, emphatiques) des phonèmes courants absents : /p/ /v/ des semi-consonnes instables Atelier ASSTICCOT - Hammamet - 20 octobre 2002

5 Système morphologique (1)
Des consonnes porteuses d’un noyau sémantique (un triplet ordonné de racines tri-littères) à k t b est associé l'idée d'écrire w S l de joindre j d d de nouveauté Atelier ASSTICCOT - Hammamet - 20 octobre 2002

6 Système morphologique (2)
Des patrons formels de dérivation lexicale, spécifiant les affixations consonantiques la mélodie vocalique verbe R1aR2aR3a agent R1aaR2iR3 Instanciés par la valeur des racines R1R2 R3 Atelier ASSTICCOT - Hammamet - 20 octobre 2002

7 Système morphologique (3)
les dérivations verbales R1aR2aR3a kataba "écrire"   R1aaR2aR3a kaataba "correspondre" iR1R2taR3a iktataba "souscrire" les dérivations nominales maR1R2uuR maktuub ce qui est écrit R1aaR2iR kaatib celui qui écrit maR1R2aR maktab bureau Atelier ASSTICCOT - Hammamet - 20 octobre 2002

8 Système morphologique (4)
Un système de flexion morpho-syntaxique par: suffixe katabtu j’ai écrit kitaabun un livre kitaabaani livres suffixe et préfixe aktubu j’écris alkitaabu le livre Atelier ASSTICCOT - Hammamet - 20 octobre 2002

9 Système morphologique (5)
La flexion des pluriels brisés : des patrons plus ou moins prévisibles kitaabun un livre mais kutubun des livres waladun un enfant awlaadun des enfants maktabun un bureau makaatibun des bureaux Atelier ASSTICCOT - Hammamet - 20 octobre 2002

10 Système morphologique (6)
Quelques mots grammaticaux se concatènent aux formes fléchies : les conjonctions et prépositions monosyllabiques l’article défini Les pronoms objets wabilkitaabi et avec le livre fasa'aktubuhu je l’écrirai donc Atelier ASSTICCOT - Hammamet - 20 octobre 2002

11 Système morphologique (7)
Quelques conséquences de la combinatoire morphologique : sur la segmentation en unités lexicales sur la lemmatisation sur la constitution de corpus Atelier ASSTICCOT - Hammamet - 20 octobre 2002

12 Atelier ASSTICCOT - Hammamet - 20 octobre 2002
L’écriture arabe (1)    Elle est fondamentalement consonantique Des signes diacritiques facultatifs pour : vocaliser spécifier la gémination ou l’indétermination يَشْرَبُ (il boit) شَرَّبَ (il a imprégné) Atelier ASSTICCOT - Hammamet - 20 octobre 2002

13 Atelier ASSTICCOT - Hammamet - 20 octobre 2002
L’écriture arabe (2)    Dans la pratique, les diacritiques ne sont pas notés des ambiguités lexicales كتب /kutubun/ ou / kataba/ ? des ambiguités syntaxiques كتبت /katabtu/ ou / katabta / ? /kutibtu/ ou / kutibta / ? Atelier ASSTICCOT - Hammamet - 20 octobre 2002

14 Atelier ASSTICCOT - Hammamet - 20 octobre 2002
L’écriture arabe (3)    Des formes contextuelles de lettre : différentes si isolée ou en début, milieu, fin de mot j ﺝ ﺞ ﺠ ﺟ h ﻩ ﻪ ﻬ ﻫ ligature de certaines séquences de lettres ل + ا = ﻻ ou ﻼ Atelier ASSTICCOT - Hammamet - 20 octobre 2002

15 Atelier ASSTICCOT - Hammamet - 20 octobre 2002
L’écriture arabe (4)    Absence de majuscules Variations locales dans l'usage de certaines formes: dissimulation du y final ي devient ى disparition du hamza ا pour ا أ آ إ Atelier ASSTICCOT - Hammamet - 20 octobre 2002

16 Quelques points de syntaxe (1)
L’ordre des phrases : de préférence V S O a dit les reponsables que s'entende le régime irakien avec l'ONU l’accord ne se fait alors pas en nombre ! parfois V S O les reponsables qui ont dit que... l’accord est alors total… Atelier ASSTICCOT - Hammamet - 20 octobre 2002

17 Quelques points de syntaxe (2)
l Les syntagmes nominaux adjectif épithète : en général postposé la maison la blanche cohésion entre déterminé et déterminant au génitif (le) président (de) la république le précédent      ambiguité de la portée de l'adjectif (la) présidente (de) la république la précédente (la) présidente la précédente de la république propagation de la détermination  un passeport  permis (de) voyage le passeport  permis (de) le voyage Atelier ASSTICCOT - Hammamet - 20 octobre 2002

18 Atelier ASSTICCOT - Hammamet - 20 octobre 2002
Et au niveau discursif.. Délimitation de la phrase : par la ponctuation par coordination Variations lexicales autour de : la richesse lexicale rythme morphologique Compacité du texte arabe : environ 20% pour les mots , 25% pour les caractères Atelier ASSTICCOT - Hammamet - 20 octobre 2002

19 Atelier ASSTICCOT - Hammamet - 20 octobre 2002
Le Web multilingue Avec la formalisation du document multilingue codage des caractères universel : Unicode internationalisation de HTML, XML.. des outils de navigations réellement multilingues : IE5+, Netsape 6+ Présence des langues extra-européennes sur le web Atelier ASSTICCOT - Hammamet - 20 octobre 2002

20 Quelle terminologie arabe depuis Web ? (1)
Au sein du monde arabe, une tendance : bilinguisme arabe – anglais de la presse monolinguisme anglais des sites d’entreprise Ailleurs, de nombreux sites multilingues : des institutions internationales, des grandes agences de presse où français et l’arabe se côtoient (parfois) Atelier ASSTICCOT - Hammamet - 20 octobre 2002

21 Quelle terminologie arabe depuis le Web ? (2)
Au sein du Web arabe bilingue : Prédominance du discours journalistique Rareté du texte professionnel spécialisé (sauf informatique) Aujourd’hui, Manque de ressources pour une terminologie spécialisé ? Des ressources suffisantes pour une terminologie thématique ? Atelier ASSTICCOT - Hammamet - 20 octobre 2002


Télécharger ppt "dlcnstrctn dcrps prlls"

Présentations similaires


Annonces Google