La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Génération et analyse de mots arabes (GAMAR) : vers une plateforme denrichissement des requêtes pour la recherche dinformation ou la fouille de textes.

Présentations similaires


Présentation au sujet: "Génération et analyse de mots arabes (GAMAR) : vers une plateforme denrichissement des requêtes pour la recherche dinformation ou la fouille de textes."— Transcription de la présentation:

1 Génération et analyse de mots arabes (GAMAR) : vers une plateforme denrichissement des requêtes pour la recherche dinformation ou la fouille de textes Génération et analyse de mots arabes (GAMAR) : vers une plateforme denrichissement des requêtes pour la recherche dinformation ou la fouille de textes Joseph Dichy Université Lumière-Lyon 2 ICAR – UMR 5191 (CNRS/Lyon 2-ENS_LSH) Journées du groupe SILAT, Lyon, : Veille stratégique, évaluation et innovation avec des approches sémantiques (français, arabe, anglais)

2 J. Dichy - JEI Veille stratégique avec approches sémantiques - Lyon Mots clés recherche d'information et fouille de textes recherche d'information et fouille de textes ressource lexicale (base de connaissances) ressource lexicale (base de connaissances) théorie des spécificateurs linguistiques théorie des spécificateurs linguistiques propriétés lexico-sémantiques ; propriétés lexico-sémantiques ; ontologies linguistiques ; ontologies linguistiques ; relations lexique-grammaire relations lexique-grammaire Génération vs analyse Génération vs analyse lexiques générés lexiques générés

3 J. Dichy - JEI Veille stratégique avec approches sémantiques - Lyon Objet général Quelles ressources lexicales (conçues comme bases de connaissances) sont nécessaires/utiles pour la recherche d'information, la fouille de textes, la veille stratégique, l'indexation automatique, etc. ? Quelles ressources lexicales (conçues comme bases de connaissances) sont nécessaires/utiles pour la recherche d'information, la fouille de textes, la veille stratégique, l'indexation automatique, etc. ?

4 J. Dichy - JEI Veille stratégique avec approches sémantiques - Lyon Domaine d'illustration La recherche d'information, la fouille de textes, la veille stratégique La recherche d'information, la fouille de textes, la veille stratégique

5 J. Dichy - JEI Veille stratégique avec approches sémantiques - Lyon Recherche d'information avec Google 1a Dans la veille stratégique, la recherche d'information ou la fouille de textes, il y a en gros deux approches: Dans la veille stratégique, la recherche d'information ou la fouille de textes, il y a en gros deux approches: l'analyse morphologique au plein sens du terme, coûteuse en temps l'analyse morphologique au plein sens du terme, coûteuse en temps celle de Google (très rapide), que je vais rappeler en qq mots: celle de Google (très rapide), que je vais rappeler en qq mots: Dans la 1 re phase: page ranking (note de 0 à 10) - "Google dance" Dans la 1 re phase: page ranking (note de 0 à 10) - "Google dance"

6 J. Dichy - JEI Veille stratégique avec approches sémantiques - Lyon Recherche d'information avec Google 1a (rappel - suite) Cette approche exclut le recours à un analyseur morphologique associé à une base de données lexicales, Cette approche exclut le recours à un analyseur morphologique associé à une base de données lexicales, en raison des ralentissements qui en résulteraient : en raison des ralentissements qui en résulteraient : Pour la recherche وزراء التربية wuzarâ' al-tarbiya "ministres de l'éducation", on obtient 5 M de résultats en 0,21 sec. Avec un analyseur analysant mots par seconde, cela prendrait 50 x plus de temps, soit 17,5 minutes! Pour la recherche وزراء التربية wuzarâ' al-tarbiya "ministres de l'éducation", on obtient 5 M de résultats en 0,21 sec. Avec un analyseur analysant mots par seconde, cela prendrait 50 x plus de temps, soit 17,5 minutes! A quoi s'ajouteraient les ralentissements des phases 1 (crawling, pageranking…) et 2 (indexation…) A quoi s'ajouteraient les ralentissements des phases 1 (crawling, pageranking…) et 2 (indexation…)

7 J. Dichy - JEI Veille stratégique avec approches sémantiques - Lyon Recherche d'information avec Google 2a qq résultats Pour ra'as al-mal رأس المال "capital", au : résultats, incluant: Pour ra'as al-mal رأس المال "capital", au : résultats, incluant: la forme avec l'article ra'as al-mal رأس المال la forme avec l'article ra'as al-mal رأس المال la forme-"valise" (en arabe nat) رأسمال, variante graphique راسمال la forme-"valise" (en arabe nat) رأسمال, variante graphique راسمال N'incluant pas les pluriels avec variation du patron morphosyllabique ( pluriels par suffixation): N'incluant pas les pluriels avec variation du patron morphosyllabique ( pluriels par suffixation): رؤوس ( ال ) أموال – rés. (recherche propre) رؤوس ( ال ) أموال – rés. (recherche propre) رساميل – rés. (recherche propre) رساميل – rés. (recherche propre)

8 J. Dichy - JEI Veille stratégique avec approches sémantiques - Lyon Recherche d'information avec Google 2b qq résultats En français, il faut faire deux requêtes, l'une pour "capital", l'autre pour "capitaux" En français, il faut faire deux requêtes, l'une pour "capital", l'autre pour "capitaux" En anglais, on rencontre un problème d'ambiguïté: capital au sens de "capitale" et capital au sens de "capitaux" En anglais, on rencontre un problème d'ambiguïté: capital au sens de "capitale" et capital au sens de "capitaux" Dans les trois langues, il est difficile de rechercher sélectivement l'ouvrage de Karl Marx, Le Capital. Dans les trois langues, il est difficile de rechercher sélectivement l'ouvrage de Karl Marx, Le Capital. Mais ne pleurons pas! Nous sommes "contents" d'avoir ce que nous avons… Question: peut-on faire mieux sans perdre ce que nous avons? Mais ne pleurons pas! Nous sommes "contents" d'avoir ce que nous avons… Question: peut-on faire mieux sans perdre ce que nous avons?

9 J. Dichy - JEI Veille stratégique avec approches sémantiques - Lyon Recherche d'information avec Google 2c qq résultats Avec wizâra, وزارة "ministère", on a: Avec wizâra, وزارة "ministère", on a: pour (al-)wizâra (al-)xârijiyya, ( الـ ) وزارة ( الـ ) خارجية, "ministère des affaires étrangères" rés. pour (al-)wizâra (al-)xârijiyya, ( الـ ) وزارة ( الـ ) خارجية, "ministère des affaires étrangères" rés.

10 J. Dichy - JEI Veille stratégique avec approches sémantiques - Lyon Recherche d'information avec Google 2c qq résultats Avec wizâra, وزارة "ministère", on a: Avec wizâra, وزارة "ministère", on a: pour (al-)wizâra (al-)xârijiyya, ( الـ ) وزارة ( الـ ) خارجية, "ministère des affaires étrangères" rés. pour (al-)wizâra (al-)xârijiyya, ( الـ ) وزارة ( الـ ) خارجية, "ministère des affaires étrangères" rés. pour xârijiyya, rés. pour xârijiyya, rés.

11 J. Dichy - JEI Veille stratégique avec approches sémantiques - Lyon Recherche d'information avec Google 2c qq résultats Avec wizâra, وزارة "ministère", on a: Avec wizâra, وزارة "ministère", on a: pour (al-)wizâra (al-)xârijiyya, ( الـ ) وزارة ( الـ ) خارجية, "ministère des affaires étrangères" rés. pour (al-)wizâra (al-)xârijiyya, ( الـ ) وزارة ( الـ ) خارجية, "ministère des affaires étrangères" rés. pour xârijiyya, rés. pour xârijiyya, rés. pour wazîr (al-)xârijiyya, وزير ( الـ ) خارجية "ministre des affaires étrangères", résult. qui recoupent en grande partie les précédents en raison de phénomènes de cooccurrence; pour wazîr (al-)xârijiyya, وزير ( الـ ) خارجية "ministre des affaires étrangères", résult. qui recoupent en grande partie les précédents en raison de phénomènes de cooccurrence;

12 J. Dichy - JEI Veille stratégique avec approches sémantiques - Lyon Recherche d'information avec Google 2c qq résultats Avec wizâra, وزارة "ministère", on a: Avec wizâra, وزارة "ministère", on a: pour (al-)wizâra (al-)xârijiyya, ( الـ ) وزارة ( الـ ) خارجية, "ministère des affaires étrangères" rés. pour (al-)wizâra (al-)xârijiyya, ( الـ ) وزارة ( الـ ) خارجية, "ministère des affaires étrangères" rés. pour xârijiyya, rés. pour xârijiyya, rés. pour wazîr (al-)xârijiyya, وزير ( الـ ) خارجية "ministre des affaires étrangères", résult. qui recoupent en grande partie les précédents en raison de phénomènes de cooccurrence; pour wazîr (al-)xârijiyya, وزير ( الـ ) خارجية "ministre des affaires étrangères", résult. qui recoupent en grande partie les précédents en raison de phénomènes de cooccurrence; pour wazîr (al-)tarbiya, وزير ( الـ ) تربية "ministre de l'éducation" rés. (incluant wazîrat (al-)tarbiya, la seule ministre de l'éducation arabe, qui est palestinienne) pour wazîr (al-)tarbiya, وزير ( الـ ) تربية "ministre de l'éducation" rés. (incluant wazîrat (al-)tarbiya, la seule ministre de l'éducation arabe, qui est palestinienne)

13 J. Dichy - JEI Veille stratégique avec approches sémantiques - Lyon Recherche d'information avec Google 2c qq résultats Avec wizâra, وزارة "ministère", on a: Avec wizâra, وزارة "ministère", on a: pour (al-)wizâra (al-)xârijiyya, ( الـ ) وزارة ( الـ ) خارجية, "ministère des affaires étrangères" rés. pour (al-)wizâra (al-)xârijiyya, ( الـ ) وزارة ( الـ ) خارجية, "ministère des affaires étrangères" rés. pour xârijiyya, rés. pour xârijiyya, rés. pour wazîr (al-)xârijiyya, وزير ( الـ ) خارجية "ministre des affaires étrangères", résult. qui recoupent en grande partie les précédents en raison de phénomènes de cooccurrence; pour wazîr (al-)xârijiyya, وزير ( الـ ) خارجية "ministre des affaires étrangères", résult. qui recoupent en grande partie les précédents en raison de phénomènes de cooccurrence; pour wazîr (al-)tarbiya, وزير ( الـ ) تربية "ministre de l'éducation" rés. (incluant wazîrat (al-)tarbiya, la seule ministre de l'éducation arabe, qui est palestinienne) pour wazîr (al-)tarbiya, وزير ( الـ ) تربية "ministre de l'éducation" rés. (incluant wazîrat (al-)tarbiya, la seule ministre de l'éducation arabe, qui est palestinienne) pour wuzarâ' (al-)tarbiya, وزراء ( الـ ) تربية "ministres de l'éducation" (au plur.), de rés., ne recoupant les précédents qu'en cas de cooccurrence (elles sont fréquentes) pour wuzarâ' (al-)tarbiya, وزراء ( الـ ) تربية "ministres de l'éducation" (au plur.), de rés., ne recoupant les précédents qu'en cas de cooccurrence (elles sont fréquentes)

14 J. Dichy - JEI Veille stratégique avec approches sémantiques - Lyon Recherche d'information 2d : synthèse sur résultats avec Google Une meilleure prise en charges des mots composés qu'en mars-avril derniers Une meilleure prise en charges des mots composés qu'en mars-avril derniers Trop d'information, les requêtes n'étant que très difficilement contextualisabes (avec les "__") Trop d'information, les requêtes n'étant que très difficilement contextualisabes (avec les "__") Pas assez d'information: Pas assez d'information: les variations morphologiques ne sont pas prises en charge (en arabe comme en français) les variations morphologiques ne sont pas prises en charge (en arabe comme en français) les recoupements entre formes morphologiquement apparentées (par ex., sing.-plur.) restent aléatoires les recoupements entre formes morphologiquement apparentées (par ex., sing.-plur.) restent aléatoires …et le resteront, car les cooccurrences ne constituent pas une relation sémantique stable pour l'apprentissage automatique …et le resteront, car les cooccurrences ne constituent pas une relation sémantique stable pour l'apprentissage automatique

15 J. Dichy - JEI Veille stratégique avec approches sémantiques - Lyon Peut-on améliorer ces résultats? Oui, dans certaines conditions. Oui, dans certaines conditions. Deux cas généraux: Deux cas généraux: 1- Recherche du niveau du mot 1- Recherche du niveau du mot 2- Recherche contextualisée 2- Recherche contextualisée Dans les deux cas: quelle base de connaissances est nécessaire? Dans les deux cas: quelle base de connaissances est nécessaire? Dans cet exposé: cas 1 Dans cet exposé: cas 1 Dans l'exposé avec M. Anizi: cas 2 Dans l'exposé avec M. Anizi: cas 2

16 J. Dichy - JEI Veille stratégique avec approches sémantiques - Lyon Au niveau du mot De quoi peut avoir besoin? De quoi peut avoir besoin? des différentes formes morphologiques d'un même mot – en l'occurrence de noms des différentes formes morphologiques d'un même mot – en l'occurrence de noms pluriel par suffixation : našâ نشاط, "activité", plur. suffixé: našâât نشاطات pluriel par suffixation : našâ نشاط, "activité", plur. suffixé: našâât نشاطات plur. par modification du patron (ou "pluriel brisé") :'anaša أنشطة plur. par modification du patron (ou "pluriel brisé") :'anaša أنشطة NB. Les verbes ne font en principe pas l'objet d'une recherche d'information. NB. Les verbes ne font en principe pas l'objet d'une recherche d'information.

17 J. Dichy - JEI Veille stratégique avec approches sémantiques - Lyon Autres ex. du niveau du mot ummâ حمى, "fièvre" : résultats (0,28 secondes ) – pas de pluriel ummâ حمى, "fièvre" : résultats (0,28 secondes ) – pas de pluriel le plur. ummâyât حمايات : rés. (0,36 sec.) – c'est un plur. par suffixation, mais avec une transformation de ى â en ي y, ce qui supposerait soit une analyse par règles, soit la consultation d'une base de données lexicale. le plur. ummâyât حمايات : rés. (0,36 sec.) – c'est un plur. par suffixation, mais avec une transformation de ى â en ي y, ce qui supposerait soit une analyse par règles, soit la consultation d'une base de données lexicale. nala نخلة, "palmier-dattier" (mais aussi: nom de famille, par ex. du chanteur N'ûla Nakhlé) : rés. (0,41 secondes) - pas d'occurrence de nal نخل (collectif, dont nala نخلة est le singulatif) nala نخلة, "palmier-dattier" (mais aussi: nom de famille, par ex. du chanteur N'ûla Nakhlé) : rés. (0,41 secondes) - pas d'occurrence de nal نخل (collectif, dont nala نخلة est le singulatif) nal نخل : résultats nal نخل : résultats

18 J. Dichy - JEI Veille stratégique avec approches sémantiques - Lyon Problèmes de polysémie 1 Des bruits peuvent résulter du fait qu'un même mot peut avoir plusieurs sens, exemple: Des bruits peuvent résulter du fait qu'un même mot peut avoir plusieurs sens, exemple: Nom 1: c âmil عامل, plur. par suffixation: c âmilûn (fem. –ât) = "travailleur", "employé", "salarié" Nom 1: c âmil عامل, plur. par suffixation: c âmilûn (fem. –ât) = "travailleur", "employé", "salarié" Nom 2: -- plur. "interne" (par modification du patron): c awâmil عوامل = "facteur" (de qqch) Nom 2: -- plur. "interne" (par modification du patron): c awâmil عوامل = "facteur" (de qqch) Nom 3:-- plur. "interne" (par modification du patron): c ummâl عمال = "ouvrier" Nom 3:-- plur. "interne" (par modification du patron): c ummâl عمال = "ouvrier" Adjectif: = "actif", "en fonction", "effectif" Adjectif: = "actif", "en fonction", "effectif" Requête عامل : de résultats (0,23 secondes) : le bruit est très élevé, la requête ne pouvant porter que sur un seul sens Requête عامل : de résultats (0,23 secondes) : le bruit est très élevé, la requête ne pouvant porter que sur un seul sens

19 J. Dichy - JEI Veille stratégique avec approches sémantiques - Lyon Problèmes de polysémie 2 Des bruits peuvent résulter du fait qu'un même mot peut avoir plusieurs sens, exemple: Des bruits peuvent résulter du fait qu'un même mot peut avoir plusieurs sens, exemple: Nom 1: c âmil عامل, plur. par suffixation: c âmilûn (fem. –ât) = "travailleur", "employé", "salarié" Nom 1: c âmil عامل, plur. par suffixation: c âmilûn (fem. –ât) = "travailleur", "employé", "salarié" pour عاملون (ss occ. du sing. ni de عاملو ) pour عاملون (ss occ. du sing. ni de عاملو ) pour عاملو (ss occ. du sing) pour عاملو (ss occ. du sing) pour عاملات (ss occ. du sing) pour عاملات (ss occ. du sing) Nom 2: -- plur. "interne" (par modification du patron): c awâmil عوامل = "facteur" (de qqch) Nom 2: -- plur. "interne" (par modification du patron): c awâmil عوامل = "facteur" (de qqch) résultats (ss occurrence du sing.) résultats (ss occurrence du sing.) Nom 3:-- plur. "interne" (par modification du patron): c ummâl عمال = "ouvrier" Nom 3:-- plur. "interne" (par modification du patron): c ummâl عمال = "ouvrier" résultats (ss occurrence du sing.) résultats (ss occurrence du sing.) Adjectif: = "actif", "en fonction", "effectif" Adjectif: = "actif", "en fonction", "effectif"

20 J. Dichy - JEI Veille stratégique avec approches sémantiques - Lyon Recours au générateur de DIINAR Les lexiques générés à partir de DIINAR peuvent permettre – au niveau du mot – de sélectionner une requête pertinente, en passant par le pluriel. Les lexiques générés à partir de DIINAR peuvent permettre – au niveau du mot – de sélectionner une requête pertinente, en passant par le pluriel. agent lexical morphologique agent lexical morphologique

21 J. Dichy - JEI Veille stratégique avec approches sémantiques - Lyon Base de connaissances de cooccurrences au niveau des groupes de mots, des cooccurrences peuvent être repérées, ex.: au niveau des groupes de mots, des cooccurrences peuvent être repérées, ex.: عامل ( الـ ) بناء - ( الـ ) زراعة – c âmil (al-)binâ' – (al-)zirâ c a : "ouvrier en bâtiment", "agricole" عامل ( الـ ) بناء - ( الـ ) زراعة – c âmil (al-)binâ' – (al-)zirâ c a : "ouvrier en bâtiment", "agricole" عاملات ( الـ ) منازل – "travailleuses ménagères" عاملات ( الـ ) منازل – "travailleuses ménagères" agent lexical de cooccurrence agent lexical de cooccurrence

22 J. Dichy - JEI Veille stratégique avec approches sémantiques - Lyon Vers une interface d'interrogation 1 Saisie: c âmil عامل Saisie: c âmil عامل Consultation des lexiques générés de DIINAR: Consultation des lexiques générés de DIINAR: L'interface morpho-lexicale demande à l'utilisateur le sens qui l'intéresse: Nom 1: c âmil عامل, plur. par suffixation: c âmilûn (fem. –ât) = "travailleur", "employé", "salarié" Nom 1: c âmil عامل, plur. par suffixation: c âmilûn (fem. –ât) = "travailleur", "employé", "salarié" Nom 2: -- plur. "interne" (par modification du patron): c awâmil عوامل = "facteur" (de qqch) Nom 2: -- plur. "interne" (par modification du patron): c awâmil عوامل = "facteur" (de qqch) Nom 3:-- plur. "interne" (par modification du patron): c ummâl عمال = "ouvrier" Nom 3:-- plur. "interne" (par modification du patron): c ummâl عمال = "ouvrier" Adjectif: = "actif", "en fonction", "effectif" Adjectif: = "actif", "en fonction", "effectif"

23 J. Dichy - JEI Veille stratégique avec approches sémantiques - Lyon Vers une interface d'interrogation 2 Saisie: c âmil عامل Saisie: c âmil عامل Consultation des lexiques de cooccurrence (à construire!) Consultation des lexiques de cooccurrence (à construire!) L'interface de cooccurrence lexicale demande à l'utilisateur le contexte qui l'intéresse: عامل ( الـ ) بناء c âmil (al-)binâ', "ouvrier en bâtiment" عامل ( الـ ) بناء c âmil (al-)binâ', "ouvrier en bâtiment" عامل ( الـ ) زراعة c âmil (al-)zirâ c a, "ouvrier agricole" عامل ( الـ ) زراعة c âmil (al-)zirâ c a, "ouvrier agricole" عامل عضو c udw c âmil, "membre actif" ( c âmil = adjectif) عامل عضو c udw c âmil, "membre actif" ( c âmil = adjectif) En cas de recherche par les pluriels: collaboration des deux agents d'aide à la recherche ou à la fouille… En cas de recherche par les pluriels: collaboration des deux agents d'aide à la recherche ou à la fouille…

24 J. Dichy - JEI Veille stratégique avec approches sémantiques - Lyon Les ressources lexicales nécessaires Pour le niveau du mot: DIINAR (8 hommes/années) Pour le niveau du mot: DIINAR (8 hommes/années) Pour le niveau des collocations: beaucoup de travail à faire, avec une démarche prolongeant la théorie des spécificateurs implémentée dans DIINAR + un format lexical nouveau (travaux en cours) Pour le niveau des collocations: beaucoup de travail à faire, avec une démarche prolongeant la théorie des spécificateurs implémentée dans DIINAR + un format lexical nouveau (travaux en cours)

25 J. Dichy - JEI Veille stratégique avec approches sémantiques - Lyon Annexe : DIINAR.1

26 J. Dichy - JEI Veille stratégique avec approches sémantiques - Lyon DIINAR.1 (DIctionnaire INformatis é de l ARabe – version 1) en arabe : Maâlî – معالي « Mujam al-Arabiyya l- âlî » ( معجم العربية الآلي ) Joseph Dichy, Universit é Lumi è re-Lyon 2 et groupe de recherche SILAT (ICAR CNRS-Lyon 2) Joseph Dichy, Universit é Lumi è re-Lyon 2 et groupe de recherche SILAT (ICAR CNRS-Lyon 2) Abdelfattah Braham, Universit é de la Manouba et IRSIT Abdelfattah Braham, Universit é de la Manouba et IRSIT Salem Ghazali, Institut Sup é rieur des Langues de Tunis et IRSIT Salem Ghazali, Institut Sup é rieur des Langues de Tunis et IRSIT Mohamed Hassoun, ENSSIB (Villeurbanne) et groupe de recherche SILAT (commun à ICAR et à ELICO ) Mohamed Hassoun, ENSSIB (Villeurbanne) et groupe de recherche SILAT (commun à ICAR et à ELICO )

27 J. Dichy - JEI Veille stratégique avec approches sémantiques - Lyon La base de connaissances DIINAR.1 comprend entrées environ Entr é es verbales : env. Entr é es verbales : env. Entr é es d é verbales : env. Entr é es d é verbales : env. Entr é es nominales : env. (+ env pluriels 'bris é s') Entr é es nominales : env. (+ env pluriels 'bris é s') Noms propres : env. Noms propres : env. Mots-outils : 200 env. Mots-outils : 200 env. + l ensemble complet des enclitiques, proclitiques, pr é fixes et suffixes de l arabe + l ensemble complet des enclitiques, proclitiques, pr é fixes et suffixes de l arabe lexiques g é n é r é s: lexiques g é n é r é s: formes fl é chies (mots minimaux): 7,7 M formes fl é chies (mots minimaux): 7,7 M formes d é velopp é es (mots maximaux): 230 M formes d é velopp é es (mots maximaux): 230 M

28 J. Dichy - JEI Veille stratégique avec approches sémantiques - Lyon Les sp é cificateurs morphosyntaxiques inclus dans DIINAR.1 A chaque unité lexicale sont associés des spécificateurs morphosyntaxiques correspon-dant aux relations grammaire-lexique opérant au niveau du mot (Hassoun, 1987, Dichy, 1990). A chaque unité lexicale sont associés des spécificateurs morphosyntaxiques correspon-dant aux relations grammaire-lexique opérant au niveau du mot (Hassoun, 1987, Dichy, 1990). Les spécificateurs incluent également les liens dérivationnels entre formes morphologiquement reliées, telles que: Les spécificateurs incluent également les liens dérivationnels entre formes morphologiquement reliées, telles que: verbe déverbal ou, pour les noms, singulier pluriel brisé, etc. verbe déverbal ou, pour les noms, singulier pluriel brisé, etc. Les spécificateurs morphosyntaxiques appartien-nent à des inventaires finis et exhaustifs (Dichy, 1997). Les spécificateurs morphosyntaxiques appartien-nent à des inventaires finis et exhaustifs (Dichy, 1997).

29 J. Dichy - JEI Veille stratégique avec approches sémantiques - Lyon Principe de compatibilité connaissances-processus La base de donn é es DIINAR.1 est soumise à une contrainte m é thodologique fondamentale, celle de la compatibilit é : La base de donn é es DIINAR.1 est soumise à une contrainte m é thodologique fondamentale, celle de la compatibilit é : (1)avec les deux processus asym é triques de la g é n é ration et de l analyse de textes é crits (Dichy 1990 et 1993), et (1)avec les deux processus asym é triques de la g é n é ration et de l analyse de textes é crits (Dichy 1990 et 1993), et (2) avec les deux r é alisations en graphie vocalis é e ou non de l arabe (Hassoun 1987). (2) avec les deux r é alisations en graphie vocalis é e ou non de l arabe (Hassoun 1987). On dira que DIINAR.1 est con ç u en fonction du principe de compatibilit é connaissances-processus (Dichy 1997). On dira que DIINAR.1 est con ç u en fonction du principe de compatibilit é connaissances-processus (Dichy 1997).

30 J. Dichy - JEI Veille stratégique avec approches sémantiques - Lyon Génération ET analyse traitement exhaustif des données traitement exhaustif des données lexiques générés lexiques générés

31 J. Dichy - JEI Veille stratégique avec approches sémantiques - Lyon beaucoup de travail fait, et de travail à faire, mais en recherche d'information… Où sont les grands explorateurs à qui l'on devra l'oubli d'un continent ? Où sont les grands explorateurs à qui l'on devra l'oubli d'un continent ? Guillaume Apollinaire Guillaume Apollinaire

32 J. Dichy - JEI Veille stratégique avec approches sémantiques - Lyon Merci de votre attention أشكر لكم إصغاءكم


Télécharger ppt "Génération et analyse de mots arabes (GAMAR) : vers une plateforme denrichissement des requêtes pour la recherche dinformation ou la fouille de textes."

Présentations similaires


Annonces Google