1. Définitions et approches importantes

Slides:



Advertisements
Présentations similaires
APPRENDRE A LIRE Présentation par : Marie-Christine Ratez CPC Chauny Roselyne Cail CPC Guise.
Advertisements

Algorithmes et structures de données avancées Cours 7
Algèbre de composants : une approche fonctionnelle à la sémantique de documents Bart Lamiroy LORIA/INPL QGar - École des Mines de Nancy.
Apprentissage relationnel Apprentissage Data Mining ILP.
Olivier Kraif, Agnès Tutin LIDILEM
Découverte automatique de mappings fondée sur les requêtes dans un environnement P2P Présenté Par: Lyes LIMAM Encadré Par: Mohand-Said Hacid.
Nicolas Zlatoff - Stage de DEA Sous la direction de Bruno Tellez
Understanding, building and using ontologies. Understanding Ontologie : la définition des concepts utilisés dans un langage donné Première approche (Gruber)
Exercices Recherche dinformation. Méthodo ? Connaissance des ressources Prise dindices (mots clès, type de doc, langue,...) Connaître les opérateurs /
1 Premier bilan de l utilisation de LinguaStream pour le rep é rage de la coh é sion nom-verbe Yu-Ting HUANG UE TAL Le 10/01/2006.
Approches formelles en syntaxe et sémantique Alain Lecomte UMR 7023 Structures Formelles de la Langue.
Apprentissage continué de la lecture au Cycle 2
Théories Economiques de l’Innovation
LI.A ça ressemble à ça… des fois…. Ou pas… Rappels et définition de lIA – Lidée quon sen fait – Jusquoù on va aujourdhui / dans le futur? – Petit Etat.
Modèle affine Montage préparé par : André Ross
Université de Franche-Comté, France
Sélection automatique d’index et de vues matérialisées
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
ARC RAPSODIS Reconnaissance Automatique de la Parole Suivie et Orientée par Des Informations Syntaxico-Sémantiques PAROLE – METISS – TALARIS – TEXMEX –
1 ARCHITECTURE DACCÈS la méthode générale modèle de données définitions module daccès / modules métiers construction des modèles les modules daccès, les.
mardi 16 octobre Table / Groupe / Couleur Classeur Absences?
OCaml - Les listes L3 MI.
Linterlangue Frandi101 Mardi 20 février Plan Lecture du texte délève Linterlangue Examen de textes délèves Note: cette présentation se base sur.
Recherche d’un même objet / scène
La prévention des difficultés d’écriture
IFT313 Introduction aux langages formels
Méthode des k plus proches voisins
Bases de données lexicales
VOC 1 CE2 Je sais utiliser des mots de la vie quotidienne.
LES FICHES POUR METTRE EN OEUVRE DES DISPOSITIFS D'AIDE ET DE SOUTIEN
OIL & UPML DREVET - HUMBERT Introduction OIL : un langage de description dontologies UPML : un langage de description de systèmes à base.
Structures de données IFT-2000
Mémoires associatives
Chapitre 7 Réseau ART.
Courbes de Bézier.
Algorithmes d ’approximation
Apprentissage semi-supervisé
© Petko ValtchevUniversité de Montréal Janvier IFT 2251 Génie Logiciel Notions de Base Hiver 2002 Petko Valtchev.
Hier c’était lundi vingt-huit octobre
Mise en oeuvre des MMCs L'utilisation des MMCs en reconnaissance des formes s'effectue en trois étapes : définition de la topologie de la chaîne de Markov,
Alessandro de Luna Almeida
Les styles d’apprentissage
Vers une génération automatique du mapping de sources biomédicales
1 er décembre 2005IFT6010 – Jean-Yves Guyomarc’h Colorless green ideas…. Une « guerre de religion »
inspection de l'éducation nationale circonscription le Vésinet
PLAN: 1. Présentation générale de la recherche 2. Cadre théorique
Plan cours parole 29 Octobre 2003  1. Applications et démos (appli) voir feuilles distribués + démos  2. Fondements théoriques (theorie)  2.1 voir cours.
FRE 2645 Workshop MADONNE : 27 Mai 2004 Système contextuel de reconnaissance structurelle de symboles, basé sur une méthodologie de construction d'objets.
Approches Formelles en Systèmes d'information
Bases de Données Temporelles
Le langage Racket (Lisp)
Algorithmes pour le web “A Unified Approach to Personalization Based on Probabilistic Latent Semantic Models of Web Usage and Content”
Improving large-scale search engines with semantic annotations Damaris Fuentes-Lorenzo, Norberto Fernández, Jesús A. Fisteus, Luis Sánchez.
Segmentation morphologique à partir de corpus Delphine Bernhard Laboratoire TIMC-IMAG, Grenoble
Mustapha Hamidou Vendredi 20 août Stage Contour Matching.
Techniques documentaires et veille stratégique Anne Pajard, avril 2008
1 Méthode de “Fast Marching” générique pour “Shape From Shading” E. Prados & S. Soatto RFIA 2006 janvier 2006, Tours.
Modélisation N-morphes en classification des textes de Wikipedia
ÉCOLE POLYTECHNIQUE CONCOURS 2010 Workshop NSERC scholarship application 23 avril 2015 École Polytechnique.
Acquisition and Learning A7633 C. Tardieu. Some definitions Mothertongue Native tongue Family tongue First language/Second language Source language/target.
Questions to consider: How are French nouns different from nouns in English? What is the difference between saying, “I have a pen.” and saying, “I have.
Thibault ROY & Olivier SAGIT Exposé du mercredi 17 décembre 2003 Apprentissage Interactif Apprentissage avec SpamAssassin UFR de Sciences Département d’Informatique.
Récupération par projection de ressources langagières Par Youssef BOUOULID IDRISSI 10 Avril 2003 Cours IFT6010 Université de Montréal Département d’informatique.
Chapitre 2.2 Interro 25 points jeudi 17 novembre.
Le Traitement Automatique des Langues (TAL)
Consolidation de grands réseaux lexicaux
Conférences (CR) PACLING'03 Pacific Association for Computational LINGuistics 22 au 25 août 2003 Halifax, côte Est Canada RANLP Recent Advances in Natural.
Resource allocation: what can we learn from HPC? 20 janvier 2011 Vincent Breton Crédit: Catherine Le Louarn.
Transcription de la présentation:

1. Définitions et approches importantes 2. Le projet MorTAL 3. Apprendre la dérivation allemande(?) Algorithmes pour l’apprentissage d’une morphologie dérivationnelle et leur adéquation à la morphologie allemande Algorithmes pour l’apprentissage d’une morphologie dérivationelle (allemande) Sina Zarriess sina-z@gmx.net

Existe-t-il une relation morphologique entre deux lexèmes? 1. Définitions et approches importantes 2. Le projet MorTAL 3. Apprendre la dérivation allemande(?) 1.1. Pourquoi apprendre une morphologie? 1.2. La structure analogique du lexique 1.3. Sommaire de quelques travaux Problèmes de l’exploitation de connaissances dérivationnelles (selon Jacquemin 1997): Existe-t-il une relation morphologique entre deux lexèmes? Cette relation est-elle « pertinente » ? (ex. corollaire - corolle) Quelle est la base dérivationnelle d’un lexème polysémique? (ex. occasion – occasionnel ) Comment traiter des procédés morphologiques rares / dépendants d’un domaine? Algorithmes pour l’apprentissage d’une morphologie dérivationelle (allemande) Sina Zarriess sina-z@gmx.net

applications en morphologie 1. Définitions et approches importantes 2. Le projet MorTAL 3. Apprendre la dérivation allemande(?) 1.1. Pourquoi apprendre une morphologie? 1.2. La structure analogique du lexique 1.3. Sommaire de quelques travaux segmentation de mots identification de morphèmes appariement de mots morphologiquement liés génération de mots applications en morphologie apprentissage automatique implémentation d’une analyse manuelle Algorithmes pour l’apprentissage d’une morphologie dérivationelle (allemande) Sina Zarriess sina-z@gmx.net

accessibilité, voluminosité de données 1. Définitions et approches importantes 2. Le projet MorTAL 3. Apprendre la dérivation allemande(?) 1.1. Pourquoi apprendre une morphologie? 1.2. La structure analogique du lexique 1.3. Sommaire de quelques travaux arguments pour l’acquisition automatique de connaissances morphologiques à partir de corpus, dictionnaires … accessibilité, voluminosité de données réduction considérable de l’effort manuel indépendance d’une langue particulière application de la méthode à d’autres tâches (Hathout 2005) Algorithmes pour l’apprentissage d’une morphologie dérivationelle (allemande) Sina Zarriess sina-z@gmx.net

structure analogique du lexique 1. Définitions et approches importantes 2. Le projet MorTAL 3. Apprendre la dérivation allemande(?) 1.1. Pourquoi apprendre une morphologie? 1.2. La structure analogique du lexique 1.3. Sommaire de quelques travaux relation morphologique : partage de son et de sens structure analogique du lexique aimer googler aimer googler j’aime je google aimable googlable (Hathout 2005) Algorithmes pour l’apprentissage d’une morphologie dérivationelle (allemande) Sina Zarriess sina-z@gmx.net

schéma : A est à B ce que C est à D 1. Définitions et approches importantes 2. Le projet MorTAL 3. Apprendre la dérivation allemande(?) 1.1. Pourquoi apprendre une morphologie? 1.2. La structure analogique du lexique 1.3. Sommaire de quelques travaux L’analogie dans d’autres domaines scientifiques Exemple: AI, métaphore = analogie « un atome est un système solaire » transfert de propriétés d’un domaine à un autre une modification à la fois soleil noyau planète électron schéma : A est à B ce que C est à D (Lepage 1998) Algorithmes pour l’apprentissage d’une morphologie dérivationelle (allemande) Sina Zarriess sina-z@gmx.net

Établir une relation morphologique 1. Définitions et approches importantes 2. Le projet MorTAL 3. Apprendre la dérivation allemande(?) 1.1. Pourquoi apprendre une morphologie? 1.2. La structure analogique du lexique 1.3. Sommaire de quelques travaux Établir une relation morphologique Établir une relation graphémique Établir une relation sémantique trouver la sous-chaîne maximale de deux chaînes (ex. Jacquemin 1997) Algorithmes pour l’apprentissage d’une morphologie dérivationelle (allemande) Sina Zarriess sina-z@gmx.net

{ p = max ( min ( |w| - k , |w’| - k) , 1 ) trunc (w,p) = trunc (w’,p) 1. Définitions et approches importantes 2. Le projet MorTAL 3. Apprendre la dérivation allemande(?) 1.1. Pourquoi apprendre une morphologie? 1.2. La structure analogique du lexique 1.3. Sommaire de quelques travaux Definition Word-k-similarity: Two words w and w’ are said to be k-similar if and only if the following equation is true: { p = max ( min ( |w| - k , |w’| - k) , 1 ) trunc (w,p) = trunc (w’,p) where trunc(w,i) is composed of the first i characters of w and where |w| is the length of w. Definition Maximal Common String: Let k0 be the minimal value of k, such that two words w and w’ are k-similar. The corresponding truncation is called Maximal Common String and the corresponding suffixes are called Minimal Truncation Suffixes. (Jacquemin 1997) Algorithmes pour l’apprentissage d’une morphologie dérivationelle (allemande) Sina Zarriess sina-z@gmx.net

Établir une relation morphologique 1. Définitions et approches importantes 2. Le projet MorTAL 3. Apprendre la dérivation allemande(?) 1.1. Pourquoi apprendre une morphologie? 1.2. La structure analogique du lexique 1.3. Sommaire de quelques travaux Établir une relation morphologique Établir une relation graphémique Établir une relation sémantique trouver la sous-chaîne maximale de deux chaînes (Jacquemin 1997) extraire des affixes d’un trie (Schone & Jurafsky 2000) utiliser un lexique existant (Yarowsky, Wicentowsky 2000) Algorithmes pour l’apprentissage d’une morphologie dérivationelle (allemande) Sina Zarriess sina-z@gmx.net

Établir une relation morphologique 1. Définitions et approches importantes 2. Le projet MorTAL 3. Apprendre la dérivation allemande(?) 1.1. Pourquoi apprendre une morphologie? 1.2. La structure analogique du lexique 1.3. Sommaire de quelques travaux Établir une relation morphologique Établir une relation graphémique Établir une relation sémantique trouver la sous-chaîne maximale de deux chaînes (Jacquemin 1997) extraire des affixes d’un trie (Schone & Jurafsky 2000) utiliser un lexique existant (Yarowsky, Wicentowsky 2000) calcul statistique; critère de la cooccurrence ex. LSA (latent semantic analysis) (la plupart des approches) Algorithmes pour l’apprentissage d’une morphologie dérivationelle (allemande) Sina Zarriess sina-z@gmx.net

- Pas de calcul statistique 1. Définitions et approches importantes 2. Le projet MorTAL 3. Apprendre la dérivation allemande(?) 2.1. Méthode générale 2.2. Établir l’analogie graphémique 2.3. Établir l’analogie sémantique But - Constitution semi-automatique d’une base de données dérivationnelles Méthode - Acquisition à partir de lexiques et dictionnaires de synonymes existants - Pas de calcul statistique - Basé sur la structure analogique du lexique analogie morphologique analogie graphémique analogie sémantique (Hathout 2003, 2005) Algorithmes pour l’apprentissage d’une morphologie dérivationelle (allemande) Sina Zarriess sina-z@gmx.net

Extraction de deux ensembles de lemmes 1. Définitions et approches importantes 2. Le projet MorTAL 3. Apprendre la dérivation allemande(?) 2.1. Méthode générale 2.2. Établir l’analogie graphémique 2.3. Établir l’analogie sémantique Extraction de deux ensembles de lemmes 2 Apprentissage de schémas de suffixation Chaque couple X:Y définit un schéma de suffixation X’:Y’ tel que X = Z x X’ et Y = Z x Y’ où Z est le préfixe graphémique maximal commun à X et Y . (Hathout 2005 ) Construction d’un graphe qui représente des relations orthographiques activ- :agit- -er :-able activer activable agitable agiter contrôlable agitable agiter contrôler gonfler gonflable activer activable Algorithmes pour l’apprentissage d’une morphologie dérivationelle (allemande) Sina Zarriess sina-z@gmx.net

Analogie sémantique Analogie synonymique 1. Définitions et approches importantes 2. Le projet MorTAL 3. Apprendre la dérivation allemande(?) 2.1. Méthode générale 2.2. Établir l’analogie graphémique 2.3. Établir l’analogie sémantique Analogie sémantique Analogie synonymique former des quadruplets morphosynonymiques X1:X2 :: Y1:Y2 tels que X1:X2 et Y1:Y2 sont orthographiquement apparentés X1 est un synonyme de Y1 et X2 est un synonyme de Y2 décorer embellir décoration embellissement (Hathout 2003, 2005) Algorithmes pour l’apprentissage d’une morphologie dérivationelle (allemande) Sina Zarriess sina-z@gmx.net

1 Extraction du lexique (du dictionnaire de synonymes) 1. Définitions et approches importantes 2. Le projet MorTAL 3. Apprendre la dérivation allemande(?) 2.1. Méthode générale 2.2. Établir l’analogie graphémique 2.3. Établir l’analogie sémantique 1 Extraction du lexique (du dictionnaire de synonymes) 2 Construction d’un graphe qui représente les relations de synonymie 3 Exploration simultanée du graphe graphémique et sémantique contrôlable agitable agiter contrôler gonfler gonflable activer activable Algorithmes pour l’apprentissage d’une morphologie dérivationelle (allemande) Sina Zarriess sina-z@gmx.net

Hypothèse sous-jacente omniprésente: (préfixe x) radical (x suffixe) 1. Définitions et approches importantes 2. Le projet MorTAL 3. Apprendre la dérivation allemande(?) 3.1. Phénomènes d’allomorphie 3.2. Orientations des recherches allemandes 3.3. Idées pour manier le non-concaténatif Hypothèse sous-jacente omniprésente: (préfixe x) radical (x suffixe) morphologie purement concaténative mais … Algorithmes pour l’apprentissage d’une morphologie dérivationelle (allemande) Sina Zarriess sina-z@gmx.net

Schlag:Schläger,Sturm:stürmisch,spotten:spötteln, Rauch:räuchern 1. Définitions et approches importantes 2. Le projet MorTAL 3. Apprendre la dérivation allemande (?) 3.1. Phénomènes d’allomorphie 3.2. Orientations des recherches allemandes 3.3. Idées pour manier le non-concaténatif suffixation Umlaut Schlag:Schläger,Sturm:stürmisch,spotten:spötteln, Rauch:räuchern Ablaut reiten:Ritter,singen:Sänger Élision de /ə/ Freude:freudlos, sammeln:Sammler, Teufel:teuflisch Fugenelement Mann:Mannestum, Morgen: morgendlich, Katze:katzenhaft, changements voc. avec suffixes étrangers Qualität:qualitativ, Nomen:nominal, Tabelle:tabellarisch pluriel = base de dérivation Christ:Christentum, Umstand:umständehalber préfixation opérations simultanées Volk:bevölkern, Stalin:entstalinisieren, Freund:anfreunden, Algorithmes pour l’apprentissage d’une morphologie dérivationelle (allemande) Sina Zarriess sina-z@gmx.net

+ composition productive 1. Définitions et approches importantes 2. Le projet MorTAL 3. Apprendre la dérivation allemande(?) 3.1. Phénomènes d’allomorphie 3.2. Orientations des recherches allemandes 3.3. Idées pour manier le non-concaténatif + composition productive N0 N0 A0 A0 N0 V0 N0 A0 Aaff Vaff V0 Aaff Naff V0 Naff Gesund heit s ver träg lich keit s prüf ung Algorithmes pour l’apprentissage d’une morphologie dérivationelle (allemande) Sina Zarriess sina-z@gmx.net

ressources et analyseurs disponibles: http//:www.canoo.net 1. Définitions et approches importantes 2. Le projet MorTAL 3. Apprendre la dérivation allemande(?) 3.1. Phénomènes d’allomorphie 3.2. Orientations des recherches allemandes 3.3. Idées pour manier le non-concaténatif perspective de l’analyse morphologique ou la représentation efficace du lexique est souvent privilégié ressources et analyseurs disponibles: http//:www.canoo.net http//:www.lingsoft.fi/cgi-bin/gertwol TAGH (www.dwds.de) Morphy, Morphix, Morph … Algorithmes pour l’apprentissage d’une morphologie dérivationelle (allemande) Sina Zarriess sina-z@gmx.net

(Oflazer 1996) ed(X[i+ 1],Y[j+ 1]) = ed(X[i],Y[j]) if xi+1 = yj+1 1. Définitions et approches importantes 2. Le projet MorTAL 3. Apprendre la dérivation allemande(?) 3.1. Phénomènes d’allomorphie 3.2. Orientations des recherches allemandes 3.3. Idées pour manier le non-concaténatif ed(X[i+ 1],Y[j+ 1]) = ed(X[i],Y[j]) if xi+1 = yj+1 (last characters are the same) = 1 + min{ed(X[i - 1], Y[j - 1]), ed(X[i + 1], Y[j]), ed(X[i], Y[j+ 1])} if both xi = yj and xi = yj (last characters are transposed) = 1 + min{ed(X[i], Y[j]), otherwise ed(X[i], Y[j + 1])} ed(X[0],Y[j]) = j 0 < j < n ed(X[i],Y[0]) = i 0 < i < m ed(X[-1], Y[j]) = ed(X[i], Y[-1])= max(m, n) (boundary definitions) (Oflazer 1996) Algorithmes pour l’apprentissage d’une morphologie dérivationelle (allemande) Sina Zarriess sina-z@gmx.net

Problème: Induction de règles? 1. Définitions et approches importantes 2. Le projet MorTAL 3. Apprendre la dérivation allemande (?) 3.1. Phénomènes d’allomorphie 3.2. Orientations des recherches allemandes 3.3. Idées pour manier le non-concaténatif 1. Baroni, Matiasek, Trost: « Unsupervised Discovery of morphologically related words based on orthographic and semantic similarity » calcul de la similarité orthographique distance d’édition relative ex. sim(woman,women) = 0,8 calcul de la similarité sémantique calcul statistique de la cooccurrence Problème: Induction de règles? Algorithmes pour l’apprentissage d’une morphologie dérivationelle (allemande) Sina Zarriess sina-z@gmx.net

1. Définitions et approches importantes 2. Le projet MorTAL 3. Apprendre la dérivation allemande(?) 3.1. Phénomènes d’allomorphie 3.2. Orientations des recherches allemandes 3.3. Idées pour manier le non-concaténatif 2. Neuvel,Fulop: « Unsupervised Learning of Morphology Without Morphemes » vue relationelle de la morphologie: « 2 mots sont en relation morphologique si l’on peut trouver toutes les différences qui existent entre eux dans un moins 1 autre paire de mots » (4) Differences First word Second word X iveV X ptionNs Similarities First Second rece### rece##### conce### conce##### (5) Differences First word Second word X iveV X ptionNs Similarities First Second *##ce### *##ce##### Algorithmes pour l’apprentissage d’une morphologie dérivationelle (allemande) Sina Zarriess sina-z@gmx.net

Bibliographie Sina Zarriess sina-z@gmx.net 1. Définitions et approches importantes 2. Le projet MorTAL 3. Apprendre la dérivation allemande(?) Bibliographie Baroni M., Matiasek J., Trost H.: « Unsupervised discovery of morphologically related words based on orthographic and semantic similarity ». Technical Report, Österreichisches Forschungsinstitut für Artificial Intelligence, Wien, TR-2002-21, 2002 Geyken, Andreas; Hanneforth, Thomas (2005).  « TAGH: A Complete Morphology for German based on Weighted Finite State Automata. » In: Proceedings of FSMNLP 2005. Lecture Notes in Artificial Intelligence, Springer. Hathout, Nabil (2003) : « L’analogie, un moyen de croiser les contraintes et les paradigmes. Acquisition de connaissances à partir de dictionnaires de synonymes ». Revue d’Intelligence Articielle, 17(5-6), p. 923–934. Hathout, Nabil (2005): « Exploiter la structure analogique du lexique construit: une approche computationelle ». Cahiers de Lexicologie 87, 2005-2, p. 1-24. Jacquemin, Christian (1997) : « Guessing Morphology from Terms and Corpora ». Proceedings of 20th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR’97), p. 156–167. ACM, Philadelphia, PA. Lepage, Yves (1998) : « Solving analogies on words : an algorithm ». In Proceedings of the of the 36th Annual Meeting of the Association for Computational Linguistics and 17th International Conference on Computational Linguistics, vol. 2, p. 728–735. Montréal, Canada. Neuvel, Sylvain et Fulop, Sean A. (2002) : « Unsupervised Learning of Morphology Without Morphemes ». In Proceedings of the Workshop on Morphological and Phonological Learning 2002. ACL Publications, Philadelphia. Schone, Patrick; Jurafsky, Daniel (2000): “Knowledge-Free Induction Of Morphology Using Latent Semantic Analysis”, in: Proceedings of CoNLL-2000 and LLL-2000, p. 67-72, Lisbon, Portugal. Oflazer, Kemal (1996): « Error-tolerant finite-state Recognition with Applications to Morphological Analysis and Spelling Correction  ». Computational Linguistics, Vol. 22, Issue 1, p. 73-89. Zweigenbaum, Pierre; Grabar Natalie (2003): « Learning Derived Words from Medical Corpora ». AIME 2003: 189-198, 2002. Algorithmes pour l’apprentissage d’une morphologie dérivationelle (allemande) Sina Zarriess sina-z@gmx.net