Nymble: High-Performance Learning Name-finder 1 Plan Introduction Modèle –Modèle conceptuel –Caractéristiques de mots –Modèle formel –Rétrogradation de.

Slides:



Advertisements
Présentations similaires
Les Mots Interrogatifs
Advertisements

Material/Sources: Daniel Bardou, Julie Dugdale &
Détecteurs de fautes pour réseaux dynamiques P. Sens, L. Arantes, M. Bouillaguet Projet REGAL.
Sensibilisation à l’Algorithmique et structure de données
EMILE à l’ECOLE (2 ième année)
Apprendre à lire.
La classification périodique des éléments
COMMENT FONCTIONNE GOOGLE. QUE FAIT UN MOTEUR DE RECHERCHE? Contrairement à une base de données structurée dont on peut facilement extraire des informations,
Reconnaissance de la parole
Oral de la partie pratique Bac STG option Mercatique Session 2012
1 7 Langues niveaux débutant à avancé. 2 Allemand.
Le cahier de sciences Lieu des écrits pour soi
1 ARCHITECTURE DACCÈS la méthode générale modèle de données définitions module daccès / modules métiers construction des modèles les modules daccès, les.
Midi pédagogique Bienvenue à toutes et à tous!. Lévaluation formative Petite évaluation diagnostique pour débuter… Document 1.
L’INTERACTIVITÉ DANS L’ENSEIGNEMENT MAGISTRAL
Progression des apprentissages en écriture au primaire
IFRS 1 « 1re application des IFRS »
Principes de persistance dans les applications orienté objet
Xml/xslt : Extensible Stylesheet Language Transformation réalisé par: saÏd NAÏM.
Excel Introduction.
Vous allez assister à une démonstration de la base de données THEO Oubliez clavier et souris et laissez-vous guider.
Comment optimiser la visibilité de vos contenus sur les principaux moteurs de recherches ? Rédaction de contenus SEO friendly Publication on-line.
Projet d’écriture : écrire la suite d’une histoire
Analyse d’énoncés de problèmes additifs
Moteur de recherche d’information
Reconnaissance Vocale
Page Titre Ton nom La date Classe Mon nom Titre But Cest ton objectif, le point de lexpérience * nutilise jamais les mots « je », « on », « nous », etc.
Les 6 étapes de la recherche…
24 Novembre 2006 Laboratoire dInformatique de Paris 6 Moteur de recherche XML pour la plateforme Outilex.
Ali AICH, Sophie LORIETTE
Systeme Question-Reponse SQR
Français 41 Introduction – Pour communiquer tout en français! Quest-ce que tu as fait? Avec qui? Quand? Où? Comment former les questions.
La face cachée des systèmes de recherche Martin Bouchard, président Janvier 2003.
Les mécanismes du référencement naturel Comment être visible sur la toile et le rester? Tous avec Ben Ali.
Le verbe conjugué Comment repérer un verbe conjugué?
Soutenance de stage 16 Mai au 5 Août 2011
Le chiffrement symétrique
Presenter les résultats de la capitalisation
Apprentissage d'EFSA initiale du PAM Session 1.2. Vue d'ensemble: Scénario d'urgence.
Balzac, L’auberge rouge, 1831.
MARS 2012 F.MIRGALET M. POURCHET
La place de l'écrit dans l'enseignement des langues
Fast and Furious Decision Tree Induction
DEFINITION DES DONNEES : schéma conceptuel. Schéma conceptuel instructiondescription CREATE TABLEcréation d'une relation ALTER TABLEmodification de la.
Méthodes et outils de conception Introduction à la programmation Paramètre de retour Appel d’une fonction Portée des variables Définition Pourquoi les.
Réalisation d’une vinothèque personnelle
Le modèle économique des moteurs de recherche
Modélisation N-morphes en classification des textes de Wikipedia
Écrire au cycle 2.
Les mots interrogatifs et les adjectifs
Didactique(s) Introduction
20/06/2015propagation de signatures lexicales dans le graphe du Web 1 Propagation de signatures lexicales dans le graphe du Web M. Bouklit M. Lafourcade.
Mots clés et recherche documentaire
UML : DIAGRAMME DE CLASSES
Soustraire un nombre à un chiffre Mathématiques – Calcul mental  Entraînement n° 3.
Pierre Malenfant Technologie 9 École du Carrefour
Mathieu Martin Thomas Rovayaz Natacha Laborde Nathanaël Couret
Pour retenir l’essentiel d’un document écrit Tu dois suivre trois étapes : 1- Réaliser une lecture « survol » 2- Relever des informations précises 3- Rédiger.
Introduction Module 1.
Nicolas LEVEAU – MF2 n°1266 Stage initial initiateur Jour 2 (TP)
Disparités de résultats entre établissements : Mesure et éléments d’explication pour la politique éducative Alain Mingat Décembre 2013.
Ecole ______________________________________
System de recommandations
Structure (Plan) d’un mémoire
Validation d’une méthode d’analyse
la reconnaissance de visages
Now ask questions … Name ? Age ? Date of birth ? Job ? > What’ s his name ? > How old is he ? > When is his birthday ? > When was he born ? >
Evaluation.
La recherche documentaire & internet Sport, sciences et technologie Octobre 2009 Délimiter et définir son sujet Dictionnaires (Google, define:sport, sciences,
Compilation & Apprentissage dans les Réseaux de Contraintes Hervé Cros Directeurs :Frédéric Koriche Joël Quinqueton.
Transcription de la présentation:

Nymble: High-Performance Learning Name-finder 1 Plan Introduction Modèle –Modèle conceptuel –Caractéristiques de mots –Modèle formel –Rétrogradation de modèle Implémentation et résultats –Historique et implémentation actuelle –Mesure F –Scores obtenus –Impact de la taille du corpus d’apprentissage Conclusion

Nymble: High-Performance Learning Name-finder 2 Introduction (1) Permet de trouver dans un texte les catégories de noms suivantes (entités nommées : EN) : –Noms d’organisations –Noms de personnes –Noms de lieux –Heures –Dates –Pourcentages –Valeurs monétaires

Nymble: High-Performance Learning Name-finder 3 Introduction (2) Utilise une variante du modèle de Markov caché Actuellement utilisé en anglais et en espagnol Les noms recherchés sont des réponses aux questions : –Who (Qui) –Where (Où) –When (Quand) –How much (Combien)

Nymble: High-Performance Learning Name-finder 4 Introduction (3) Applications : –Délimiter les EN –Établir des relations entres les EN par des verbes Exemple : –Dans un moteur de recherche Internet, un utilisateur entre la requête : "When was Bill Gates born?" –La requête est transformée en : + born + (EN trouvée) (verbe) (EN à rechercher)

Nymble: High-Performance Learning Name-finder 5 Modèle (1) Modèle conceptuel Début-de-phrase Fin-de-phrase Personne Organisation Pas-un-nom (cinq autres classes de noms)

Nymble: High-Performance Learning Name-finder 6 Modèle (2) Caractéristiques de mots : Caractéristique de motExempleIntuition twoDigitNum90Année sur deux chiffres fourDigitNum1990Année sur quatre chiffres containsDigitAndAlphaA Code de produit containsDigitAndDash09-96Date containsDigitAndSlash11/9/89Date containsDigitAndComma23,000.00Montant containsDigitAndPeriod1.00Montant, pourcentage otherNum456789Autre nombre allCapsBBNOrganisation capPeriodM.Initiale de nom de personne firstWordpremier mot de la phrasePas d'information utile par une majuscule initCapEliseMot avec majuscule initiale lowerCasepouvoirMot sans majuscule other,Marque de ponctuation, tous les autres mots

Nymble: High-Performance Learning Name-finder 7 Modèle (3) Modèle formel Classe de noms : P(CN | CN -1, m -1 ) Premier mot dans la classe : P( premier | CN, CN -1 ) Autres mots dans la classe : P( | -1, CN) Dernier mot de la classe : P( | final, CN) m -1 = +fin+ si CN -1 = Début-de-phrase, m -1 = dernier mot observé sinon. avec

Nymble: High-Performance Learning Name-finder 8 Modèle (4) Rétrogradation de modèle Bigrammes pour la classe de noms Bigrammes pour le premier mot Bigrammes pour les autres mots P(CN | CN -1, m -1 ) P(CN | CN -1 ) P(CN) P( premier | CN, CN -1 ) P( |, CN) P( | CN) P(m | CN). P(c | CN) P( | -1, CN) P( | CN) P(m | CN). P(c | CN) 1 nombre de classes de mots 1 nombre de caractéristiques 1 1 |V|. 1 nombre de caractéristiques 1 1 |V|

Nymble: High-Performance Learning Name-finder 9 Implémentation et résultats (1) Historique –Peu de caractéristiques au départ –Ajout progressif de caractéristiques Implémentation actuelle –Cycle rapide de développement

Nymble: High-Performance Learning Name-finder 10 Implémentation et résultats (2) Mesure F Précision = nombre de réponses correctes nombre de réponses nombre de réponses correctes nombre de réponses correctes de la clé Rappel = (ß² + 1)  Rappel  Précision (ß²  Rappel) + Précision Mesure F =

Nymble: High-Performance Learning Name-finder 11 Implémentation et résultats (3) Scores obtenus CasseLangageMeilleur score réalisé Nymble MélangeAnglais9693 MajusculeAnglais8991 MélangeEspagnol9390

Nymble: High-Performance Learning Name-finder 12 Implémentation et résultats (4) Impact de la taille du corpus d'apprentissage sur les r é sultats En anglais En espagnol

Nymble: High-Performance Learning Name-finder 13 Conclusion (1) Améliorations possibles –Listes de noms propres connus – (3,4,…)-grammes au lieu de 2-grammes –Algorithme de reconnaissance des alias (ex : IBM) Performance de haut niveau –Techniques connues –Modèle innovant

Nymble: High-Performance Learning Name-finder 14 Références Conclusion (2) Remerciements