TEXT MINING Fouille de textes

Slides:



Advertisements
Présentations similaires
Qu’est-ce que LingPro ? LingPro est la branche ingénierie linguistique de i-KM La collaboration i-KM / LingPro est le résultat d’un partenariat sous forme.
Advertisements

Les présentateurs doivent souvent transmettre des informations techniques à des auditeurs qui connaissent moins bien le sujet et le vocabulaire spécifique.
Sandrine Peraldi (ISIT) Jean-Philippe KOTOWICZ (INSA Rouen)
Algèbre de composants : une approche fonctionnelle à la sémantique de documents Bart Lamiroy LORIA/INPL QGar - École des Mines de Nancy.
De linformation à la gestion des connaissances Introduction J. LINK-PEZET Dess SIAD Janvier 2001.
Marine Campedel mars 2005 INDEXATION des IMAGES Marine Campedel mars 2005.
Thésaurus juridique, catégorisation de textes
Comment choisir une solution technologique de veille sur le marché ?
Extraction des connaissances dans les bases de données
INTRODUCTION Grande quantité de données
2002 Compétitif XMiner : Plate-forme de structuration texte libre multi-approches par balisage XML de Tags Actifs Lobjectif du projet est de développer.
Navigation Interactive dans les documents Brigitte Grau et Jean-Paul Sansonnet J.P. Fournier, N. Hernandez, M. Hurault-Plantet, J-C. Martin, G. Pitel,
Indexation textuelle : Systèmes de recherche d’informations
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
Estella Annoni, Franck Ravat, Olivier Teste, Gilles Zurfluh
Data Mining: Définition
Laboratoire Sciences Pour l’Environnement
ASA Algerian scientific Abstracts المستخلصات العلمية الجزائرية
INTELLIGENCE COLLECTIVE : RENCONTRES 2006Nîmes mai 2006 CENTRE DE RECHERCHE LGI2P 1- Doctorante Ecole des mines de Paris, 2- Maitre de Conférences.
Gaselys Trading Confirmation
B2i Lycée Circulaire BO n°31 du 29/08/2013.
Introduction à KB Crawl
Annotations sémantiques pour le domaine des biopuces
Services fournis par le SI et technologies associées
Développement d’un réseau social professionnel
L’atlas de la cartographie de l’information
Moteur de RechercheMoteur de recherche "from scratch"
WikiViz La visualisation dun réseau sémantique Travail de diplôme 2005 Urs Richle / 31 it.
Date / references Systèmes Terre et Interarmées Projet OUTILEX Rapport détude final Octobre 2006.
Cartographie des connaissances biologiques
Informatique Décisionnel
École de bibliothéconomie et des sciences de linformation 1 Gestion de linformation électronique (GIE) Maîtrise en sciences de linformation EBSI Université.
IFT6255 – Recherche d’information Jian-Yun Nie
École de bibliothéconomie et des sciences de l’information 1 Gestion de l’information électronique (GIE) Maîtrise en sciences de l’information EBSI Université.
Activités développées RTP 12 : Information et connaissance : "découvrir et résumer" Actions spécifiques et équipes-projets associées Objectifs thématiques.
Présenté par : Attia Hamza Merzouk Abdelkrim 2003/2004
UFD 62. EC2 : cours n° 3 Gestion Electronique des Documents Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de recherche KIWI – LORIA
Balzac, L’auberge rouge, 1831.
Recherche sur Internet Présentation destinées au CAID tiré pour l’essentiel de
Dominique LAURENT Patrick SEGUELA
Recherche d’information
Thibault ROY Université de Caen / Basse-Normandie Laboratoire GREYC – Equipe ISLanD Apport d’outils d’informatique documentaire à l’analyse de forums de.
Observus - ENEIDE 28 novembre Pertimm : la société  Pertimm SAS : Fondée en 1997 en France, Présente en France et aux Etats-Unis, Start-up innovante.
Vers une intégration plus poussée de la recherche Web avec les Systèmes d’Information Géographiques Adapté de «Toward Tighter Integration of Web Search.
Équipe ISLanD Laboratoire GREYC Université de Caen / Basse-Normandie Des outils pour chercher sur la Toile Fête de la Science 2005.
Services en Text Mining. Introduction : Qui est Mentis ? Mentis a été fondée en 2005 comme une société spin-off du Laboratoire d'I ntelligence Artificielle.
Se repérer et organiser sa veille dans la recherche en éducation Module 2 « Maîtriser l’accès aux ressources scientifiques en éducation » Introduction.
Stage à Ontomantics Master Pro TILDE
Le Traitement Automatique des Langues (TAL)
Initiation à des recherches dans le domaine de l’enseignement
Classification automatique des messages électroniques
Pierre Malenfant Technologie 9 École du Carrefour
Apéro Techno Romain Maragou - Aliou Sow Web sémantique.
Système d’Informations Commerciales
STRATÉGIE DE RECHERCHE DOCUMENTAIRE Trouver des articles de périodiques Adèle Flannery, Cynthia Lisée et Christine Médaille, bibliothécaires.
L’information commerciale, ressource stratégique.
PLAN DE L’EXPOSÉ 1) Introduction 2) Méthodologie
R ETOURS SUR LE PROJET DISTIL ET PERSPECTIVES 2011 Sylvie Ranwez Gérard Dray.
Introduction à la Recherche
LES AGENTS INTELLIGENTS
IFT 703 Informatique cognitive ACT-R Modèle symbolique et perceptuel
STRATÉGIE DE RECHERCHE DOCUMENTAIRE Trouver des articles de périodiques Adèle Flannery, Cynthia Lisée et Christine Médaille, bibliothécaires.
1 Chercher et trouver sa documentation sur Internet L1 DC Expression et communication Intervention du Par Sylvie Doyon, documentaliste.
RÉNOVATION BTS Comptabilité et Gestion 2015 Atelier situations professionnelles & PGI Autour du P2 et du cas FRANCOBOIS P. PARISOT G. DUBAIL.
1 Le dispositif d’évaluation Présentation de XiTi Mise à disposition d’un outil d’analyse statistique : XiTi  Accessible en ligne pour le chef d’EPLE.
KOSMOS 1 Outils transversaux Module 7 1.L’annuaire 2.La recherche d’informations 3.La réservation de ressources.
1 4th International Conference on Arabic Language Processing, May 2–3, 2012, Rabat, Morocco Titre Mohamed El Amine ABDERRAHIM Mohamed Alaedine ABDERRAHIM.
Séminaire IRIT-UT1 « Les nouveaux de 2010 » Novembre 2010 Les entrepôts de données et des documents = des entrepôts de documents ? Ronan Tournier
Compétences informationnelles Choisir ses sources Connaître les outils de repérage.
Transcription de la présentation:

TEXT MINING Fouille de textes Master Recherche Informatique TEXT MINING Fouille de textes Jérôme CHAMPAVÈRE Didier DEVAURS Kaouther DRIRA Nawal GUERMOUCHE Mohamed TOUKOUROU Meriem ZIDOUNI Projet dans le cadre du module Cognition et Connaissance

Plan Introduction Outils et démarches du text mining Mise en œuvre des concepts Domaines de recherche Conclusion Text Mining

Introduction Quantité de documents électroniques en croissance permanente Exploration et récupération des connaissances manuellement extrêmement ardues ou presque impossibles Utilisation de la puissance de l’outil informatique pour en extraire les connaissances Text Mining

Text mining Data mining Text mining s’adresse aux données textuelles Données non structurées Outils spécifiques pour le traitement de données textuelles non structurées Text Mining

Text mining Text mining Extraction de l’information à partir des données textuelles non structurées dans des grands corpus de texte Combine Des outils du traitement du langage naturel Des outils de fouille de données Text Mining

Outils du Text Mining Outil d'accès et de collecte des documents Outil d'ingénierie du document Outil d'ingénierie du langage Outil de fouille Outil de visualisation Text Mining

Démarches suivies par le text mining Outils d’ingénierie du document - Formalisation des données textuelles - Etiquetage des textes (date, auteur, ...) Documents Collecte de documents du domaine Outils de fouille - Extraction de connaissances (des règles d’association, calcul statistique) Traitement linguistique Outils d’ingénierie du langage - Extraction des termes - Filtrage des termes - Indexation des documents - Création d’une taxonomie - Regroupement des documents par les termes qui leur sont associés Extraction de connaissances Outil de visualisation et navigation Explorer et analyser les résultats Interprétation Text Mining

Mise en œuvre des concepts de fouille de textes Exemples Text Mining

Le projet LINDI Linking Information for Novel Discovery and Insight Objectifs Découverte de nouvelles informations Mise en place d’un système Contexte : biologie moléculaire BioText : http://biotext.berkeley.edu/ Text Mining

Le projet LINDI Enjeu : découverte automatique des fonctions des gènes Question Un gène A connu (expression et fonction) Un gène X nouveau (expression connue) Quelle est la fonction de X ? Réponse Expressions de A et X similaires Fonction de X probablement similaire Text Mining

Le projet LINDI Démarche Problème : énorme quantité de documents Explorer la littérature biomédicale Faire des recoupements d’informations Problème : énorme quantité de documents Recours à la fouille de textes Text Mining

Recherche de documents Documents mentionnant des gènes donnés Source principale : le Web Relatif à une langue Text Mining

Structuration des données Ensemble de documents traitant d’un même gène Recherche de mots-clés Compter les occurrences Enlever les mots non signifiants Retirer les mots sans intérêt : intervention de l’utilisateur Résultat : un ensemble de mots-clés pour chaque gène Text Mining

Exploration des données Intersection des ensembles de mots-clés Ordonner les mots-clés trouvés Présentation à l’utilisateur Sélection d’une liste de mots-clés pertinents Text Mining

Exploration des données Nouvelle requête Gènes A, B et C connus Meilleurs mots-clés sélectionnés Réduction de l’ensemble des documents à étudier Expression de X similaire à celle de A, B et C ? Si oui, fonction probablement similaire Text Mining

AIDE Assistant Intelligent for Data Exploration Système de planification à initiative mixte Guidé par les connaissances de l’utilisateur … et par ses propres évaluations Aide l’utilisateur à s’orienter Justifie et ordonne ses propositions Text Mining

DocMiner Text Mining

Quelques domaines de recherche de fouille de textes Text Mining

Domaines abordés Recherche d’informations fréquentes Recherche d’informations inattendues Catégorisation de textes Text Mining

Catégorisation de textes Engouement dans ce domaine de recherche Choisir les documents par degré de pertinence L’outil TileBars Text Mining

Recherche d’information inattendue Nouvel horizon pour la veille et l’intelligence économique Audit des besoins Synthèse et Diffusion Collecte des données Traitement Automatiser le traitement des données collectées Text Mining

Unexpected Miner Outils inappropriés pour effectuer de la veille Architecture du système Prétraitement des données Recherche de documents similaires Recherche d’information inattendue Evaluation du système Text Mining

Conclusion Découverte de “nouvelles” informations Interactions homme-machine Nombreuses applications de “text mining” Text Mining

MERCI DE VOTRE ATTENTION Text Mining