Services en Text Mining. Introduction : Qui est Mentis ? Mentis a été fondée en 2005 comme une société spin-off du Laboratoire d'I ntelligence Artificielle.

Slides:



Advertisements
Présentations similaires
Qu’est-ce que LingPro ? LingPro est la branche ingénierie linguistique de i-KM La collaboration i-KM / LingPro est le résultat d’un partenariat sous forme.
Advertisements

MySQL Base de données.
CHOUETTE Un outil pour le développement de données normalisées dans le champs de linformation voyageurs Jacques BIZE Groupe Technologie des transports.
Sandrine Peraldi (ISIT) Jean-Philippe KOTOWICZ (INSA Rouen)
Introduction Pour concrétiser l’enseignement assisté par ordinateur
La communication au sein du collectif
« ARCHEODOC, un portail dynamique pour la recherche d’information en archéologie » Véronique HUMBERT (Lattes) Blandine.
Mettez toutes les chances de votre côté en exploitant le meilleur dInternet !
2002 Compétitif XMiner : Plate-forme de structuration texte libre multi-approches par balisage XML de Tags Actifs Lobjectif du projet est de développer.
Indexation textuelle : Systèmes de recherche d’informations
Ce que la CRM ACT peut vous apporter
Bac Pro Gestion Administration
Presentation. Qui sommes nous ? Nous sommes une équipe détudiants motivés et intéressés par la finance de marché Notre but est de fournir un mensuel dinformation.
Initiation au système d’information et aux bases de données
Les requêtes La Requête est une méthode pour afficher les enregistrements qui répondent à des conditions spécifiques. La requête est donc un filtre.
LES OUTILS POUR LA GOUVERNANCE DES DONNÉES LA PASSION DES DONNÉES LA PRÉCISION DES RÉSULTATS.
Initiation au système d’information et aux bases de données
UN MOTEUR AUTOMATIQUE DE TACHES POUR LES CONVERSIONS EDI
Archiaid scrl depuis 1989.
Logiciel dévaluation et de maîtrise des risques de la création ou du rachat dentreprise CréaSûr est issue de la technologie AutoScore qui a été développé
BINOMIAL PlanBuilder pour la continuité de services
L’ELABORATION DES FICHES DE POSTE
Centre dabonnement Autodesk Mode demploi ---Vade-mecum Product Support Manager, Southern Europe.
Rémunération Globale Et Bilan Personnalisé 2004
Introduction à KB Crawl
Annotations sémantiques pour le domaine des biopuces
Tutoriel web endnote Outil de recherche et de partage bibliographique 1.
Chercher et trouver Module 1 Déroulement : Souhaiter la bienvenue
Démonstrateur Lingway
Date / references Systèmes Terre et Interarmées Projet OUTILEX Rapport détude final Octobre 2006.
PRISE DE COMMANDE NOMADE
LES INFOS de Philippe et Patrick Journal d'informations en ligne Infospp.free.fr Mai 2006.
Formation nationale CHM, 2012, Antananarivo, Madagascar
ROGAUDIT ® Logiciel d'Assistance des Responsables d'Audits.
Bureautique M1 Mise en forme évoluée 2.
ASKIT v2.0 Gestion de l’ASCII DAUVERGNE Sébastien DEZE Simon Master 1 Informatique.
DOSSIER G10 – La base de données Relationnelle
Agence fédérale pour la Sécurité de la Chaîne alimentaire Un nouveau site pour l’AFSCA ? CC du 28 mai 2008 Agence fédérale pour la Sécurité de la Chaîne.
S'initier au HTML et aux feuilles de style CSS Cours 5.
Ministère de l’enseignement Supérieur et de la Recherche Scientifique
Dominique LAURENT Patrick SEGUELA
Techniques documentaires et veille stratégique Anne Pajard, avril 2008
Thibault ROY Université de Caen / Basse-Normandie Laboratoire GREYC – Equipe ISLanD Apport d’outils d’informatique documentaire à l’analyse de forums de.
Formation nationale CHM, 2013, Abidjan, Côte d’Ivoire Le Centre d’échange d’information de la Convention sur la diversité biologique Par: Han de Koeijer.
L’enseignement de spécialité SLAM
Vers une intégration plus poussée de la recherche Web avec les Systèmes d’Information Géographiques Adapté de «Toward Tighter Integration of Web Search.
Équipe ISLanD Laboratoire GREYC Université de Caen / Basse-Normandie Des outils pour chercher sur la Toile Fête de la Science 2005.
TEXT MINING Fouille de textes
TERACOM © 2001 SoluPhone Santé Système d'échanges de données et d'informations de la Santé La M-Agency qui répond aux besoins de mobilité de votre entreprise.
Portail e-santé Auvergne
La valorisation de l’information scientifique Colloque IFAN, 27 novembre 2007.
Le Traitement Automatique des Langues (TAL)
Présentation nouveau site marchand
1 Brevet de technicien supérieur Responsable de l’hébergement à référentiel commun européen.
Nouvelles Technologies Internet & Mobile
Les outils Multidimensionnels SAS ® 9 Atelier Technique SAS ® Eric WOLFF Jeudi 2 juin 2005.
Sonia Léger Conseillère à la documentation Ethnologie Automne 2011 Base de données Érudit ETN-1001 Exercices méthodologiques.
Initiation aux bases de données et à la programmation événementielle
DUARIG « La solution de Prodware s’est rapidement imposée. Elle répondait en standard aux besoins fonctionnels du métier et d’autre part.
Vous présente en quelques réalisations un réel savoir-faire, le fruit de longues années d’expériences, aujourd’hui à votre service. Toutes les fonctionnalités.
MAXIMISER SON DÉVELOPPEMENT PROFESSIONNEL GRÂCE AU WEB SOCIAL Jan
Formation K-sup Niv 1 Février 2009 CRISI - COM. Programme formation (1 ère ½ journée) _ Fonctionnement de K-Sup _ Création de la structure du site de.
Bibliothèque Centrale de l’École Polytechnique La Recherche Documentaire Economie - HSS Session pratique Ressources Documentaires en Economie-Gestion Vanessa.
1 Le dispositif d’évaluation Présentation de XiTi Mise à disposition d’un outil d’analyse statistique : XiTi  Accessible en ligne pour le chef d’EPLE.
KOSMOS 1 Outils transversaux Module 7 1.L’annuaire 2.La recherche d’informations 3.La réservation de ressources.
Simple, efficace et opérationnelle pour les PME 5 minutes pour découvrir ses.
GUIDE PRATIQUE PLATE FORME LOGICIELLE QUESTIONNAIRE A CHOIX MULTIPLE. QCM DIRECT 6 NEOPTEC.
Vous présente en quelques réalisations un réel savoir-faire, le fruit de longues années d’expériences, aujourd’hui à votre service. Toutes les fonctionnalités.
Association régionale pour la formation, l’orientation et l’emploi Mode d’emploi Portail internet Aquitaine Cap Métiers Novembre 2011 Service éditions.
Les outils collaboratifs Assane Fall Bibliothécaire / Veilleur technologique.
Transcription de la présentation:

Services en Text Mining

Introduction : Qui est Mentis ? Mentis a été fondée en 2005 comme une société spin-off du Laboratoire d'I ntelligence Artificielle (IRIDIA) de l'Université de Bruxelles (ULB).

Introduction : quelle est l’offre de Mentis ? Mentis est une société spécialisée en analyse et en traitement automatique du contenu des textes non structurés (« Text Mining ») Création assistée de Taxonomies et de réseaux sémantiques Extraction d’informations au sein des textes libres Systèmes de Classification automatique de documents Moteurs de recherche sémantiques et collaboratifs Moteurs de veille Disposant d’une boîte d’outils logiciels performants, Mentis développe des solutions sur-mesure et offre les services suivants :

Particularités de l’offre de Mentis : offre modulaire à haut niveau de performances à la pointe de la technologie solutions capables de s’améliorer d’elles-mêmes par apprentissage automatique

5 Quelques Partenaires et Références

Exemples de références de projets de Mentis en Text Mining Moteur d’extraction des adresses pour les articles de presse Moteur de recherche sémantique pour l’ensemble des articles de la presse belge Moteur d’extraction d’informations et de comparaison pour les prescriptions médicales Moteur de structuration automatique d’informations pour l’aide à la création de catalogues de produits Moteur de recherche sémantique pour une collection de textes d’archives

Solutions en archivages Scan et Océrization de documents aux formats divers Classification automatique Extraction d’informations et création de documents sur mesure Moteurs de recherche Sémantique Collaboratif

Création semi-automatique de référentiels Les référentiels sont des systèmes de représentation des connaissances qui peuvent être plus ou moins structurés : listes, hiérarchies, réseaux Les référentiels sont utilisés lors de l’analyse automatique des textes pour identifier au sein d’un texte les informations reprises dans le référentiel (par exemple, si on a comme référentiel la liste des sociétés de distribution d’électricité, il est possible d’identifier tous les textes qui contiennent des noms de cette liste)

Création semi-automatique de référentiels l’extraction automatique d’informations prédéfinies au sein de textes libres la comparaison automatique de textes libres Des référentiels adaptés aux documents analysés sont des outils très efficaces qui permettent d’améliorer la qualité de l’analyse des textes libres et plus spécifiquement, les tâches suivantes :

Création semi-automatique de référentiels Mentis dispose d’outils logiciels qui permettent d’automatiser en grande partie la création de référentiels adaptés aux textes analysés. Ces systèmes analysent des larges collections de textes et cherchent à identifier à l’aide d’outils d’analyse statistique et sémantique les différentes catégories de sujets abordés au sein des textes analysés.

Extraction d’informations On peut extraire un ensemble d’entités d’information « atomiques » de documents tels que par exemple les offres et demande d’emplois : nom, métier, spécialisation, adresse, … L’idée est de minimiser la quantité de « texte libre » en essayant de reconnaître (c’est-à-dire pouvoir associer des éléments du texte à des catégories sémantiques prédéfinies (ex :nom, métier, …)) un maximum d’information au sein des documents analysés

Extraction d’informations Génération automatique de nouveaux documents (formattage de documents-types, rapports, …) Amélioration importante de la qualité du moteur de matching offre/demande d’emploi Permet d’implémenter un moteur de recherche efficace et capable de faire des recherches sémantiques (la qualité de la sémantique dépend de la qualité des informations extraites) (ex : avec la date) Les informations atomiques ainsi extraites peuvent ensuite être stockées dans une base de données structurée et être utilisé dans différents buts :

Extraction d’informations Une série de moteurs d’extractions déjà développés et capables d’extraire un ensemble d’informations prédéfinies (noms de personnes, noms de sociétés, adresses, informations numériques (dates, montants monétaires, code postal, …), …) Le développement de moteurs d’extractions pour des nouveaux types d’informations (profession, connaissance logicielle, …) à partir de systèmes d’apprentissage et de bases de connaissances En terme d’extraction d’informations, Mentis peut offrir 2 choses :

Un exemple simple : l’extraction de localités

Structuration automatique Améliore la lisibilité des documents (on sait directement où se trouvent les infos pour tous les documents) Permet d’améliorer la qualité du matching Une fois les informations atomiques extraites, on peut créer des nouvelles versions des documents dans le format que l’on désire. Ceci permet de mettre un ensemble de documents ayant des formats différents sous le même format

Extraction d’informations Formattage Textes Non Structurés Base de connaissances Textes Structurés Bases de Données

Un exemple de structuration

Moteur de recherche sémantique et collaboratif Module sémantique : permet de traiter les ambiguités, de gérer les synonymes et les textes sémantiquement proches des requêtes Module collaboratif : permet de regrouper les utilisateurs en communautés pour améliorer la qualité des recherches

Base de connaissances InterneExterne Réseau Collaboratif Utilisateur 1 Utilisateur 2Utilisateur 3

20 Contacts Merci de votre attention Contacts : Tel : 02/ Fax : 02/