1 KM et Moteur de recherche: l’approche sémantique de.

Slides:



Advertisements
Présentations similaires
Qu’est-ce que LingPro ? LingPro est la branche ingénierie linguistique de i-KM La collaboration i-KM / LingPro est le résultat d’un partenariat sous forme.
Advertisements

Portail Sdin Méthodes pour la contribution du portail SDIN Mars 2013.
Les technologies décisionnelles et le portail
1Er Partie Intervenants : Nuno Barata Alain Joly Thierry Belvigne
La recherche documentaire
UE 102 (M1.CE) Communication d’entreprise
1 ICSI Ingénierie des Connaissances et des Supports dInformation Organiser et exploiter le capital de connaissances des entreprises et des organisations.
Les balises Du HTML au XML. Le HTML* PREMIER TEMPS La première « révolution » est dans son nom : HYPERTEXT Mais cest le M (MARKUP) qui a un grand avenir…
Maîtrise de chimie : Travaux d Etudes et de Recherche Découvrir la nécessité, à partir dun exemple sur internet, détayer une information, un résultat,
BCDI UTILISER LE THESAURUS POUR FAIRE UNE RECHERCHE
Le developpement web  Préparé par : ASSAL Lamiae JAMALI Zakarya
Excel 2007 et les services Excel. Pourquoi Excel ? Outil privilégié danalyse des données issues des bases multidimensionnelles Ergonomie connue des outils.
Stratégie Microsoft sur la Recherche en Entreprise.
CPeyronnet | | Veille et recherche sur Internet : concepts, méthodologies, outils... 1 CvTic Veille et recherche sur Internet.
SYSTRAN Un outil du TAL Victoria AUPERT Marjorie LORSUNG.
Indexation textuelle : Systèmes de recherche d’informations
GED Masters: Gestion Électronique de Documents
SECURITE DU SYSTEME D’INFORMATION (SSI)
Bee 27 Normandie. Début 2010 Aujourdhui, on note labsence dun annuaire global référençant toutes les entreprises possédant un site. Contrairement, aux.
1 Sécurité Informatique : Proxy Présenter par : Mounir GRARI.
Annotations sémantiques pour le domaine des biopuces
Ordre du jour Copernic, portrait de lentreprise Copernic Enterprise Search Description du produit Fonctionnement Spécificités techniques Options offertes.
Le Travail Collaboratif ...
Lédition de contenu, en bref Catherine Ducharme, CERIC.
La communication de ce document est soumise à autorisation de France Télécom R&D (Nom du fichier) - D1 - 01/03/2000 France Télécom R&D Énoncé Représentation.
Atelier « Créations de sites » : Les techniques de réalisation de sites EPN :...
Gouvernement du Québec Présentation par : Alain Thibault : PDG Efoé Wallace : Directeur du développement.
Services de repérage Hélène Turcotte Direction des inforoutes et de linformation documentaire Ministère des Relations avec les citoyens et de lImmigration.
La face cachée des systèmes de recherche Martin Bouchard, président Janvier 2003.
Les techniques des moteurs de recherche
Tout savoir sur la synchronisation des mails, contacts et calendrier sur Windows Phone Lire cette présentation en mode plein écran.
LA VEILLE DOCUMENTAIRE
JEE 5 F.Pfister 2 institut eerie JEE – Une plateforme serveur  Développement et exécution d'applications réparties.
Du Guichet du Savoir ( à Catalog+ ( )
ATELIER REGIONAL DES NATIONS UNIES SUR LA DIFFUSION ET LA COMMUNICATION DES DONNEES (du 13 au 15 mai 2014)
École de bibliothéconomie et des sciences de l’information 1 Gestion de l’information électronique (GIE) Maîtrise en sciences de l’information EBSI Université.
l'information sur Internet
Cadre réservé a la réalisation Ne mettre aucun visuel ni texte à cet endroit Cadre réservé a la réalisation Ne mettre aucun visuel ni texte à cet endroit.
Un volume d’information en croissance exponentielle
E.Dot – juillet 2005 Page 1 Conclusion [ Lot 4. Validation et Évaluation ] Rapport Final 4 juillet 2005.
Le langage du Web CSS et HTML
Gestion des fichiers et dossiers
Centre d’échange d’informations sur la Convention sur la Diversité Biologique Bienvenue dans le cours sur l’ajout d’une page web sur un site web développé.
UFD 62. EC2 : cours n° 3 Gestion Electronique des Documents Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de recherche KIWI – LORIA
Un logiciel de facturation simple et performant
Faites travailler le web pour vous! - – - eTeamsys : Belgique – Luxembourg Tél.
Réunion de lancement du 18 janvier constitution, alignement, comparaison et exploitation d’ontologies géographiques hétérogènes Réunion de lancement.
Apsideboard L’Apside Board : Nouvel intranet d’Apside Permet de :
Thésaurus et accès à l’information Sylvie Dalbin Assistance & Techniques Documentaires Conseil en ingénierie documentaire,
UTILISATION DE MIOGA Patrick LE DELLIOU
Jeu de Librairies Virtuelles « DLL » Windows pour la réalisation de programmes informatiques.
Formation ADBS – septembre 2014 – 1 Approfondir son expertise en recherche d'information 3-4 & 5 septembre 2014.
1 F o r m a t i o n A R S FTP anonyme, Archie 2 F o r m a t i o n A R S FTP ANONYMOUS m Premier service d'accès à des documents publics. m Repose très.
Dominique LAURENT Patrick SEGUELA
Techniques documentaires et veille stratégique Anne Pajard, avril 2008
© WYNIWYG / Communication, reproduction interdite sauf autorisation.
Présentation du 05 avril 2006 L’intranet : une réalité pour les entreprises Espace sécurisé où sont stockés les documents internes Base de connaissances.
CMS - SGC Revenu Québec. Octobre 2003 SSWII - SERVICE DES SOLUTIONS WEB ET DE L’INGÉNIERIE DE L’INFORMATION DSAE - DIRECTION DES SOLUTIONS D’AFFAIRES.
L’Amélioration continue
Observus - ENEIDE 28 novembre Pertimm : la société  Pertimm SAS : Fondée en 1997 en France, Présente en France et aux Etats-Unis, Start-up innovante.
Panorama fonctionnel et technique des outils avancés
Dreamweaver Séance 1.
1 Présentation de DREAMWEAVER (1) Gaël TREMEAU GI05 Printemps 2006.
SI28 Malépart Céline Jérémy Palmier
Introduction au HTML Qu’est ce que le HTML ?
Site Internet de l’Office de Tourisme d’Arles. Le site de l’Office de Tourisme d’Arles c’est tous les mois :  + de visiteurs,  + de pages.
©Armelle Thomas - Février Méthodologies de la recherche d’information sur Internet Le tour de la question ADBS - Les jeudi de l’Internet pratique.
Les outils collaboratifs Assane Fall Bibliothécaire / Veilleur technologique.
Présentation KOBLIX Ludo Rousseau – KOBLIX. KOBLIX Expertises Références Informations KROKODIL Avril 2004OVIDENTIA : le Portail d'Entreprise de CANTICO2.
Transcription de la présentation:

1 KM et Moteur de recherche: l’approche sémantique de

2 KM et recherche L’inventaire Où est la connaissance ? Qui détient quoi ? Où sont les informations cruciales Comment être sûr de n’avoir rien oublié ? La connaissance est-elle bien protégée ?

3 Pourquoi Pertimm ? Fédérer l’information Créer un point d’accès unique Rechercher intuitivement Trouver rapidement Respecter les droits d’accès sécurisés Organiser les réponses

4 Le problème de la recherche Par rapport à une requête, on parle de documents retrouvés ou non retrouvés Par rapport à un besoin d’information, on parle de documents pertinents ou non pertinents RejetSilence Retrouvés non pertinents Retrouvés pertinents Non retrouvés pertinents Non retrouvés non pertinents Succès Bruit Nbre de documents pertinents retrouvés Nbre total de documents retrouvés Précision = Nbre de documents pertinents retrouvés Nbre total de documents pertinents Rappel =

5 L’utilisateur navigue dans le contenu en utilisant les divers outils disponibles: La Solution Pertimm –recherche contextuelle (cooccurrences) –recherche « à la volée » sur texte libre –recherche par concepts pour filtrage, routage, push, classifications –recherche sur les structures ou sur les types de données (balises, noms de répertoires, de fichiers, entités nommées, etc.)

6 Le besoin aujourd’hui Pertimm Server GED SGBD MAIL Internet SGBD MAIL Internet Pertimm Node

7 Des requêtes expertes sans thésaurus ni langage d’interrogation complexe Les ontologies dynamiques (concepts) Facile à mettre en oeuvre et à utiliser Multilingue et cross-lingue Aucune limitation en capacité, pas de facteur d’échelle Les avantages de Pertimm

8 Linguistique: en moyenne 4 fois plus de réponses pertinentes Concepts: plus vous donnez de mots, plus la réponse est pertinente Interface “tableau de bord” Gestion des “entités nommées”: noms de lieux, de personnes, d’organismes, etc. Requêtes structureés/non structurées Facteurs différentiateurs

9 Apport de la linguistique Nombre moyen de déclinaisons % de chance de trouver sans linguistique Requête de 1 mot Requête de 2 mots Requête de 3 mots Requête de 5 mots Requête de 10 mots 2 Anglais 50 %25 %13 %3 % - 4 Espagnol/Italien 25 %6 %2 % -- 2 Japonais 50 %25 %13 %3 % - 3 Français 33 %11 %4 % -- 6 Allemand 17 %3 % Russe 13 %2 % --- Dès 2 mots en Français Pertimm est déjà 10 fois meilleur ! 4 fois plus de réponses pertinentes en moyenne

10 Recherche par concepts Définir dynamiquement ses concepts par une liste de mots non limitée en taille. Cancer Chemotherapy Radiotherapy Benign Tumor Malignant Cancerous Immunotherapy Carcinoma Fibroid Mastectomy Melanoma Metastasis Neoadjuvant Nonmelanoma Oncologist Polyp Precancerous Recurrence Carcinogen Sarcoma Lymphoma Carcinoma Survival Metastatic Glioma Leukemia Hemorrhage Non-small Myeloma Réponse

11 EADS: EADS Shared Information System (ESIS) NASA: l’Intranet du Kennedy Space Center CNRS: Fédération des sites des labos Groupe SNPE: l’Intranet documentaire IRSN: Fédération de contenus Intranet Direction des Renseignements Militaires Techniques de l’Ingénieur: le site de e-commerce Biotech-intelligence: Portail de veille et de push VediorBis: Fédération de bases Lotus-Notes Les principaux Clients