Human Knowledge La nouvelle génération de moteurs sémantiques.

Slides:



Advertisements
Présentations similaires
Qu’est-ce que LingPro ? LingPro est la branche ingénierie linguistique de i-KM La collaboration i-KM / LingPro est le résultat d’un partenariat sous forme.
Advertisements

Les présentateurs doivent souvent transmettre des informations techniques à des auditeurs qui connaissent moins bien le sujet et le vocabulaire spécifique.
La GNU/GPL v3 du point de vue des administrations publiques _______ L'importance des SaaS Pascal Verniory responsable du service juridique du Centre.
Concevoir un site dans une optique de référencement Sébastien Billard Consultant référencement.
GROUPES D'INNOVATION.
La Méthode TRIZ en Agroalimentaire?
Concevoir un site dans une optique de référencement.
Comment choisir une solution technologique de veille sur le marché ?
Recherche-Action-Formation Quelles questions se poser ? Bernadette Charlier BIE 14 juin
1 DISIC Option Systèmes Intelligents / Données, Documents et Connaissances DISIC Option Systèmes Intelligents / Données, Documents et Connaissances.
Les outils du TAL Par RIGAUD Anaïs RALLIER Armelle SANTIAGO Gwendoline
OLST — Université de Montréal
ETAPES DE LA RECHERCHE DOCUMENTAIRE
DOSSIER TICE 2006 MASSON Wendy 1 ère année sciences du langage
1 ARCHITECTURE DACCÈS la méthode générale modèle de données définitions module daccès / modules métiers construction des modèles les modules daccès, les.
INTELLIGENCE COLLECTIVE : RENCONTRES 2006Nîmes mai 2006 CENTRE DE RECHERCHE LGI2P 1- Doctorante Ecole des mines de Paris, 2- Maitre de Conférences.
Etude des Technologies du Web services
ST40 – Stage Professionnel
Descriptif des cours Licence Professionnelle Tourisme International Responsable International de Structures de Loisirs, dAccueil et de Voyages.
introduction à la sociologie cours 4
Annotations sémantiques pour le domaine des biopuces
OIL & UPML DREVET - HUMBERT Introduction OIL : un langage de description dontologies UPML : un langage de description de systèmes à base.
Un modèle sémantique pour linteropérabilité de systèmes dinformation Equipe Ingénierie informatique et base de données – Laboratoire LE2I Université de.
(A. Meurant - UCL )1 Grammaire de base et lecture de textes latins ( ) Premier baccalauréat en Philosophie et Lettres (Langues et littératures.
Séance 11 - Structuralisme, post-structuralisme et contenu
Le Sémiographe Outil générique pour effectuer des opérations texte sens texte ou texte sens actions
Systeme Question-Reponse SQR
Révisions - IA Généralité: problèmes de lIA Recherche Logique Traitement de lincertitude Apprentissage Langue naturelle.
Web sémantique : Web de demain
La face cachée des systèmes de recherche Martin Bouchard, président Janvier 2003.
Roger Castonguay (MRQ) avec la collaboration de Richard Parent (SCT) et Pierre Chantelois (MIC) Juin 2002 Le défi des formulaires dans un contexte de prestation.
Programmation non procédurale Le projet ECOLE 2000
Partie A Système d ’information et organisation
LA LICENCE PROFESSIONNELLE ADJOINT DE DIRECTION Présentation du programme de la formation.
Business concept template MODÈLE DE CONCEPT D'AFFAIRE
Les activités de langue .
L’activité de référencement dans une Web agency – Stage de 4 mois –
La didactique de la conjugaison à l’école primaire.
Les Systèmes d’information INTRODUCTION
1 Architecture orientée service SOA Architecture orientée service SOA (Service Oriented Architecture)
Chapitre 2: COMMUNICATION TECHNIQUE
Direction de la normalisation terminologique (DNT) Mai 2010 La terminologie : une passion, des métiers !
Hatainville Les Moitiers d’Allonne – Tel : Website : stratic.online.com La démarche projet Mars 2001.
Jour 4: Gestion de la Connaissance
8 mars 2008 Millénia ans de solidarité numérique.
Approches Formelles en Systèmes d'information
Designs Patterns comment rendre son code faiblement couplé, et maintenable...
Vers une analyse syntaxique à granularité variable Tristan Van rullen
Algorithmes et Programmation
LES PROGICIELS DE GESTION INTÉGRÉS
Le système informatique et le système d’information
Béatrice Dubois Université du littoral La création d’entreprise Université du Littoral 2007.
Dictionnaires, lexicographie, lexicographes
Initiation à la conception des systèmes d'informations
Février 2010 La nouvelle classe de seconde des lycées d’enseignement général & technologique.
Recherche d’information
PLAN 1. Introduction 1.1. Sites de presse actuels 1.2. Objectif de notre site 2. Description du modèle 3. Outils utilisés 3.1. SVG 3.2. PHP et MySQL 4.
Techniques documentaires et veille stratégique Anne Pajard, avril 2008
Blogs en entreprise. Utilisation de nouveaux outils : Wikis, Blogs, Forums, GED,... Web 2.0 et entreprise 1.0 Transforme les utilisateurs en acteurs et.
Développement d’un CRM en PHP/JavaScript
Introduction et Généralités sur l’Algorithmique
L ’ordinateur est un outil parmi d ’autres.
Du discours aux modèles… Une tentative d’articulation
TERACOM © 2001 SoluPhone Santé Système d'échanges de données et d'informations de la Santé La M-Agency qui répond aux besoins de mobilité de votre entreprise.
Stage à Ontomantics Master Pro TILDE
Le Traitement Automatique des Langues (TAL)
LE BTS ASSISTANT DE GESTION PME/PMI POURQUOI ? Créée à l ’initiative de la CGPME (confédération générale des petites et moyennes entreprises), cette.
Architectures articulant des représentations hétérogènes L’exemple de Gate (Mini tutoriel, journée Atala du 12 février 2005) Thierry Poibeau LIPN (CNRS.
Il faut en choisir deux :  Le premier se choisit parmi :
ARIANE : Interopérabilité sémantique et accès aux sources d'information sur Internet Sylvain Aymard, Michel Joubert, Dominique Fieschi, Marius Fieschi.
Transcription de la présentation:

Human Knowledge La nouvelle génération de moteurs sémantiques

Fleur Thesmar – Directeur Commercial Human Knowledge -HK fondée par des chercheurs en linguistique, ethnologie et informatique. -Notre problématique: celle de la compréhension automatique, de textes en langue naturelle, appropriée en contexte. -Obtention d’une méthode universelle de construction dynamique de sens -Le sens n’est pas pris pour un donné -Universaux sémantiques Wierzbicka, grammaires de dépendance, analyse structurale de Tesnière… -La connaissance linguistique: morphologie, syntaxe, sémantique linguistique -Analyses du contexte : texte et cognition -Par essence multilingue -Langage écrit (formats eml, txt…)

Fleur Thesmar – Directeur Commercial Enjeux du TAL (1) -Internet est un monde mouvant -Difficultés rencontrées: des contextes fluctuants. -Modes de communication évoluent, du mail vers les réseaux sociaux -Vocabulaires, produits/marques, orthographes… utilisés évoluent constamment -Organisation interne de chaque « client entreprise » structure le tri: process, produits, FAQ, risque… Sans compter le « client particulier » -Cette évolution permanente nécessite classiquement le travail de « linguistes cachés » -Peu acceptable pour le client, prix du produit cache prix d’un service -Investisseurs? Rentabilité non durable, coût adaptation permanente  Outils actuels TAL : répondent mal à la dynamique accélérée du web

Fleur Thesmar – Directeur Commercial Enjeux du TAL (2) -Internet fournit une partie des solutions -Internet/ monde digital fournissent des Corpus de textes -Offre une connaissance statistique des usages -Permet de replacer des textes dans un contexte -Existence d’une structure organisée à travers le réseau à travers les liens hypertextes -Réseaux sociaux -Permettent d’envisager des applications où les utilisateurs participent au classement des concepts -Modèle du #  Limite des méthodes purement statistiques / structurelles / web dans un contexte donné => théorie linguistique nécessaire

Fleur Thesmar – Directeur Commercial Expérience / Marchés -Analyses de Corpus dans le but de trier les s: -Assurance / prêt conso -APCE -Tri des s en fonction de 200 catégories de FAQ -Toute question portant sur la création d’entreprise -Stand-by -Fraude -SignalSpam et Pacitel, en cours -Documentation (ex. CV, juridique) -Analyse qualitative (sondages, twitter…) -Web

Fleur Thesmar – Directeur Commercial Méthode de HK (1) -Approche de HK fondée sur l’analyse du contexte -Ex. « Système d’application » sur google -mauvaise traduction française de « système d’exploitation » -« Système d’application de la loi dans le temps » -« Que pensez-vous du système d’application? » de Genifique Yeux Light- Pearl TM ? -HK propose un système permettant à un client de catégoriser, i.e. partitionner les corpus, automatiquement -Administration par un client lambda de ses types de catégories -Tri automatique des corpus

Fleur Thesmar – Directeur Commercial Méthode de HK (2) -Linguistique: confrontation universel/particulier -Ars Magna de Lulle / logique de Leibniz : créer un système logique universel, à la manière d’un moteur sémantique ou d’une ontologie modernes… -… mais: nécessité de créer une encyclopédie qui organise le classement des lexies -… et un tel classement est en fait descriptif du contexte -Internet fournit une sorte « d’encyclopédie » mais pas ne dispose pas d’un système qui lui permettrait de « penser » les contextes et les idées… -Non disputemus, calculemus (Leibniz) - Investisseurs ou clients: besoin d’un produit « scalable », réellement automatique, notamment création des catégories - A partir du contexte donné par un corpus, construction du sens par étapes successives - Pas de réduction du langage, toute la richesse de la langue prise en compte - Ontologie « universelle » permet d’organiser les concepts indépendamment des langues