Sujet de Thèse "Gestion des méta données dans une architecture de médiation à large échelle" Federico DEL RAZO

Slides:



Advertisements
Présentations similaires
Agrégation d’alarmes faiblement structurées
Advertisements

Réseaux neuronaux - Architectures et algorithmes
Chap. 4 Recherche en Table
Material/Sources: Daniel Bardou, Julie Dugdale &
Applications de GdX Coordinateur thématique : Christophe Cérin
Data Mining.
Règles d’association.
Extraction de Connaissances à partir de Données et Fouille de Données Knowledge Discovery in Data Bases and Data Mining Pascal Poncelet
Département Informatique Responsable :M. Huchard Responsables adjoints : A. Jean-Marie, F. Koriche, P. Séébold.
15- La réciproque de Thalès
Propriété de Thalès (Fiche élève N°1)
Cours MIAGE Henry Boccon-Gibod 1 XML, Extensible Mark up Language Un esperanto des langages informatiques.
Extraction des connaissances dans les bases de données
INTRODUCTION Grande quantité de données
1 DISIC Option Systèmes Intelligents / Données, Documents et Connaissances DISIC Option Systèmes Intelligents / Données, Documents et Connaissances.
Présentation générale "Information et gestion" Présentation générale des programmes d « Information et gestion » en première STG.
Architecture Technique de la plate-forme CASTOR Projet Castor © Ecole des Mines de Nantes
1°/ Attention c’est de la perspective centrale dans une perspective cavalière L’ombre du haut du poteau est portée par la droite issue de S qui y passe.
Problème de génération : Illustration & Méthodes
Journées Treillis Rochelais – La Rochelle – 30/31 Mai Alain Gély Autour des implications Unitaires Université
Cliques & Bicliques Maximales
R. Saint-Paul, G. Raschia and N. Mouaddib IRIN, Nantes (France)
Programme Introduction aux BD et aux SGBD Le modèle relationnel
EQUIPE TaToo Extraction de connaissances dans les bases de données : motifs séquentiels et ontologie LIRMM - CNRS - Université Montpellier II.
Christelle Scharff IFI Juin 2004
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
Identités remarquables
Structuration & Organisation de Données Complexes Workshop « Fouille de données complexes » Clermont-ferrand, 20 Janvier 2004 O. Boussaid, F. Masseglia.
Exercice page 216 numéro 92. DURAND Carla 4°C a) Faire une figure :
LANGUE ET LANGAGE EN MATHEMATIQUES.
LES PROPRIÉTÉS DU PARALLÉLOGRAMME.
(vous pouvez télécharger ce document en utilisant la même adresse que pour le corrigé du concours blanc) Exercice supplémentaire (géométrie dans l’espace)
1 Du pixel à lobjet : méthodes stochastiques X. Descombes Projet Ariana Orféo, 14 juin 2005.
14- Identités remarquables
Informatique Décisionnel
Base de données: Généralités IFT6800 – E 2008 Pierre Poulin.
Gestion de Fichiers GF-10: Traitement Co-Sequentiel: Appariment et Fusion de Plusieures Listes (Base sur les sections de Folk, Zoellick & Riccardi,
Couplage d'un langage de contrôle un système de formatage existant
Les Sciences de l’Ingénieur
Support des connaissances TP2 XSL-T
Apérisentation Sur les graphes évolutifs Mardi 22 novembre 16h30.
Pour trois points non alignés A, B et C, on a les inégalités
DATA WAREHOUSE - DATA MINING
Supports de formation au SQ Unifié
Constructions Propriétés Fiche démontrer.
1 Alain Casali Christian Ernst Extraction de Règles de Corrélation Décisionnelles 29 Janvier 2009.
Fouille de données issues de capteurs : problématique et méthodes Journée “Les Capteurs en Agriculture” Paris 18 avril 2014 Pascal Poncelet
Contrôle d’accès sur le client pour des documents XML Luc Bouganim, François Dang-Ngoc, Philippe Pucheral INRIA Rocquencourt & Université de Versailles.
ASKIT v2.0 Gestion de l’ASCII DAUVERGNE Sébastien DEZE Simon Master 1 Informatique.
(Poitiers 96) Soit un triangle ABC rectangle en A tel que :
Présentation AICHA REVEL INGENIEUR D’ÉTUDE STERIA DEPARTEMENT TRD
Éléments de géométrie (1)
STAN (Suffix Tree ANalyser) Un outil de recherche de motif dans les génomes Grégory Ranchy Anne-Sophie Valin 9 décembre 2004.
La loi des cosinus A C B ( a – x ) h x c b a D b2 = a2 + c2 - 2ac cosB
Le parallélogramme (14) Définition
Services en Text Mining. Introduction : Qui est Mentis ? Mentis a été fondée en 2005 comme une société spin-off du Laboratoire d'I ntelligence Artificielle.
TEXT MINING Fouille de textes
Réunion GafoDonnées: Equipe SIG/IRIT 24/25 janvier 2002
Stage à Ontomantics Master Pro TILDE
D’autres critères que le support ? Exemple avec la recherche de périodes denses : 1.Les méthodes de fouille actuelles dépendent d’un découpage arbitraire.
Visualisation des flots optiques en 3D
T TS 3,83 » TR 5 40° 5 » 3,83 TR TS » 0,766 S R.
Entourer la ou les bonne(s) réponse(s)
Les mathématiques autrement Construction d ’un triangle mode d'emploi.
Corrigé : Fiche 2 Agrandissement et réduction. 1)C’est le triangle ABC 2)C’est le triangle IJK 3) IJ = AB x 3 = 3 x 3 = 9 cm IK = AC x 3 = 7 x 3 = 21.
Les bases de données Séance 3 Construction du Modèle Conceptuel de Données.
Séminaire IRIT-UT1 « Les nouveaux de 2010 » Novembre 2010 Les entrepôts de données et des documents = des entrepôts de documents ? Ronan Tournier
module SIE depuis 2011 et IAMD depuis l’an dernier ! Gestion de Masse de Données (GMD) Introduction Adrien Coulet
PROGRAMME DE CONSTRUCTION
Règle et Compas.
Transcription de la présentation:

Sujet de Thèse "Gestion des méta données dans une architecture de médiation à large échelle" Federico DEL RAZO

Ingénierie des Données et des Connaissances (IDC) Département Informatique LIRMM Federico DEL RAZO John TRANIER Simon JAILLET Zohra BELLAHSENE Maguelonne TEISSEIRE Anne LAURENT DoctorantsPermanents

Concevoir et modéliser des systèmes distribués à large échelle. Ingénierie des Données et des Connaissances (IDC) Etudier les principaux mécanismes et modèles permettant de concevoir et mettre en œuvre lintégration de données et de connaissances dans les grands systèmes distribués. Projet Objectif

Médiation de données dans les systèmes à large échelle Fusion de schémas Traitement des requêtes dans les systèmes P2P Fouille de données Perspectives dans lIDC

Fouille de données Les règles dassociation (R.Agrawal) Les motifs séquentiels Les dépendances fonctionnelles La classification La segmentation Les séries chronologiques IDC

Les motifs séquentiels IDC FouilledeDonnes Motifs séquentiels généralisés Extraction incrémentale de Motifs séquentiels Web usage mining Web mining Schema mining

IDC FouilledeDonnes MotifsSéquentiels Recherche dune structure commune à un ensemble de documents (XML). nom professionadresse prof. telrue numéro nom professionadresse paysrue nationalité nom professionadresse rue

Schema mining IDC FouilledeDonnes MotifsSéquentiels Tree mining: A BC D A CE BA BC D B ABC BD T1 T2T3 Arbre fréquent A BC Minimum support 60 %

Tree mining IDC FouilledeDonnes MotifsSéquentiels SchemaMining Inclusion identique: R est un sous arbre de T1. A B F ECEDC T1 B H I DEC T2 G C D E T3 B B EDC R

Tree mining IDC FouilledeDonnes MotifsSéquentiels SchemaMining Inclusion: R est un sous arbre de T1,T2. A B F ECEDC T1 B H I DEC T2 G C D E T3 B B EDC R

Tree mining IDC FouilledeDonnes MotifsSéquentiels SchemaMining Inclusion: R est un sous arbre de T1. A B F ECEDC T1 B H I DEC T2 G C D E T3 B B EDC R

Tree mining / IDC FouilledeDonnes MotifsSéquentiels SchemaMining A B F ECEDC T1 B H I DEC T2 G C D E T3 B E D C Alexandre Termier T1={A*B,A*F,B*C,B*D,B*E,F*C,F*E,A*C,A*D,A*E} T2={G*B,B*H,B*I,H*C,I*E,I*D,B*C,B*E,B*D,…} T3={B*C,C*D,C*E, B*D,B*E} Algorithme: Eléments fréquents B B B

Tree mining / IDC FouilledeDonnes MotifsSéquentiels SchemaMining Alexandre Termier Least General Generalization E D CB B B Arbres fréquents Méthode incomplète A B C E A A F A A A G C B C B C B B A C A A B C Minimum support 50 %

Tree mining / B1 BA12 BB13 BC14 AB25 AD26 A1 AB12 AC13 CD34 IDC FouilledeDonnes MotifsSéquentiels SchemaMining IDC A BC D A CE BA BC D B ABC BD T1 T2T3 A1 AC12 AE13 CB24 EA35 AB56 AC57 CD

Tree mining / ABCDE IDC FouilledeDonnes MotifsSéquentiels SchemaMining IDC Candidats de taille 1 Candidats de taille 2 ABCD A0321 B1110 C0102 D0000 B1 BA12 BB13 BC14 AB25 AD26 A1 AB12 AC13 CD34 A1 AC12 AE13 CB24 EA35 AB56 AC57 CD78 T1 T2 T3

IDC FouilledeDonnes MotifsSéquentiels SchemaMining Candidats de taille 3 B1 BA12 BB13 BC14 AB25 AD26 A1 AB12 AC13 CD34 A1 AC12 AE13 CB24 EA35 AB56 AC57 CD78 T1 T2 T3 Tree mining / IDC AB AC CD A B B A C C C D D A A BC C D

Tree mining / IDC FouilledeDonnes MotifsSéquentiels SchemaMining IDC Candidats de taille 4 A BC A C D A B C D

Tree mining / IDC FouilledeDonnes MotifsSéquentiels SchemaMining IDC Candidats de taille 5 A B C D …

Tree mining / IDC FouilledeDonnes MotifsSéquentiels SchemaMining IDC Candidats de taille 5 A B C D …

Problematique IDC FouilledeDonnes MotifsSéquentiels SchemaMining TreeMining Développer un Algorithme pour générer- élaguer les candidats Inclure les relations ancêtres – descendants Considérer la polysémie et la synonymie. Nouveau algorithme « Schéma mining »