Apprentissage et Fouille de Données

Slides:



Advertisements
Présentations similaires
Chaîne de Synthèse Réel Modélisation Rendu Image Fichier Scène
Advertisements

A. Cornuéjols IAA (basé sur Rob Schapires IJCAI99 talk) Combiner des apprenants: le boosting.
Algèbre de composants : une approche fonctionnelle à la sémantique de documents Bart Lamiroy LORIA/INPL QGar - École des Mines de Nancy.
Fonctions & procédures
Affichage interactif, bidimensionnel et incrémental de formules mathématiques Hanane Naciri et Laurence Rideau INRIA Sophia Antipolis CARI'2000.
Regroupement (clustering)
RECONNAISSANCE DE FORMES
Introduction à l’Algorithmique
Chapitre 5. Description numérique d’une variable statistique.
Les algorithmes arithmétiques
Le Compte satellite du tourisme Expérience Marocaine
Application de réseaux bayésiens à la détection de fumées polluantes
Etude de la dynamique des groupes et des objets intermédiaires de conception, en s’appuyant sur la dynamique de l’émergence des état problèmes Reza MOVAHEDKHAH,
Yann Chevaleyre et Jean-Daniel Zucker
Master Génie Biologique et Informatique, première année
La d é marche d apprentissage Une proposition d organisation des s é ances.
La résolution de problèmes basiques
Bouyekhf Rachid-Lyuboumir Gruitch Laboratoire SeT UTBM
Encadrés: Chapitre 13 Distances
Les fonctions Colegiul National “Mihai Eminescu”, Iasi -Définition
Traitements d'images et Vision par ordinateur
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
Un système de médiation basé sur les ontologies
Cours n°3 Les formulaires
Structures Pyramidales Luc Brun L.E.R.I., Reims and Walter Kropatsch Vienna Univ. of Technology, Austria.
Application des algorithmes génétiques
OCaml – Les arbres L3 MI.
Applications du perceptron multicouche
ASI 3 Méthodes numériques pour l’ingénieur
Méthodes d’Inpainting
IFT3730: Infographie 3D Transformations Géométriques
Cours Corporate finance Eléments de théorie du portefeuille Le Medaf
Méthode des k plus proches voisins
Construction de modèles visuels
Rappel... Solution itérative de systèmes linéaires (suite et fin).
Transformée de Fourier discrète et transformée de Fourier rapide
1.3 COORDONNÉES DES POINTS
Examen partiel #3 Mercredi le 15 décembre de 15h30 à 17h20
Courbes de Bézier.
Gestion de Fichiers Hachage Extensible.
1.1 LES VECTEURS GÉOMÉTRIQUES
Universté de la Manouba
Algorithmes d ’approximation
ELE6306 : Test de systèmes électroniques Projet de cours Chaîne de scan unique: Reconfiguration = Optimisation Louis-Martin Côté Professeur : A. Khouas.
Forces et moments Chapitre 2.
Institut Supérieur des Etudes Technologiques de Djerba Exposé du Traitement de Données Réalisé par: Khalifa Marwa Magroun Amira Jawadi Souad L2MDW.
Recherche dun même objet / scène Approches basées sur des descripteurs locaux Approches basées sur des descripteurs globaux.
Structures de données IFT-2000 Abder Alikacem La récursivité Semaine 5 Département dinformatique et de génie logiciel Édition Septembre 2009.
Le calcul algébrique.
Modélisation géométrique de base
Structures de données IFT-2000 Abder Alikacem La récursivité Département d’informatique et de génie logiciel Édition Septembre 2009.
Cours du 25 octobre Mardi le 24 octobre
Présentation de la méthode des Eléments Finis
Coupes efficaces pour la relaxation lagrangienne
Segmentation (1ère partie)
Rappel... Valeurs propres et vecteurs propres. Définitions;
Projet Télédétection Vidéo Surveillance Deovan Thipphavanh – Mokrani Abdeslam – Naoui Saïd Master 2 Pro SIS / 2006.
H Be C N O F P S He Li B Ne Na Mg Al Si Cl Ar Z = 1 Z = 2 Z = 3 Z = 4
Le chiffrement asymétrique
D.E ZEGOUR Ecole Supérieure d’Informatique
Similarité Belkhir Abdelkader Laboratoire LSI USTHB
Partie II: Temps et évolution Energie et mouvements des particules
Arbres binaires et tables de hachage
Thème: Les fonctions Séquence 1 : Généralités sur les fonctions
CHAPITRE III Calcul vectoriel
1. Tri rapide ou Quicksort Principe : La méthode du Quicksort due au C.A. Hoare (1962) utilise les principes généraux de division et équilibrage. 2.
Chapitre 4 Equations différentielles ordinaires à n variables.
Chapitre 2 Variables aléatoires 1. Variables aléatoires : définition Résultat d’une expérience dont l’issue est multiple (VARIABLE) et imprévisible (ALÉATOIRE)
Présenté par  Samira BELHORMA  Imane ZEHHAF. Introduction I. Définitions II. Quand et comment évaluer une compétence? III. Le contexte d’évaluation.
Réforme de l’école Primaire et nouveaux programmes Circonscriptions Bordeaux - Floirac Entre deux mers Lormont Année scolaire
Transcription de la présentation:

Apprentissage et Fouille de Données Kernels on Structured Objects Through Nested Histograms Marco Cuturi, Kenji Fukumizu Apprentissage et Fouille de Données Proposé par : Michèle Sebag Présenté par : Ounas ASFARI

Plan - Définition - objectif - noyaux définis par des partitions - Factorisation de noyau - conclusion

Définition : Un noyau est une mesure de similarité définie entre deux objets d’un même ensemble. Soit, une fonction à valeurs réelles de deux variables prises sur un ensemble X. X peut-être un espace vectoriel ou non (chaînes, arbres, graphes). La "qualité" de cette mesure de similarité est un enjeu majeur pour s’assurer des bonnes performances des méthodes à noyaux.

Définition : - P.d. sont les fonctions qui peuvent comparer les objets s, t par leur somme s + t.

objectif on propose une famille des noyaux pour les objets structurés qui est basée sur le paradigme ensembles des components.(décomposer chaque objet complexe en histogramme simple de ses composants). On utilise pour chaque objet une famille des histogrammes nichés, où chaque histogramme dans cette hiérarchie décrit l'objet vu d'une perspective granulaire . Nous employons cette hiérarchie des histogrammes pour définir les noyaux élémentaires qui peuvent détecter des similitudes brutes et fines entre les objets.

objectif - on calcule un mélange de tels noyaux spécifiques, pour proposer une valeur finale de noyau qui a efficacement les matchs locaux et globaux. - on propose les résultats expérimentaux sur une expérience de récupération d'image qui prouvent que notre approche est efficace et peut être vue comme procédé de calibre à utiliser avec des noyaux sur des histogrammes.

Représentation de mesure des objets complexes objets complexes peuvent souvent être décomposés en composants dans un ensemble X. Un long séquence dans n-grammes : AABHLKFHGH... · · ·HAABGJY HLKA.. → {(AAB, 2), (HLK, 2), (FHG, 1) · · · } Un texte comme ensemble des mots : the cat eats the mouse → {(the, 2), (cat, 1), · · · } Une image comme histogramme de couleurs,

Measure representations Une image comme ensemble des Pixel : → Phonologie :le phonème est une représentation mentale fondamentale d'une unité phonologique dans une langue morphologie :racines de mot Prosodie : caractéristique de durée, compteurs de lancement et modèles d'effort Syntaxe : les modèles de phrase

Limitations d'une représentation simple de mesure - L'ensemble niché de représentation de composants peut améliorer la représentation avec des résolutions plus fines.

Quelques représentations de multirésolution: Images, avec les histogrammes nichés de couleurs:

séquence des lettres{A,B,C}, avec un suffixe-arbre : chaque paramètre µs = [as, bs, cs] compte la fréquence de lettres après le contexte S.

noyaux définis par des partitions Créer les noyaux élémentaires des similitudes locales: Supposer que L est un ensemble d'index, et considérer les familles μ = {μt}t∈L lié de mesures μt de Mb+(X) classé sur L Donné un noyau arbitraire k sur Mb+(X) et un t ∈ L de l'étiquette mesure la similitude du μ et μ ′ de vus par l'étiquette T. prolongation à un ensemble T ⊂ L des étiquettes groupées:

Spécifique noyaux Partition Laisser P être une partition de L, celui est une famille finie P = (T1,…, Tn) des ensembles de L, Considérer maintenant le noyau défini par une partition P : des partitions avec un granularité croissant peuvent être obtenues par une structure hiérarchique sur le L. Une hiérarchie est une famille des partition, telles que chaque sous-ensemble T en Pd, est divisé dans Pd+1.

la moyenne des noyaux spécifique partition: п est une mesure antérieure sur l'ensemble correspondant de partitions pd et k est un noyau sur le Mb +(X) × Mb +(X)

Factorisation de noyau Proposer pour les deux éléments, μ , μ ′ de ML(X), définir pour T enjambant périodiquement de plus fin à plus brut tous les ensembles contenus en Pd, PD−1,…, P0, la quantité KT ci-dessous ; Donc, k п (μ, μ′) est recherché par le kL (la valeur au noeud de racine)

Conclusion L'algorithme peut être prolongé aux noyaux pour les vecteurs pour lesquels nous pouvons assumer une connaissance hiérarchique entre les coordonnées . Ce cadre est lié au noyau multiple apprenant, mais ici nous employons les combinaisons algébriques plutôt que l'additif , et employons un antérieur sans l'évaluation des poids. Setting the hyper-parameters is a crucial problem (tuned through CV at the moment). Optimizing them (with respect to SVM cost functions for instance as in MKL) should be hard, but simpler criterions might be considered

Merci Questions ?