Classification automatique

Slides:



Advertisements
Présentations similaires
Regroupement (clustering)
Advertisements

Regroupement (clustering)
bloom phytoplanctonique
GEF 435 Principes des systèmes d’exploitation
Formation en Analyse des Données
Méthodes de classification
Phylogénie et distances génétique
Les classifications hiérarchiques
Analyse des proximités, des préférences et typologie
Module de formation Introduction
Auto-organisation dans les réseaux ad hoc
Agents de la socialisation
Classification Ascendante 2-3 Hiérarchique: Applications au Web Mining
Licône "Calculs" Permet de lancer le re-calcul automatique dune partie ou de toutes les nomenclatures en fonction de certains critères Permet de re-calculer.
Vérifier les acquis La notion d’homogénéité sociale Exercice 1
Une nouvelle manière de noter
Rehaussement de la classification textuelle d’une base de données photographiques par son contenu visuel Sabrina Tollari Sous la direction de Hervé Glotin.
Méthode des k plus proches voisins
G20 Statistique.
Les structures de marché
Concepts avancés en mathématiques et informatique appliquées MAP-6014.
Groupe 1: Classes de même intervalle
La segmentation
RECONNAISSANCE DE FORMES
Analyse de la structure sociale
Influence des 3 piliers du développement durable sur les intentions d’achat d’une bière régionale Callens Jean Philippe Decottignies Damien Harouz Saliha.
Le développement des communautés. Pourquoi et comment pensez-vous que les premières communautés se sont développées? Les premiers être humains se sont.
Apprentissage semi-supervisé
Akoka & Wattiau1 J. Akoka & I. Comyn-Wattiau. Akoka & Wattiau2 PLAN Introduction : le problème Critères de classification Techniques de classification.
Recherche d’ensembles chromatiques
« Analyses descriptives multidimensionnelles »
Évolution de schémas par classification automatique dans les entrepôts de données 3ème journée francophone sur les Entrepôts de Données et l'Analyse en.
Analyses typologiques
Troisième séance de regroupement PHR004
Cours 3 : Classification
La notion d’espèce.
Biostatistiques Quand on souhaite étudier une (ou des) caractéristique(s) sur un ensemble d’individus ou d’objets, il est difficile, voir impossible, d’observer.
Outils mathématiques pour le datamining
L ’application se divise en trois parties principales : - la partie Menu qui permet d’effectuer diverses actions - la partie Arborescence qui permet de.
Cours 3 : Classification
Algorithme français courant de division. En division, il y a beaucoup moins d’algorithmes que pour les autres opérations. L’algorithme courant consiste.
Classification : objectifs
STATISTIQUE DESCRIPTIVE ÉLÉMENTAIRE
Complexité des Problèmes Combinatoires Module IAD/RP/RO/Complexité Philippe Chrétienne.
Les animaux nous ressemblent beaucoup parfois...
Micro-intro aux stats.
Il existe différentes tables de mobilité
Sujets spéciaux en informatique I PIF Approches non-paramétriques u Technique de classification NN u Technique de classification k-NN u Erreurs.
Le calcul algébrique.
Sériation et traitement de données archéologiques
Addition – Soustraction - Multiplication
Statistiques descriptives-Distributions expérimentales à une dimension
Classification de données par l’algorithme FPSO-GA
Fabienne BUSSAC MOYENNE 1. Moyenne Définition :
Knowledge discovery in Databases (KDD)
D. Steinberg, N. Monmarché, M. Slimane, G. Venturini
Sabrina Tollari, Hervé Glotin, Jacques Le Maitre
Recueil d’exemples de cartographie dynamique (actualisé le 30/01/03)
Vérifier les acquis La notion d’homogénéité sociale Exercice 1
Fabienne BUSSAC NOMBRES RELATIFS, ADDITION ET SOUSTRACTION, RAPPELS
I – La communication locale : une nécessité pour l’unité commerciale
Classification-Segmentation
Reconnaissance d’objets 3D –point de vue complètement différent –pas d’invariant 3D Difficultés :
Classification évolutive Travaux pratiques et cas de la lignée verte Cours du 10/03/2016 Présentation: Hugo FONTES Conception : Hugo FONTES et Pierre CELLIER.
1/14 Analyse des tâches en ergonomie 3 – Analyse de la tâche du point de vue de l’opérateur Quelle que soit la méthode utilisée, l’opérateur reste au centre.
 Comparaison des résultats sur 20 dans 2 classes de 4 élèves  Moyennes identiques  Situation identique dans les 2 classes ?  Pourquoi ?   paramètres.
WAAPP GHANA NCoS REGIONAL CONFERENCE, 2016 Thème: Caractérisation agro-morphologique de 44 accessions de manioc (Manihot esculenta Crantz) cultivés en.
Revue des solutions disponibles.
Transcription de la présentation:

Classification automatique On souhaite classer automatiquement n individus On a besoin d ’une mesure de proximité entre chaque paire d’individus On souhaite faire des groupes homogènes Il faut donc faire une partition des individus Deux problèmes Explosion combinatoire Critère d ’homogénéité des groupes CAH - Classification Ascendante Hiérarchique

Explosion combinatoire Le nombre de partitions possibles d ’un ensemble à n individus est donné par le nombre de Bell Il est impossible de passer en revue toutes les partitions possibles : besoin d ’une classification automatique CAH - Classification Ascendante Hiérarchique

Inertie intra-classe et inertie inter-classe On considère n individus dans k groupes G est le barycentre des n individus Il y a nk individus dans le groupe Gk Gk est le barycentre du groupe k Inertie intra-classe Inertie inter-classe Inertie des points du groupe k au barycentre Gk Inertie des barycentres Gj au barycentre G CAH - Classification Ascendante Hiérarchique

Inertie totale L ’inertie totale est la somme des inerties intra et inter classes Si on a n groupes Iintra = 0 et Iinter = IG Si on a 1 groupe Iintra = IG et Iinter = 0 L ’algorithme de la CAH utilise le critère d ’inertie intra = critère de Ward CAH - Classification Ascendante Hiérarchique

Algorithme de la CAH On part de la situation où tous les individus font partie d ’un groupe à un élément : Iintra = 0 (n groupes) On regroupe les deux individus qui sont le plus proches et on fait donc grimper Iintra (n-1 groupes) On remplace le groupe des deux individus par leur barycentre et on recalcule les distances entre tous les points On regroupe les deux individus qui sont le plus proches et on fait donc grimper Iintra (n-2 groupes) etc. pour n ’obtenir qu ’un groupe où Iintra = IG CAH - Classification Ascendante Hiérarchique

Intérêt de la classification automatique Dans l ’exemple, c ’est facile car on a deux dimensions… On aurait pu faire les groupes « à la main » et si on a 4, 5, ou plus de dimensions ? Avec beaucoup plus de points… Sous S-Plus, un menu est disponible... CAH - Classification Ascendante Hiérarchique