Les Extra-Trees+SW Réalisé par : Encadrante: Mohammed TAOUIL Majda Aicha Hamza HALIM Mustapha LARHROUCH Anasse TAHBOUN Khalid OUBELQUE
Plan Introduction des extra-trees Exemple d'utilisation (domaine médical) Adaptation à la classification des lettres Durant ces deux semains on a pu realise le travaille demmander a savoir La recherche concernant l’algorithme d’arbre de decesion presesament Extra-trees et sous-fenetres,ici on a fait des recherches sur des articles Dont ils ont implimenter cet algorithme ,mais malhoreusement on n’a pu Trouve des articles en francais on était oblige de chercher en anglais Et de traduire ce derniere ,et finalement on a pu realiser l ’application Qui fait l’apprentissage et la classifcation des lettres latin comme Le prof nous a demmande Donc dans cette presentation on va vous presenter l’article mensionne On va vous expliquer le processus de cet algorithme et finalement Vous montrer l’application realise
EXTRA-TREES Extra-Trees ils consistent à moyenner les prédictions d'un ensemble d'arbres construits de façon randomisée. Ces arbres sont cultivés jusqu'à ce que tous les sous-échantillons à toutes les feuilles sont soit pur en termes de résultats ou contiennent moins de NMIN échantillons d'apprentissage. On dénombre plusieurs algorithmes pour construire des arbres de décision, parmi lesquels: ID3 (Iterative Dichotomiser 3) C4.5 (successeurs d'ID3) CHAID (CHi-squared Automatic Interaction Detector) CART(Classification And Regression Tree)
EXTRA-TREES
EXTRA-TREES
Article: « Classification des images biomédicales avec sous-fenêtres aléatoires et arbres de décision » Raphaël el Marée, Pierre Geurts, Justus Piater and Louis Wehenkel GIGA/CBIG, Montefiore Institute, University of Liege, Belgium
Introduction Le problème de classification d'image biomédicale Arbres de décision et sous-fenêtres aléatoires
PHASE D'APPRENTISSAG E
PHASE D'APPRENTISSAG E
PHASE DE PREVISION
BASE DE DONNEES 10 000 images radiographiques(x-ray) 57 classes Exemple :
Approche de l’extra-tress & subwindowing pour la classification des lettres latin Maintenant on est arrive a la partie d’application de l’algorithme …. Pour classifier des lettres latin
Approche de l’extra-tress & subwindowing pour la classification des lettres latin Etapes : Choix de nombre de subdivisions Subdivision des images et extraction des caractéristiques Applications d’algorithme ID3 pour construire les modelés Phase de test (évaluation) Et voila les etapes pour faire On premier lieu on commance par choisir le nombre de subdivision En suite appliquer la subdivision a l’ensemble des images et extraire les caracteristiques de chaque subdivision c est a dire les fenetre Et par l’application de l’algorithme ID3 on construit des modeles(arbre de decision) Et a la fin c’est la phase de l’evaluation
Approche de l’extra-tress & subwindowing pour la classification des lettres latin Constitution d’un échantillon d’images étiquetées, c-à-d à chaque image correspond une classe Voila le point de depart c’est la constitution d’un ensemble d’images pre-classifier c’est-à-dire pour chaque image de l’ensemble on connait sa classe on parle de la lettre sur l’image
Choix de nombre de subdivisions Approche de l’extra-tress & subwindowing pour la classification des lettres latin Choix de nombre de subdivisions Choix dépend de type des images a classifier. Texture, fenêtre de petite taille Manuscrits, fenêtre de grandes taille Etc … Notre echantillion d’images est bien prêt maintenant on doit chercher a nombre de subdivision On a pas de vrai regles a suivre pour determiner le nombre de subdivision Il faut savoir juste que la taille de fenetre depend de type de l’information sur l’image par exemple Pour les images de textures il nous faut des fenetres de taille petites pourquoi parceque tout simplement l’information est bien distruibuee sur toute l’image il y a de resque d’avoir des fenetres ou il y a juste le noire de l’arriere plan Par contre pour les images qui contient des lettres latin tant que la taille de la fenetre est petite tant que le risque d’avoir des fenetre sans informations augmente et par la suite l’apprentissage de nos arbre de decision devient plus faible
Choix de nombre de subdivisions Approche de l’extra-tress & subwindowing pour la classification des lettres latin Choix de nombre de subdivisions Pour notre cas (Lettre Latin): Avoir une partie de l’objet dans chaque block Notre choix : diviser chaque image par quatre (4) fenêtre Les subdivision en fenetre doit garantir d’avoir dans chaque fenetre une partie de l’information c’est pour cela que La solution qu’on a opte pour notre cas est de subdiviser l’image en quatre comme il est montre les lignes de subdivision qui passe par le centre de l’image On suppose bien sure que l’etape de normalisation des image echantillonner est bien assure
Subdivision des images et extraction des caractéristiques Approche de l’extra-tress & subwindowing pour la classification des lettres latin Subdivision des images et extraction des caractéristiques 1 B 1 B Maintenant l etape de la subdivision et extration des vecteur caracteristique de chaque fenetre et on suite pre-classifier chaque vecteur par l’etiquete de l’image d’origine 1 B 1 B Subdivision Extraction de caractéristiques étiquetage
Préparation d’applications du ID3 Approche de l’extra-tress & subwindowing pour la classification des lettres latin Préparation d’applications du ID3 Entrées de l’algorithme : Attributs (positions des pixels) Echantillon Classes Maintenant c’est l etape la plus importatne c’est l’application de l’algorithme ID3 pour la creation des modeles Mais pour l’appliquer il faut lui preparer les entrees necessaire a pour le bon fonctionnement A savoir les attributs qui sont les position des pixels dans chaque fenetre L’echantillion Et les classes qui correspond a chaque fenetre
Approche de l’extra-tress & subwindowing pour la classification des lettres latin Préparation d’applications du ID3 Echantillon : Choix de N fenêtre (même position dans l’image d’origine) Contrainte pour le nombre N (il n y’a pas) N >= nombres de classes N <= nombres des échantillon total Pour l’echantion qui est un choix aleatoire de n fenetre du meme endroit dans les images initiale Et petite remarque a montionner qu’on a pas de trouver de contraite sur le nombre n sous qu’il faut depasser le nombres de classe et ne pas depasses le nombre d’echantillion total
Approche de l’extra-tress & subwindowing pour la classification des lettres latin Algorithme ID3 : Voila les entrees de l’algo La premiere condition c est la condition d’arret et avec la suivante sont celle respensable de la creation des feuilles ….
Approche de l’extra-tress & subwindowing pour la classification des lettres latin Méthodes pour choix de meilleur attribut : L’entropie (entropie de Shannon) Hs(C|A) = - ∑i P(Xi) . ∑k P(Ck|Xi).log(P(Ck|Xi)) Mesure de fréquence : (mieux en pratique) Freq(a,E) = (1 / |Va|) . ∑Pmax(Ea,v)
Approche de l’extra-tress & subwindowing pour la classification des lettres latin Exemple illustratif : x1 x2 x3 x4 x5 x6 x7 1 c1 c3 c2 X4 1 C1 X2
Approche de l’extra-tress & subwindowing pour la classification des lettres latin Exemple illustratif : x1 x2 x3 x4 x5 x6 x7 1 c1 c3 c2 X4 1 1 C1 X2 1 C3 X7
Phase de test (évaluation) : Approche de l’extra-tress & subwindowing pour la classification des lettres latin Phase de test (évaluation) : Subdivision de l’image (de même manière pour l’apprentissage) Présenter en entrée les fenêtres pour le modèle associe a chaque une Chercher la classe dominant dans les résultats
Conclusion
Merci pour votre attention