Olivier Leclair, Université Laval 2003 1 Un algorithme de fouille dans une représentation des données par objets: une application médicale SIMON, Arnaud.

Slides:



Advertisements
Présentations similaires
MOT Éditeur de modèles de connaissances par objets typés
Advertisements

SECRET Établissement dun programme de recherche Ressources humaines et Développement social.
PC / Traitement numérique / Contrôle Environnement logiciel
Etablir des procédures de vérification (Etape 11 / Principe 6)
Classification et prédiction
1 Fouille de Données (Data Mining) Gestion et lexploitation de grandes bases de données – Culture statistique et maîtrise de techniques danalyse de données.
Sciences et technologies de gestion
Entre construction théorique et mise en œuvre opérationnelle
4 février 2005DESS Economie et Gestion des Cliniques et Etablissements pour personnes âgées 1 La prise en compte des critères économiques dans lanalyse.
DEME - La méthode d’enquête – introduction
Vue d'ensemble Vue d'ensemble de la sécurité dans Windows Server 2003
L’étude de cas en géographie seconde
Dr DEVILLE Emmanuelle J D V 12/07/2006
Systèmes Experts implémentation en Prolog
Animation pédagogique – Mars 2010 Mme Sellier / M. Bogart CPC Avion Cycle 2 Découverte du monde Cycle 2 La démarche expérimentale d'investigation.
Technologie Collège Document d’accompagnement du programme de
Peut-on pratiquer létude de cas en histoire ?. Comment envisager une programmation en géographie ? 1. Une méthode validée par lhistoire universitaire.
Les Biais Item 14°) Relever les biais discutés. Rechercher d’autres biais non pris en compte dans la discussion et Relever leurs conséquences Dr Marie-Christine.
Traitement de données socio-économiques et techniques d’analyse :
Apprendre à partir des observations
Paul-Marie Bernard Université Laval
Vuibert Systèmes dinformation et management des organisations 6 e édition R. Reix – B. Fallery – M. Kalika – F. Rowe Chapitre 2 : Les applications fonctionnelles.
DURIBREUX, Michèle & COCQUEBERT & HOURIEZ, Bernard,
1 Le programme de 3 e Rentrée 2008 (daprès un diaporama dAndré Pressiat)
Méthode des k plus proches voisins
Arbre Rouge Noir.
ÉVALUATION DES SCÉNARIOS POUR L’AIDE À LA CONDUITE DU PROJET
Auto Exterior Scoop SQP PROCESSUS 24 juillet 2006 Version validée V01.
SYSTEMES D’INFORMATION
Entre construction théorique et mise en œuvre opérationnelle
MOT Éditeur de modèles de connaissances par objets typés
RECHERCHE COMMERCIALE
Technologie au cycle central
Patrons de conceptions de créations
Épidémiologie Notions élémentaires Réalisation pratique d’un enquête
Programmation objet La base.
Ministère de l’Enseignement Supérieur et de la Recherche Scientifique
* 16/07/96 Caractéristiques maternelles et infantiles associées à l’accident ischémique artériel cérébral périnatal de l’enfant *
Apport du Data Mining pour prédire la facture de patients hospitalisés
Epidémiologie Dr Lydia Guittet.
1 Registration Physique Séminaire du Master Davide Bazzi Université de Fribourg
Arbres binaires et tables de hachage
LES DEMARCHES PEDAGOGIQUES
Un processus pour la prise de décision spatiale.
RAISONNEMENT À PARTIR DE CAS R à PC. PLAN DU TRAVAIL Introduction Introduction Raisonnement analogique Raisonnement analogique Principe et étapes de R.
Nicolas Rageul, Yvan Bédard, Jacynthe Pouliot, Michel Fortin
Thibault ROY Université de Caen / Basse-Normandie Laboratoire GREYC – Equipe ISLanD Apport d’outils d’informatique documentaire à l’analyse de forums de.
* 16/07/96 Diabète gestationnel et malformations de l’appareil urinaire : une étude cas témoins en milieu hospitalier.     Avril 2013 Arnaud Seigneurin.
10 février 2010 Sylvain Quéméner et Caroline Moulin Consultants
Le Browser hiérarchique de Classes Java : En quoi cette application pourra faciliter le travail de Mr Leblanc ?
TECHNOLOGIE 6ÈME Professeur : Baptiste DUMAS.
TECHNOLOGIE 5ÈME Professeur : Baptiste DUMAS.
Knowledge discovery in Databases (KDD)
( ) Collège de Maisonneuve
GPA-779 Application des systèmes experts et des réseaux de neurones.
systèmes d’information géographique
Thème: Essai d’analyse comportementale du consommateur Algérois par rapport au yaourt et produits similaires. Cas d’étude: Yaourt Soummam Réalisé par.
Vers l’exploitation de grandes masses de données Encadré par : Mme L.Lamarini Présenté par: Rhaz Yassine Smiri Safae Un article de: Raphaeil Féraud,Maroc.
Extreemly Random Trees + SubWindows HOURRI Soufiane NAIT ABDELLAH OUALI Ismail OUFQIR Anouar OUSSAFI Mohammed.
Genetic correlations between field test results of Swedish Warmblood Riding horses as 4- years-olds and lifetime performance results in dressage and show.
Évolution de second ordre dans un algorithme évolutionnaire V. Lefort
Accès à une quantité impressionnante de données Classement en 10 chapitres.
Concepts avancés en mathématiques et informatique appliquées
La Désintégrale® Un nouvel outil pour les mathématiques. Pour en savoir plus sur la théorie mathématique de la Désintégrale, contactez moi.
Capital humain et croissance Le rôle de l’éducation Béatrice Van Haeperen (IWEPS, UCL) CEBLF, 26 novembre
Raison d'être de la structure de fichiers : Les premiers travaux : Début des années 1960 : En 1963 : Près de 10 ans plus tard... (à peu près 1973) : Durant.
Facteurs de risque de contamination par le virus de l’hépatite C. Etude cas-témoin en population générale.
Lecture critique d’article Mars 2014 Pr Ganry. q2. Donner un titre à l’article? Etude du statut sérologique et de l’accouchement par césarienne sur les.
ETUDES PRONOSTIQUES Pr Ganry.
1 SEEE Présentation et état d’avancement déploiement des applications Séminaire DOM – Jeudi 22 mars 2012.
Transcription de la présentation:

Olivier Leclair, Université Laval Un algorithme de fouille dans une représentation des données par objets: une application médicale SIMON, Arnaud & NAPOLI, Amedeo, Ingénierie des connaissances : Évolutions récentes et nouveaux défis, p

Olivier Leclair, Université Laval Plan de présentation Introduction Description d’un système de fouille de données Système de fouille de données pour l’épidémiologie du cancer des enfants – Notions de la représentation par objet – Algorithme « ALFREDO » – Discussion sur le fonctionnement de l’algorithme – Résultats La cartographie médicale Conclusion

Olivier Leclair, Université Laval Introduction Enquête épidémiologique  base de données & techniques d’analyse de données  hypothèses Hypothèses doivent être statistiquement confirmées et vérifiées avec les données d’une autre base, avant d’être considérées comme de la connaissance.

Olivier Leclair, Université Laval Introduction (suite) Épidémiologie des cancers de l’enfant – 2 bases de données: 1. Registre Lorrain des cancers de l’enfant: circonstance de découverte, confirmations, diagnostiques et traitements entrepris 2. Enquête « cas témoin » sur les facteurs de risque des cancers de l’enfant: antécédents médicaux et expositions diagnostiques des enfants et leurs parents – Analyse avec méthodes statistiques

Olivier Leclair, Université Laval Système de fouille de données Fouille de données: extraction de connaissances potentiellement exploitables à partir de données brutes Système s’articule autour de 4 composantes: – Bases de données et leur système de gestion – Système à base de connaissances d’aide à la résolution de problème – Système d’étude et d’analyse de données symboliques – Interface pour l’interaction et visualisation des données et des résultats

Olivier Leclair, Université Laval Système de fouille de données (suite) L’analyste (médecin) joue un rôle important, car il sélectionne les données à analyser. Il est aidé par un outil de visualisation et d’organisation des données (cartographie). Ensuite, il choisit la méthode pour analyser les données (régression linéaire, arbres de décision, réseaux de neurones).

Olivier Leclair, Université Laval Épidémiologie du cancer des enfants Notions de représentation par objets – Système de représentation de connaissance par objets: Unité de connaissance = Classe Classes organisées en hiérarchies conceptuelles Processus de classification fait partie des opérations de raisonnement

Olivier Leclair, Université Laval Épidémiologie du cancer des enfants (suite) – Opérations de raisonnement: Subsomption: relation qui permet d’organiser les classes en hiérarchie. C subsume D = C est un fils de D Classification: établir la position d’un objet, classe ou instance dans une hiérarchie. APS = Ascendant plus spécifique Cohérence et instanciation: classe doit pouvoir avoir des instances et vice versa. Recherche d’information: trouver les propriétés détenues par une classe, les restrictions des propriétés et leurs valeurs.

Olivier Leclair, Université Laval Épidémiologie du cancer des enfants (suite) Algorithme ALFREDO: – Utilise les techniques de construction d’arbres de décision et les principes de l’apprentissage par généralisation. – But: Construire à partir d’un ensemble de n classes cibles, une procédure de classification représentée par un arbre de décision. – Feuilles de l’arbre de décision est le nom des classes cibles et à un nœud est associée une fonction test.

Olivier Leclair, Université Laval Épidémiologie du cancer des enfants (suite) Personne lieu-habitation âge Adulte HommeFemme Enfant diplômemaladie GarçonFille Maladie Virale Bactérienne B1 pB1 B2 pB2 France LorraineAlsace MeuseMoselle

Olivier Leclair, Université Laval Épidémiologie du cancer des enfants (suite) – Détermination des propriétés significatives: Déterminer APS de nos classes cibles (I) Determiner descendants de APS(I) Supprimer les classes cibles de Desc(APS(I)) Considérer les fonctions test portant sur les propriétés de APS(I)

Olivier Leclair, Université Laval Épidémiologie du cancer des enfants (suite) Discussion: – L’utilisation d’un système RCO peut se justifier par: Le mode de représentation des données est proche de celui utilisé par l’être humain. L’utilisateur est assité lors de la création et l’évolution de la hiérarchie de classes. – Les résultats validés par l’utilisateur sont utilisés pour créer de nouvelles classes.

Olivier Leclair, Université Laval Épidémiologie du cancer des enfants (suite) Résultats non retrouvés dans l’analyse statistique: – Le rôle chez les filles de la non-contraction d’infections durant la petite enfance – L’influence des maladies virales – Le faible poids à la naissance

Olivier Leclair, Université Laval La cartographie médicale La cartographie joue un rôle important pour l’analyse des données relatives à une répartition géographique ou démographique. La cartographie répond aux caractéristiques d’un système de fouille de données: – Adaptable à tous les types de données géographiques. – L’analyste joue un rôle important dans la sélection des données, méthodes et paramètres. – L’étude des cartes permet d’émettre des hypothèses à confirmer.

Olivier Leclair, Université Laval Conclusion Les méthodes proposées par le système de fouille de données permet d’exploiter les connaissances du domaine étudié, ce qui est un atout majeur pour la recherche d’hypothèses. La cartographie permet de mettre en évidence des risques environnementaux. Grâce à ce projet, diverses voies de recherche sont envisagées: l’adaptation de techniques de raisonnement temporel et la production d’explications à la fouille de données.

Olivier Leclair, Université Laval Merci!