La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Analyse Discriminante Agrocampus. Hémochromatose Hémochromatose : pathologie se traduisant par une absorption anormale du fer au niveau digestif entraînant.

Présentations similaires


Présentation au sujet: "Analyse Discriminante Agrocampus. Hémochromatose Hémochromatose : pathologie se traduisant par une absorption anormale du fer au niveau digestif entraînant."— Transcription de la présentation:

1 Analyse Discriminante Agrocampus

2 Hémochromatose Hémochromatose : pathologie se traduisant par une absorption anormale du fer au niveau digestif entraînant à terme lapparition dune cirrhose.

3 Lobjectif Le problème consiste ici à détecter la présence de cirrhose chez les patients atteints dhémochromatose sans recourir à un examen pénible et risqué pour le sujet (biopsie du foie).

4 Les données La population étudiée comporte 136 sujets, tous atteints dhémochromatose. Certains (37) présentent une cirrhose (groupe 1), les autres (99) en sont indemnes (groupe 2).

5 Les variables SEXE : sexe du patient AGEDIAG : âge du patient au diagnostic HM : Hépatomégalie IHC : insuffisance hépato cellulaire AST : enzymes de la cellule hépatique ALT : idem GGT : gamma GT FER : teneur en fer dans le sang (quantité de fer par unité de volume) FRT : ferritine (quantité de la protéine vecteur du fer) CS : coefficient de saturation CHFAGE : concentration hépatique divisée par lâge BMI : index de biomasse (poids en kg divisé par le carré de la taille) OH : présence dalcoolisme

6 2 - Choix des variables Seules les variables continues peuvent être traitées directement, soit : AGEDIAG, AST, ALT, GGT, FER, CS, FRT, CHFAGE et BMI

7 3 - Choix a priori 1 - Estimation des densités (*) 2 - Probabilités a priori 3 - Echantillon test 4 - Coûts derreur de classement

8 4 - Fonction de densité normale Sous lhypothèse didentité des matrices de variance-covariance intra (W k = W), la règle de classement obtenue est linéaire : Fonction discriminante de FISHER

9 5 - La règle de classement

10 Le classement

11 Les résultats

12 La validation croisée

13 6 - La qualité du classement

14 Lintroduction dun seuil

15 Avec un seuil il faut examiner : le pourcentage de bien classés le taux derreur majeure de classement le pourcentage de non classés

16 Taux derreur et seuil

17 7 - La sélection des variables Le modèle après sélection (STEPDISC) : FRT - AST - AGEDIAG

18 Optique prédictive Les critères de la procédure STEPDISC sont adaptés à loptique descriptive Dans une optique prédictive il vaudrait mieux utiliser le % de bien classés, global ou sur le groupe dintérêt

19 Sélection du meilleur modèle

20 Quelques points à considérer Il vaut mieux retenir pour un même % de bien classés, le modèle comportant le moins de paramètres Le choix entre plusieurs modèles peut sopérer sur lintérêt des variables Une variable non significative sur le plan statistique peut être jugée importante sur le plan médical

21 8 - Qualité de la règle de classement Maximum chance criterion : Tous les individus sont classés dans le groupe le plus nombreux : 137 patients classés dans le groupe 2, donc 99 bien classés, soit un % global de bien classés de 72.8 % Problème : 0 bien classés dans le groupe dintérêt Remarque : attention au % global de bien classés

22 Autre critère Proportional chance criterion Allocation au hasard des patients dans lun des deux groupes Probabilité de placer un patient dans le groupe k : n k / n Nombre de bien classés dans le groupe k : n k 2 / n % global de bien classés : (n n 2 2 ) / n 2 Application : 82.1 patients bien classés (60.4 %)

23 Comparaisons MCC : 99 bien classés (72.8%) PCC : 82.1 bien classés (60.4 %) FDL : 127 bien classés (93.4 %) Règle empirique : faire au moins 25 % de mieux Test : comparer le nombre de bien classés de la FD avec celui obtenu au hasard (PCC)

24 Remarques terminales Le choix des probabilités a priori : Des probabilités a priori proportionnelles aux effectifs dans léchantillon favorisent le classement dans le groupe le plus nombreux

25 Suite... Les coûts derreur de classement Objectif : minimiser le coût moyen a posteriori Affectation au groupe 1 si : pr 2 f 2 (x) c 1/2 < pr 1 f 1 (x) c 2/1 pr k : probabilité a priori du groupe k f k (x) : densité dans le groupe k c j/k : coût derreur de classement dans le groupe j dun élément du groupe k

26 ... Les résultats (Bootstrap - SPAD.N)

27 Les variables qualitatives La méthode DISQUAL : Analyse Discriminante sur les facteurs dune ACM

28 Sélection des variables Problème : un facteur est combinaison de toutes les variables de base Solutions : - Examiner les résultats de lACM dans laquelle la variable dintérêt est placée en supplémentaire - Réaliser un test du khi-2 entre la variable dintérêt et chaque variable de base (codée)

29 AXE ihc1 | | | | | | | | | | | | | sex2 | | | | |.8 + | | | | | | age2 | | | | | fer1 | hm1 | cs1chf1 | bmi2 ast2 cir1 | | | ggt2 | | | fib2 | | | | | oh2 | alt2 |.0 frt1alt1cir ihc frt | | hm2 | oh1 | ast1ggt1 | cs2 | | bmi1 | | | | fer2sex1 | | | | | | chf2 | fib age AXE 1

30 Sélection des variables

31 Les résultats

32 Variante Analyse directe sur les modalités :

33 Résultats variante 1 % de mal classés (validation croisée) : Groupe 1 : 5.4 % Groupe 2 : 9.0 %

34 Variante avec sélection Variables retenues : FRT - HM - AST - OH - ALT

35 Classement % de mal classés (validation croisée) : Groupe 1 : 5.41 % Groupe 2 : 7.07 % Global : 6.6 % (9 patients sur 136)

36 Comparaison Peu de variation des coefficients

37 Autre méthode : La régression LOGISTIQUE


Télécharger ppt "Analyse Discriminante Agrocampus. Hémochromatose Hémochromatose : pathologie se traduisant par une absorption anormale du fer au niveau digestif entraînant."

Présentations similaires


Annonces Google