La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Le modèle linéaire généralisé (Réponse multinomiale)

Présentations similaires


Présentation au sujet: "Le modèle linéaire généralisé (Réponse multinomiale)"— Transcription de la présentation:

1 Le modèle linéaire généralisé (Réponse multinomiale)
Michel Tenenhaus

2                          

3 Un exemple d’application Test de l’efficacité du diffuseur d’iode RHODIFUSE
Conséquences biologiques du déficit en iode : Chez l’enfant : - Retard mental - Troubles musculaire - Paralysie - Crétinisme Chez l’adulte : - Goitre - Adynamie - Hypoproductivité

4 Classification des goitres selon l ’OMS
Groupe 0 : Thyroïde non palpable, ou palpable mais dont les lobes sont de volume inférieur à la phalange distale du pouce du sujet. Groupe 1A : Nettement palpable, et dont les lobes ont un volume supérieur à la phalange distale du pouce du sujet, non visible lorsque la tête est en extension. Groupe 1B : Idem, mais visible en extension du cou, mais non visible en position normale. Groupe 2 : Thyroïde nettement visible lorsque la tête est en position normale. Groupe 3 : Thyroïde volumineuse, nettement visible à plus de 5 mètres.

5 L’expérimentation N’Djiba 17 Sirablo (Témoin) 19 6 15 4 2 Sebabougou
Bamako 5 Woloni 7 37 Niger

6 Les données Y = Niveau de goitre : 1= 0, 2 = IA, 3 = IB, 4 = II
X1 = Village : 1 = Sirablo (Témoin), 2 = Woloni 3 = N ’Djiba, 4 = Sebabougou X2 = Sexe : 1 = Homme, 2 = Femme X3 = Jour : 0 = 0, 1 = 180, 2 = 360 X4 = Iode : 1 = Absence, 2 = Présence

7 Les données (en effectif)

8 Les données (en fréquence)
Fréquence de répartition des goitres Absence .76 .07 .12 .05 N'Djiba Homme 180 Présence .80 .08 .00 360 .84 .06 .10 Femme .30 .13 .32 .24 .38 .22 .29 .54 .15 .26 Sebabougou .55 .23 .81 .14 .01 .87 .18 .21 .59 .19 .09 .64 .20 .11 1 2 3 4 5 6 VILLAGE SEXE JOUR IODE Goitre 1 Goitre 2 Goitre 3 Goitre 4 Sirablo Homme Absence .61 .07 .26 .06 Sirablo Homme 180 Absence .39 .20 .30 .10 Sirablo Homme 360 Absence .42 .15 .33 .09 Sirablo Femme Absence .33 .09 .30 .28 Sirablo Femme 180 Absence .23 .14 .31 .32 Sirablo Femme 360 Absence .22 .15 .34 .29 7 Woloni Homme Absence .60 .13 .21 .06 8 Woloni Homme 180 Présence .75 .15 .10 .01 9 Woloni Homme 360 Présence .84 .08 .06 .01 10 Woloni Femme Absence .34 .10 .32 .24 11 Woloni Femme 180 Présence .45 .24 .24 .08 12 Woloni Femme 360 Présence .56 .18 .21 .06 13 N'Djiba Homme 14 15 16 17 18 19 20 21 22 23 24

9 Évolution des niveaux moyens de goitre

10 Le problème Étudier la liaison entre la variable dépendante Y = Niveau de goitre et les variables indépendantes X1= Village, X2 = Sexe, X3 = Jour, et X4 = Iode. Étudier la loi de probabilité Prob(Y = y | X1 = x1, X2 = x2, X3 = x3, X4 = x4) de Y conditionnellement à des valeurs prises par les Xj.

11 Hypothèses à tester H1: La répartition des niveaux de goitre au temps 0 ne dépend pas du village. H2: La répartition des niveaux de goitre dépend du sexe : la situation est plus grave chez les femmes que chez les hommes. H3: La répartition des goitres dépend des jours et de l’iode : la situation se détériore dans le village témoin de SIRABLO au cours du temps, alors qu’elle s’améliore dans les autres villages au cours du temps.

12 Analyse statistique I. Analyse des correspondances du tableau des goitres II. Typologie des profils-lignes III. Modélisation de la loi de probabilité des goitres en fonction des variables Village, Sexe, Jour, et Iode à l’aide du modèle linéaire généralisé

13 Analyse des correspondances

14 Typologie * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * Dendrogram using Ward Method Rescaled Distance Cluster Combine C A S E Label Num SiH òø NDF òú WoF òôòòòø SiH ò÷ ó SiH òø ùòòòòòòòòòòòòòòòòòø SeF òú ó ó WoH òôòòò÷ ó SeF òú ó WoF òú ó NDF òú ùòòòòòòòòòòòòòòòòòòòòòòòòòø SeH ò÷ ó ó NDH òø ó ó SeH òú ó ó WoH òú ó ó WoH òôòòòòòòòòòòòòòòòòòòòòò÷ ó SeH òú ó NDH òú ó NDH ò÷ ó SiF òø ó SiF òú ó WoF òú ó NDF òôòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷ SiF òú SeF ò÷

15 Visualisation de la typologie
Femmes non traitées Hommes non traités (hors N’Djiba) et femmes traitées Hommes traités et hommes non traités de N’Djiba

16 En résumé La gravité des goitres est plus importante chez les femmes.
L’amélioration due au traitement iodé est nette aussi bien chez les femmes que chez les hommes. L’effet du traitement paraît plus important dans les six premiers mois. Le traitement iodé rend la gravité des goitres chez les femmes comparable à celle des hommes avant traitement.

17 Utilisation du modèle linéaire généralisé
Le modèle linéaire généralisé permet d ’étudier la liaison entre une variable qualitative Y (à r modalités) et un ensemble de variables explicatives X1, …, Xk qualitatives ou quantitatives. Exemple : Y = Niveau de goitre (r = 4) X1 = Village X2 = Sexe X3 = Jour X4 = Iode

18 Le modèle linéaire généralisé dans la Proc CATMOD de SAS
Les s croisements disponibles (xi1, …, xik) des variables X1, …, Xk définissent s populations. On note i la loi de probabilité de Y sur la population i. On cherche à relier linéairement q (= s(r-1)) fonctions de réponse Fh(i) aux caractéristiques de la population i : Fh(i) = xih où xi = vecteur-ligne caractérisant la population i et h = vecteur-colonne de paramètres

19 Exemple des goitres Choix de la fonction de réponse
Identité : Fh(i) = ih , h = 1 à 3 Logit généralisé : Fh(i) = Log(ih/ i4), h = 1 à 3 Logit cumulé : Fh(i) = h = 1 à 3 Moyenne : Fh(i) =

20 Choix du modèle Pour h = 1 à 3 : Fh(i) = Village, Sexe, Village*Sexe
Iode(Village = 2), Iode(Village = 3) Iode(Village = 4), Sexe*Iode, Jour(Iode = Absence), Jour(Iode = Présent) Idem pour la fonction de réponse « Moyenne »

21 Les problèmes Le modèle probabiliste
Estimation des paramètres du modèle - GLS ou WLS en général - ML pour le logit généralisé Test sur les variables explicatives Test d’adéquation du modèle Étude des contrastes

22 Le modèle probabiliste
pi ij = Prob(Y = j dans la population i)

23 La loi multinomiale pi = (pi1, …, pir) Prob (pi) =
E(pi) = i = (i1, …,  ir) Estimée par Vi en remplaçant les ij par pij

24 Loi du vecteur des proportions p
p = (p1, …, ps) Prob (p) = Indépendance entre les populations E(p) =  = (1, …,  s) Estimée par V en remplaçant les V(pi) par Vi

25 Modélisation des ij

26 Estimation des La méthode GLS (Generalized Least Squares) prend en compte le fait que les pij ont des variances inégales et sont corrélées entre elles. On minimise la Somme des Carrés Résiduelle : estimation des Fh(p) à l’aide du modèle saturé où : F = [F1(p),…,Fq(p)] = estimation des Fh(p) à l’aide du modèle étudié Var(F) = estimation de Var(F)

27 Utilisation de la Proc CATMOD Réponse = Identité
data goitre; input village sexe jour iode goitre freq; cards; . ; proc catmod data=goitre; weight freq; response marginal; model goitre=village sexe village*sexe iode(village=2) iode(village=3) iode(village=4) sexe*iode jour(iode=1) jour(iode=2)/predict addcell=1 ; run; quit;

28 Utilisation de la Proc CATMOD
Population Profiles Adjusted Sample village sexe iode jour Sample Size ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ

29 Utilisation de la Proc CATMOD Réponse = Identité
Response Functions Sample ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ

30 Utilisation de la Proc CATMOD La matrice X
Design Matrix Sample ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ

31 Utilisation de la Proc CATMOD Estimation des paramètres
Analysis of Weighted Least Squares Estimates Function Standard Chi- Parameter Number Estimate Error Square Pr > ChiSq ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ Intercept <.0001 <.0001 <.0001 village <.0001 <.0001 sexe <.0001 <.0001 village*sexe <.0001

32 Utilisation de la Proc CATMOD Estimation des paramètres
Function Standard Chi- Parameter Number Estimate Error Square Pr > ChiSq ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ iode(village=2) <.0001 <.0001 iode(village=3) iode(village=4) <.0001 <.0001 sexe*iode jour(iode=1) <.0001 jour(iode=2) <.0001 <.0001 jour(iode=2)

33 Exemple : Calcul de p11 = (106+1)/(175+4) =

34 Comparaison observé /prédit
Predicted Values for Response Functions ------Observed Predicted----- Function Standard Standard village sexe iode jour Number Function Error Function Error Residual ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ .

35 Test sur les variables explicatives Exemple : Village*Sexe
H0 : 5h = 6h = 7h = 0, h = 1, 2, 3 Statistique de Wald : Sous H0 : Q suit un 2(9) Remarque : Q = SCR(Modèle sans « Village*Sexe ») - SCR(Modèle complet) Analogie avec les sommes de carrés de type III du GLM

36 Test sur les variables explicatives Résultats
Analysis of Variance Source DF Chi-Square Pr > ChiSq ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ Intercept <.0001 village <.0001 sexe <.0001 village*sexe iode(village=2) <.0001 iode(village=3) <.0001 iode(village=4) <.0001 sexe*iode <.0001 jour(iode=1) <.0001 jour(iode=2) * <.0001 Residual NOTE: Effects marked with '*' contain one or more redundant or restricted parameters

37 Test d ’adéquation du modèle
H0 : Modèle étudié exact Statistique : Sous H0 : n = Nombre de fonctions de réponses = 324 = 72 d = Nombre de paramètres du modèle = 315 = 45

38 Modélisation de Fh(i) = Log(ih/ir)
on peut déduire le modèle

39 Calcul de ih Soit : xi = Caractéristique du profil i h = vecteur des jh Alors : et

40 Estimation des par maximum de vraisemblance
Multinomiale : Modèle : Vraisemblance : On recherche  maximisant la vraisemblance.

41 Le modèle saturé Si le nombre de paramètres indépendant jh est égal au nombre de probabilités indépendantes ih le modèle est dit saturé. Alors : et on a :

42 Test d ’adéquation du modèle
H0 : Modèle étudié exact Statistique : Sous H0 : où : n = Nombre de fonctions de réponses = 324 = 72 d = Nombre de paramètres du modèle = 315 = 45

43 Test sur les variables explicatives Exemple : Village*Sexe
H0 : 5h = 6h = 7h = 0, h = 1, 2, 3 Statistique LRT : Sous H0 : D suit un 2(9)

44 Modélisation du logit généralisé par maximum de vraisemblance
proc catmod data=goitre; weight freq; model goitre=village sexe village*sexe iode(village=2) iode(village=3) iode(village=4) sexe*iode jour(iode=1) jour(iode=2); run; quit; Le logit généralisé est la fonction de réponse par défaut.

45 Résultat des tests pour la modélisation du logit généralisé par maximum de vraisemblance
Maximum Likelihood Analysis of Variance Source DF Chi-Square Pr > ChiSq ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ Intercept <.0001 village <.0001 sexe <.0001 village*sexe iode(village=2) <.0001 iode(village=3) <.0001 iode(village=4) <.0001 sexe*iode jour(iode=1) <.0001 jour(iode=2) * <.0001 Likelihood Ratio NOTE: Effects marked with '*' contain one or more redundant or restricted parameters.

46 Étude du modèle « Moyenne »

47 Étude du modèle « Moyenne »
proc catmod data=goitre; weight freq; response mean; model goitre=village sexe village*sexe iode(village=2) iode(village=3) iode(village=4) sexe*iode jour(iode=1) jour(iode=2) /predict addcell=1; run;

48 Résultats SAS pour le modèle « Moyenne » Tests
Analysis of Variance Source DF Chi-Square Pr > ChiSq ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ Intercept <.0001 village <.0001 sexe <.0001 village*sexe iode(village=2) <.0001 iode(village=3) <.0001 iode(village=4) <.0001 sexe*iode jour(iode=1) jour(iode=2) * Residual NOTE: Effects marked with '*' contain one or more redundant or restricted parameters.

49 Résultats SAS pour le modèle « Moyenne » Estimation
Analysis of Weighted Least Squares Estimates Standard Chi- Parameter Estimate Error Square Pr > ChiSq ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ Intercept <.0001 village <.0001 sexe <.0001 village*sexe iode(village=2) <.0001 iode(village=3) <.0001 iode(village=4) <.0001 sexe*iode jour(iode=1) jour(iode=2)

50 Estimation du modèle « Moyenne »

51 Résultats SAS pour le modèle « Moyenne » prévision
Predicted Values for Response Functions ------Observed Predicted----- Function Standard Standard village sexe iode jour Number Function Error Function Error Residual ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ

52 Étude des contrastes Modèle : [F1(i),…,Fr(i)] = xi Test : H0 : L = 0 Statistique : Sous H0 :

53 Test 1 Solution Le niveau moyen des goitres sur toute la durée
de l ’expérimentation est significativement supérieur dans le village témoin de Sirablo par rapport aux autres villages. Solution Test Statistique de Wald On rejette H0 au profit de H1.

54 Test 2 Solution Les trois villages où le Rhodifuse Iode a été installé
sont équivalents. Solution Test Statistique de Wald On accepte H0

55 Étude du contraste « Test 2 »
proc catmod data=goitre; weight freq; response mean; model goitre = village sexe village*sexe iode(village=2) iode(village=3) iode(village=4) sexe*iode jour(iode=1) jour(iode=2) /predict addcell=1 contrast 'village test' village , village ; run; Analysis of Contrasts Contrast DF Chi-Square Pr > ChiSq ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ village test

56 Test 3 Il y a un effet « Iode » dans chaque village. Cet effet est un peu moins fort dans le village de N ’DJIBA. Solution Test Statistique de Wald On rejette H0

57 Étude du contraste « Test 3 »
proc catmod data=goitre; weight freq; response mean; model goitre=village sexe village*sexe iode(village=2) iode(village=3) iode(village=4) sexe*iode jour(iode=1) jour(iode=2)/predict addcell=1; contrast 'iode n''djiba ’ iode(village=2) 1 iode(village=3) -2 iode(village=4) 1; run; Analysis of Contrasts Contrast DF Chi-Square Pr > ChiSq ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ iode n'djiba

58 Test 4 Solution Comparaison des villages en J0. Test
Statistique de Wald On accepte l’homogénéité des 4 villages en J0.

59 Étude du contraste « Test 4 »
proc catmod data=goitre; weight freq; response mean; model goitre=village sexe village*sexe iode(village=2) iode(village=3) iode(village=4) sexe*iode jour(iode=1) jour(iode=2) /predict addcell=1; contrast 'villages j0 ’ village iode(village=2) -1, village iode(village=3) -1, village iode(village=4) -1; run; Analysis of Contrasts Contrast DF Chi-Square Pr > ChiSq ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ villages j

60 Utilisation du modèle linéaire généralisé de SPSS
régression logistique ordinale

61 Etude au temps 0

62 Etude au temps 0

63 Sur toute la période Modèle 1

64 Modèle 1

65 Modèle 2

66 Modèle 3

67 Modèle 3


Télécharger ppt "Le modèle linéaire généralisé (Réponse multinomiale)"

Présentations similaires


Annonces Google