La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

1 Modèle Linéaire Généralisé (Proc Genmod) Michel Tenenhaus.

Présentations similaires


Présentation au sujet: "1 Modèle Linéaire Généralisé (Proc Genmod) Michel Tenenhaus."— Transcription de la présentation:

1 1 Modèle Linéaire Généralisé (Proc Genmod) Michel Tenenhaus

2 2 I.Les données Y = Variable à expliquer X 1,…, X p = Variables explicatives

3 3 II.La famille exponentielle Loi de Y -Les fonctions a, b, c sont fixées. - est un paramètre de dispersion ou « nuisance parameter ». -a( ) = pour des données individuelles, = /w pour des données groupées (w = effectif du groupe)

4 4 Résultats 1. = E(Y) = b´( ) 2.Dans la pratique b´( ) est monotone : 3.Var(Y) = a( )b ( ) 4. b ( ) = b (g c ( )) = ( ) = g c ( ) g c est la fonction de lien canonique. Var(Y) = a( ) ( ) ( ) est la fonction-variance.

5 5 1. Loi de Poisson De : on déduit : = Log( ), b( ) =, a( ) = 1 Doù : E(Y) = Var(Y) =

6 6 2. Loi binomiale De : on déduit : Doù : E(Y) = et Var(Y) = (1 - )/m

7 7 3. Loi normale De : on déduit : Doù : E(Y) = et Var(Y) = 2

8 8 4. Loi gamma De : on déduit : Doù : E(Y) =, Var(Y) = 2 /, et CV =

9 9 5. Loi de Gauss inverse De : on déduit : Doù : E(Y) =, Var(Y) = 3 2, et CV =

10 10 III.Fonction de lien canonique De on déduit :

11 11 Autres fonctions de lien usuelles Complementary Log Log Power Probit

12 12 IV.Le modèle Linéaire Généralisé Les données -Individuelles : (y i, x 1i,…, x pi ), i = 1,…, n -Groupées :, i = 1,…, n Loi de Y i Le modèle Généralisation au niveau de la fonction de réponse (g( i ) au lieu de i, et au niveau de la loi de Y i (famille exponentielle au lieu de la loi normale).

13 13 Estimation des j par maximum de vraisemblance La loi de Y i peut sécrire en fonction de 1,…, p en remplaçant i par : puisque.

14 14 Résultats de la maximisation de la vraisemblance De on déduit : À maximiser sur et éventuellement sur. D où : puisque.

15 15 « Estimating Equations » On définit la log-vraisemblance On obtient en annulant le vecteur Score. avec. i

16 16 Déviance normalisée D * (Scaled deviance) Modèle étudié : Modèle saturé : Déviance normalisée : si le modèle étudié est exact (approximation médiocre). puisque.

17 17 Déviance D des lois standards La déviance D est égale à D * Une fois fixé, le maximum de vraisemblance conduit à minimiser la déviance D.

18 18 Étude de Loi de Intervalle de confiance de (Wald)

19 19 Intervalle de confiance de « Profile likelihood function » Intervalle de confiance de

20 20 Intervalle de confiance de i De : on déduit lintervalle de i à 95% :

21 21 Test de l hypothèse linéaire générale H 0 : L´ = 0 WALD suit un 2 (rang L) sous lhypothèse H 0. LRT (Likelihood Ratio Test) suit un 2 (rang L) sous lhypothèse H 0. LRT est meilleur que Wald

22 22 Analyse des résidus Résidu observé Résidu-Pearson Résidu-déviance

23 23 Les résidus normalisés Résidu-vraisemblance normalisé Les résidu-Pearson et résidu-déviance sont normalisés en les divisant par leurs écarts-types. où r Pi * et r Di * sont les résidu-Pearson et résidu-déviance normalisés, et h i le levier de lobservation i. Les résidus normalisés peuvent être comparés à 2.

24 24 Estimation du paramètre de dispersion pour les lois binomiale et Poisson théorique = 1 ~ 2 (n-p) E(D) = E( P 2 ) = n - p (p = nombre de paramètres)

25 25 Estimation du paramètre de dispersion pour les lois normales, Gamma et Gauss inverse Les paramètres 1,…, p et sont estimés par maximum de vraisemblance.

26 26 La sur-dispersion dans les modèles Poisson et Binomiale ( ) Réponse Y i Poisson ou Binomiale Poisson :Var(Y i ) = i Binomiale : Var(Y i ) = i (1- i ) Matrice dinformation de Fisher : Loi de : N(,J -1 )

27 27 Prise en compte de la sur-dispersion Approche WALD Poisson :Var(Y i ) = Binomiale : Var(Y i ) = J divisé par J -1 multiplié par ~ N(, J -1 ) Var( ) est multipliée par Résultats moins significatifs

28 28 Prise en compte de la sur-dispersion Approche LRT Loi de Y i : Poisson et Binomiale : a( ) = 1 Pour prendre en compte la sur-dispersion on pose a( ) = Les tests LRT sont divisés par. Les résultats sont moins significatifs.

29 29 Exemple Mélanome

30 30 Exemple Mélanome Y i = n i = Nombre de cas observés parmi N i personnes soumises au risque Modèle 1 Y i ~ Poisson ( i ) avec : Log( i ) = Log(N i ) (Age<35) + … + 11 (Age(65-74)*Nord)

31 31 Exemple Mélanome : Code SAS pour le Modèle 1 data melanome; input id $ age $ region $ cas pop; logpop=log(pop); cards; n,<35 <35 n s,<35 <35 s n,>74 >74 n s,>74 >74 s ; proc genmod data=melanome order=data; class age region; model cas=age region age*region /dist=poisson link=log offset=logpop type3 ; run;

32 32 Exemple Mélanome : Résultat pour le Modèle 1 Criteria For Assessing Goodness Of Fit Criterion DF Value Value/DF Deviance Scaled Deviance Pearson Chi-Square Scaled Pearson X Log Likelihood LR Statistics For Type 3 Analysis Chi- Source DF Square Pr > ChiSq age <.0001 region <.0001 age*region

33 33 Exemple Mélanome : Modèle 2 Y i ~ Poisson ( i ) avec :

34 34 Exemple Mélanome : résultat du Modèle 2 Criteria For Assessing Goodness Of Fit Criterion DF Value Value/DF Deviance Scaled Deviance Pearson Chi-Square Scaled Pearson X Log Likelihood LR Statistics For Type 3 Analysis Chi- Source DF Square Pr > ChiSq age <.0001 region <.0001

35 35 Exemple Mélanome : résultat du Modèle 2 Analysis Of Parameter Estimates Standard Wald 95% Parameter DF Estimate Error Confidence Limits Intercept age < age age age age age > region n region s Scale Chi- Parameter Square Pr > ChiSq Intercept <.0001 age < <.0001 age <.0001 age <.0001 age <.0001 age <.0001 age >74.. region n <.0001 region s.. Scale NOTE: The scale parameter was held fixed.

36 36 Exemple Mélanome : Contrastes proc genmod data=melanome order=data; class age region; model cas=age region/dist=poisson link=log offset=logpop type3 ; contrast '35-44 vs 45-54' age ; contrast '55-64 vs 65-74' age ; contrast '35-44 vs 45-54' age / wald; contrast '55-64 vs 65-74' age / wald; run; Test « vs » : H 0 : 2 = 3 Test « vs » : H 0 : 4 = 5

37 37 Exemple Mélanome : Contrastes Contrast Results Chi- Contrast DF Square Pr > ChiSq Type vs LR vs LR vs Wald vs Wald Conclusion : On peut simplifier le modèle.

38 38 Exemple Mélanome : Modèle 3 Y i ~ Poisson ( i ) avec :

39 39 Exemple Mélanome : Estimation du modèle 3 data b; set melanome; age1=(age = "<35"); age2=(age = "35-44") or (age="45-54"); age3=(age = "55-64") or (age="65-74"); proc genmod data=b order=data; class region; model cas=age1 age2 age3 region/dist=poisson link=log offset=logpop type3; contrast 'age' age1 1, age2 1, age3 1 /e; contrast 'age' age1 1, age2 1, age3 1 / wald; run;

40 40 Exemple Mélanome : Estimation du modèle 3 Criteria For Assessing Goodness Of Fit Criterion DF Value Value/DF Deviance Scaled Deviance Pearson Chi-Square Scaled Pearson X Log Likelihood Analysis Of Parameter Estimates Likelihood Ratio Standard 95% Confidence Parameter DF Estimate Error Limits Intercept age age age region n region s

41 41 Exemple Mélanome : Estimation du modèle 3 Contrast Results Chi- Contrast DF Square Pr > ChiSq Type age <.0001 LR age <.0001 Wald Analysis Of Parameter Estimates Chi- Parameter Square Pr > ChiSq Intercept <.0001 age <.0001 age <.0001 age <.0001 region n <.0001 region s..

42 42 Exemple Mélanome : Modèle 4 Y i ~ Binomiale (N i, p i ) N i grand et p i petit impliquent : Y i Poisson ( i = N i p i ) Doù le modèle Y i ~ Binomiale (N i, p i ) avec :

43 43 Exemple Mélanome : Estimation du modèle 4 proc genmod data=b order=data; class region; model cas/pop=age1 age2 age3 region/dist=bin link=log type3; contrast 'age' age1 1, age2 1, age3 1; run;

44 44 Exemple Mélanome : Estimation du modèle 4 Criteria For Assessing Goodness Of Fit Criterion DF Value Value/DF Deviance Scaled Deviance Pearson Chi-Square Scaled Pearson X Log Likelihood Analysis Of Parameter Estimates Standard Wald 95% Confidence Parameter DF Estimate Error Limits Intercept age age age region n region s

45 45 Exemple Mélanome : Estimation du modèle 4 Analysis Of Parameter Estimates Chi- Parameter Square Pr > ChiSq Intercept <.0001 age <.0001 age <.0001 age <.0001 region n <.0001 region s.. Contrast Results Chi- Contrast DF Square Pr > ChiSq Type age <.0001 LR

46 46 Exemple Mélanome : Modèle 5 Y i ~ Binomiale (N i, p i ) Comme la probabilité p i est petite : D où le modèle Y i ~ Binomiale (N i, p i ) avec : Régression de Poisson = régression logistique lorsque p i est petit et N i est grand.

47 47 Exemple Mélanome : Estimation du modèle 5 proc genmod data=b order=data; class region; model cas/pop=age1 age2 age3 region/dist=bin link=logit type3; contrast 'age' age1 1, age2 1, age3 1; run;

48 48 Exemple Mélanome : Estimation du modèle 5 Criteria For Assessing Goodness Of Fit Criterion DF Value Value/DF Deviance Scaled Deviance Pearson Chi-Square Scaled Pearson X Log Likelihood Analysis Of Parameter Estimates Standard Wald 95% Confidence Parameter DF Estimate Error Limits Intercept age age age region n region s

49 49 Exemple Mélanome : Estimation du modèle 5 Analysis Of Parameter Estimates Chi- Parameter Square Pr > ChiSq Intercept <.0001 age <.0001 age <.0001 age <.0001 region n <.0001 region s.. Contrast Results Chi- Contrast DF Square Pr > ChiSq Type age <.0001 LR

50 50 Exemple Coléoptères Y i = n i = Nombre de morts parmi N i coléoptères soumis au risque à la dose x i de disulfide de carbone

51 51 Les modèles Loi de Y i : Binomiale (N i, p i ) Fonction de lien g(p i ) : - Logit :Log(p i /(1-p i )) - Probit : Fractile dordre p i dune loi normale réduite - Complementary Log Log : Log(-Log(1-p i )) Modèle : g(p i ) = x i

52 52 Résultats : Modèle Logit Criteria For Assessing Goodness Of Fit Criterion DF Value Value/DF Deviance Scaled Deviance Pearson Chi-Square Scaled Pearson X Log Likelihood Algorithm converged. Analysis Of Parameter Estimates Standard Wald 95% Chi- Parameter DF Estimate Error Confidence Limits Square Pr > ChiSq Intercept <.0001 dose <.0001 Scale NOTE: The scale parameter was held fixed.

53 53 Résultats : Modèle Probit Criteria For Assessing Goodness Of Fit Criterion DF Value Value/DF Deviance Scaled Deviance Pearson Chi-Square Scaled Pearson X Log Likelihood Algorithm converged. Analysis Of Parameter Estimates Standard Wald 95% Chi- Parameter DF Estimate Error Confidence Limits Square Pr > ChiSq Intercept <.0001 dose <.0001 Scale NOTE: The scale parameter was held fixed.

54 54 Résultats : Modèle Cloglog Criteria For Assessing Goodness Of Fit Criterion DF Value Value/DF Deviance Scaled Deviance Pearson Chi-Square Scaled Pearson X Log Likelihood Algorithm converged. Analysis Of Parameter Estimates Standard Wald 95% Chi- Parameter DF Estimate Error Confidence Limits Square Pr > ChiSq Intercept <.0001 dose <.0001 Scale NOTE: The scale parameter was held fixed.

55 55 Comparaison des modèles

56 56 Comparaison des modèles

57 57 Exemple SIDA Y i = Nombre de morts du Sida par trimestre de 83 à 86 en Australie

58 58 Les modèles Loi de Y i : Poisson ( i ) Fonction de lien :g( i ) = Log( i ) Modèles : Log( i ) = x i avec : (1) = 1 (2) = Deviance / (n-p)

59 59 Résultats : = 1 Criteria For Assessing Goodness Of Fit Criterion DF Value Value/DF Deviance Scaled Deviance Pearson Chi-Square Scaled Pearson X Log Likelihood Algorithm converged. Analysis Of Parameter Estimates Standard Wald 95% Chi- Parameter DF Estimate Error Confidence Limits Square Pr > ChiSq Intercept lquarter <.0001 Scale NOTE: The scale parameter was held fixed.

60 60 Analyse des résidus ( = 1) Obs lquarter deaths Pred

61 61 Analyse des résidus ( = 1) Obs Stresdev Streschi Reslik

62 62 Résultats : = Deviance/(n-p) Criteria For Assessing Goodness Of Fit Criterion DF Value Value/DF Deviance Scaled Deviance Pearson Chi-Square Scaled Pearson X Log Likelihood Algorithm converged. Analysis Of Parameter Estimates Standard Wald 95% Chi- Parameter DF Estimate Error Confidence Limits Square Pr > ChiSq Intercept lquarter <.0001 Scale NOTE: The scale parameter was estimated by the square root of DEVIANCE/DOF

63 63 Analyse des résidus ( = Deviance/(n-p)) Obs Stresdev Streschi Reslik

64 64 Prévision du nombre de morts du sida en Australie observation 10

65 65 Exemple LEUCÉMIE Y i = Durée de vie entre le diagnostic et le décès en semaines X i = Log 10 (Nombre de globules blanc initial)

66 66 Les modèles Loi de Y i : (1)Loi gamma (2)Loi exponentielle (= gamma avec = 1) Fonction de lien :g( i ) = Log( i ) Modèle : Log( i ) = x i

67 67 Résultat (Loi gamma) Criteria For Assessing Goodness Of Fit Criterion DF Value Value/DF Deviance Scaled Deviance Pearson Chi-Square Scaled Pearson X Log Likelihood Algorithm converged. Analysis Of Parameter Estimates Standard Wald 95% Chi- Parameter DF Estimate Error Confidence Limits Square Pr > ChiSq Intercept <.0001 logcount Scale NOTE: The scale parameter was estimated by maximum likelihood.

68 68 Résultat (Loi exponentielle) Criteria For Assessing Goodness Of Fit Criterion DF Value Value/DF Deviance Scaled Deviance Pearson Chi-Square Scaled Pearson X Log Likelihood Algorithm converged. Analysis Of Parameter Estimates Standard Wald 95% Chi- Parameter DF Estimate Error Confidence Limits Square Pr > ChiSq Intercept <.0001 logcount Scale NOTE: The scale parameter was held fixed.

69 69 Modélisation Leucémie


Télécharger ppt "1 Modèle Linéaire Généralisé (Proc Genmod) Michel Tenenhaus."

Présentations similaires


Annonces Google