La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Prise en compte des données avec excès de zéros Episode 2 Comment prendre en compte ?

Présentations similaires


Présentation au sujet: "Prise en compte des données avec excès de zéros Episode 2 Comment prendre en compte ?"— Transcription de la présentation:

1 Prise en compte des données avec excès de zéros Episode 2 Comment prendre en compte ?

2 Objectif Données de comptage Modèle « simple » Distribution de Poisson a priori Comment prendre en compte un excès de zéros ?

3 Les lois de probabilités discrètes Loi de Bernouilli Loi binomiale Loi géométrique … Loi de Poisson Loi Binomiale Négative

4 Loi de Poisson Loi des évènements rares Soit N le nombre dévènements rares survenus dans un intervalle de temps N est une variable aléatoire dont la distribution est une loi de Poisson E(N) = λVar(N) = λ

5 Loi Binomiale Négative « Pile-ou-face » tant que Pile n'est pas apparu k fois Nombre de Pile = k Probabilité de Pile = p ; probabilité de Face = 1-p = q Nombre de lancers = L Le nombre L de lancers nécessaires pour gagner une partie est une variable aléatoire, dont la distribution est une distribution binomiale négative. somme de variables géométriques indépendantes (nb L de lancers jusquà 1ere apparition de Pile)

6 Loi Binomiale Négative (2) « Pile-ou-face » tant que Pile n'est pas apparu k fois Probabilité de Pile = p ; probabilité de Face = 1-p = q Nombre de Face précédant le k-ième succès = F Le nombre F de Face est une variable aléatoire dont la distribution est une distribution binomiale négative. Var(F) > E(F) dun coefficient (1/p) Généralisation de la loi de Poisson ?

7 Poisson -> Bin. Nég. Loi de Poisson P(λ) Excès de zéros = surdispertion Var(λ) > E(λ) Remplacer par une Loi Bin. Nég. BN(k,p)

8 Adaptations des modèles Adaptations basés sur lexemple dune distribution de Poisson Applicable à dautres distributions (BN) 2 principes : –Probabilité de zéros plus élevées pour tous –Sous groupe de zéros, distinct des autres

9 Modèle mixte ~ P(λV) V est une variable aléatoire ~ N(1,α) E(Y) = λVar(Y) = λ + α 2

10 Modèles ZIP (zero-inflated poisson) Pr(Y=y) = ω + (1-ω).e -µ y = 0 (1-ω).e -µ.µ y / y!y > 0 0 ω < 1 E(Y) = (1-ω).µ = λ Var(Y) = λ + (ω/(1-ω)).µ 2 Similitude avec le premier modèle ? « The second of these equations has the same form »

11 Modèles « hurdle » Analyse séparée –Proportion de zéros –Probabilité de valeurs > 0 Pr(Y=y) = π 0 y = 0 (1- π 0 ).e -µ.µ y / ((1-e -µ )y!)y > 0 Hypothèse sous jacente : π 0 et µ sont-ils indépendants ? –lun dépend de variables explicatives indépendantes de lautre –hypothèse forte

12 Modèle « birth process » Analyse séparée Période de « naissance » (zéros) Période de « croissance » (> 0) Différence dévolution entre les 2 périodes

13 En résumé Loi binomiale négative Modèles, basés sur loi P ou autres (BN) : –Modèles mixtes –Modèles ZIP –Modèles « hurdle » –Modèles « birth process » En pratique,essentiellement BN, modèles ZIP ou ZINB

14 Référence Models for count data with many zeros M. Ridout International biometric conference, Cap Town. 1998

15 Présentation dune étude Evaluating risk factors associated with severe hypoglycaemia in epidemiology studies – What method should we use ? M.K. Bulsara. Diabetic Medicine. 2004

16 Etude FR dhypoglycémie sévère Prospective 1243 enfants, de 1996 à % sans épisode sévère dhypoglycémie Surdispersion m = 0,68 var = 2,95 Modèle poissonien inadapté

17 Etude FR dhypoglycémie sévère Test statistique de surdispersion Test statistique pour le choix du modèle ZIP/P et ZINB/NB (statistique de Vuong) Test MV pour comparer ZIP/ZINB > Modèle ZINB le plus approprié

18 Etude FR dhypoglycémie sévère Comparaison des estimations –Age P,NB : RR diminue avec lâge ZIP : OR augmente avec lâge / groupe « zéros » –Sexe RR augmenté chez le garçon. NS pour modèles ZI ! OR / groupes « zéros » dans modèles ZI ? –Durée du diabète RR augmenté –Hb A1C RR diminué pour tous les modèles

19 Etude FR dhypoglycémie sévère Conclusions –Modèle Poisson inadapté –Différences non négligeables dans les estimations des paramètres –Difficultés dinterprétations des résultats

20 Aux prochains épisodes … Episode 1 – Quand prendre en compte ? Tests pour choisir le modèle Episode 3 – Avec quoi prendre en compte ? Outils et applications pratiques


Télécharger ppt "Prise en compte des données avec excès de zéros Episode 2 Comment prendre en compte ?"

Présentations similaires


Annonces Google