La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Prise en compte des données avec excès de zéros

Présentations similaires


Présentation au sujet: "Prise en compte des données avec excès de zéros"— Transcription de la présentation:

1 Prise en compte des données avec excès de zéros
Episode 2 Comment prendre en compte ?

2 Comment prendre en compte un excès de zéros ?
Objectif Données de comptage Modèle « simple » Distribution de Poisson a priori Comment prendre en compte un excès de zéros ?

3 Les lois de probabilités discrètes
Loi de Bernouilli Loi binomiale Loi géométrique Loi de Poisson Loi Binomiale Négative

4 Loi de Poisson Loi des évènements rares
Soit N le nombre d’évènements rares survenus dans un intervalle de temps N est une variable aléatoire dont la distribution est une loi de Poisson E(N) = λ Var(N) = λ

5 Loi Binomiale Négative
« Pile-ou-face » tant que Pile n'est pas apparu k fois Nombre de Pile = k Probabilité de Pile = p ; probabilité de Face = 1-p = q Nombre de lancers = L Le nombre L de lancers nécessaires pour gagner une partie est une variable aléatoire, dont la distribution est une distribution binomiale négative. somme de variables géométriques indépendantes (nb L de lancers jusqu’à 1ere apparition de Pile)

6 Loi Binomiale Négative (2)
« Pile-ou-face » tant que Pile n'est pas apparu k fois Probabilité de Pile = p ; probabilité de Face = 1-p = q Nombre de Face précédant le k-ième succès = F Le nombre F de Face est une variable aléatoire dont la distribution est une distribution binomiale négative. Var(F) > E(F) d’un coefficient (1/p) Généralisation de la loi de Poisson ?

7 Poisson -> Bin. Nég. Loi de Poisson P(λ)
Excès de zéros = surdispertion Var(λ) > E(λ) Remplacer par une Loi Bin. Nég. BN(k,p)

8 Adaptations des modèles
Adaptations basés sur l’exemple d’une distribution de Poisson Applicable à d’autres distributions (BN) 2 principes : Probabilité de zéros plus élevées pour tous Sous groupe de zéros, distinct des autres

9 Modèle mixte ~ P(λV) V est une variable aléatoire ~ N(1,α)
E(Y) = λ Var(Y) = λ + α2

10 Modèles ZIP (zero-inflated poisson)
Pr(Y=y) = ω + (1-ω).e-µ y = 0 (1-ω).e-µ.µy / y! y > 0 0 ≤ ω < 1 E(Y) = (1-ω).µ = λ Var(Y) = λ + (ω/(1-ω)).µ2 Similitude avec le premier modèle ? « The second of these equations has the same form »

11 Modèles « hurdle » Analyse séparée Proportion de zéros
Probabilité de valeurs > 0 Pr(Y=y) = π y = 0 (1- π0).e-µ.µy / ((1-e-µ)y!) y > 0 Hypothèse sous jacente : π0 et µ sont-ils indépendants ? l’un dépend de variables explicatives indépendantes de l’autre hypothèse forte

12 Modèle « birth process »
Analyse séparée Période de « naissance » (zéros) Période de « croissance » (> 0) Différence d’évolution entre les 2 périodes

13 En résumé Loi binomiale négative
Modèles, basés sur loi P ou autres (BN) : Modèles mixtes Modèles ZIP Modèles « hurdle » Modèles « birth process » En pratique,essentiellement BN, modèles ZIP ou ZINB

14 Référence Models for count data with many zeros M. Ridout
International biometric conference, Cap Town

15 Présentation d’une étude
Evaluating risk factors associated with severe hypoglycaemia in epidemiology studies – What method should we use ? M.K. Bulsara. Diabetic Medicine. 2004

16 Etude FR d’hypoglycémie sévère
Prospective 1243 enfants, de 1996 à 2000 73% sans épisode sévère d’hypoglycémie Surdispersion m = 0,68 var = 2,95 Modèle poissonien inadapté

17 Etude FR d’hypoglycémie sévère
Test statistique de surdispersion Test statistique pour le choix du modèle ZIP/P et ZINB/NB (statistique de Vuong) Test MV pour comparer ZIP/ZINB > Modèle ZINB le plus approprié

18 Etude FR d’hypoglycémie sévère
Comparaison des estimations Age P,NB : RR diminue avec l’âge ZIP : OR augmente avec l’âge / groupe « zéros » Sexe RR augmenté chez le garçon. NS pour modèles ZI ! OR / groupes « zéros » dans modèles ZI ? Durée du diabète RR augmenté HbA1C RR diminué pour tous les modèles

19 Etude FR d’hypoglycémie sévère
Conclusions Modèle Poisson inadapté Différences non négligeables dans les estimations des paramètres Difficultés d’interprétations des résultats

20 Aux prochains épisodes …
Episode 1 – Quand prendre en compte ? Tests pour choisir le modèle Episode 3 – Avec quoi prendre en compte ? Outils et applications pratiques


Télécharger ppt "Prise en compte des données avec excès de zéros"

Présentations similaires


Annonces Google