Probabilistic Record Linkage (PRL). Base SAMU Base hôpital Base unique Enrichissement des bases locales Combiner plusieurs ensembles de données en un.

Slides:



Advertisements
Présentations similaires
Une méthode d'analyse de l'INFORMATION
Advertisements

1. Quelle est la tension aux bornes de ce conducteur ohmique quand il est traversé par un courant d’intensité I = 0,070 A ? Tension en V. 5,0 + 4,5 + 4,0.
Atelier RBM-MERG sur la formation à lEIP, 6 au 9 octobre 2008, Dakar, Sénégal1 Observations sur l'échantillonnage, et notamment, sur l'utilisation d'un.
Diagnostic et suivi virologique de l ’infection par le VIH
Test statistique : principe
Association entre variables
ACTIVITES Les puissances de 10 (19).
5 critères de qualité d'un test
Atelier régional des Nations Unies sur lévaluation des recensements et les enquêtes post censitaires, Tunis, décembre 2009 Evaluation des erreurs.
ESPERER 95.
Répondez à ces quelques questions
Répondez à ces quelques questions
CALCUL LITTERAL 3° Avon 2010 Bernard Izard 05-LT I – NOTATIONS
1. Les caractéristiques de dispersion. 11. Utilité.
Page : 1 / 8 Conduite de projet Examen du 29 avril 2003 Durée : 3h30mn Le support de cours et les notes sont nécessaires La notation tiendra compte très.
Page : 1 / 6 Conduite de projet Examen du 6 mai 1999 Durée : 4 heures Le support de cours est toléré La notation tiendra compte très significativement.
Évaluation des traitements ARV de seconde ligne en Afrique et en Asie Pujades-Rodríguez M. Epicentre, Paris.
TP n°2 PHP FONCTIONS ET FORMULAIRE
Cest parti ! 4x 28 x 25 Levez la tête ! 3 x 0 x 18.
Estimation de la survie comparaison des courbes de survie FRT C3.
1 Efficient Data and Program Integration Using Binding Patterns Ioana Manolescu, Luc Bouganim, Francoise Fabret, Eric Simon INRIA.
Le Fscore est-il une critère pertinent pour évaluer la terminologie ?
La loi normale et l’estimation de paramètres
Enquête de satisfaction des patients CIC.
Algorithmique -les fichiers-
Les fonctions.
Le statut de l’indépendant par rapport à celui du salarié
Présentation: NGOK Emmanuel Expert en comptabilité nationale AFRISTAT
L’amortissement linéaire
Modèle de correction de données en assurance vie
JLMVPC Saisir une commande.
Les requêtes La Requête est une méthode pour afficher les enregistrements qui répondent à des conditions spécifiques. La requête est donc un filtre.
Développeurs : Frank SACCO Fabrice BRUCHON.
Autres LOIS de PROBABILITES
Économie pour les ingénieurs
15. 1 MILLION $ $ $ $ $ $ $ $ $ $ 04.
Zone de rejet et scoring
SUJET D’ENTRAINEMENT n°3
Méthodes de Biostatistique
Présentation générale
L’inférence statistique
CALCUL MENTAL diviseurs d’un nombre. P.G.C.D. de deux nombres.
Initiation à La comptabilité de gestion
Régression linéaire simple
Initiation à La comptabilité de gestion
1.Un rang de données multicolores 2. Deux permutations des n premiers entiers 3. b permutations des k premiers entiers 4. Choix de n points dans [0,1]
Corrélation Principe fondamental d’une analyse de corrélation
Dépannage du 12 mars 2007.
Loutil statistique les mesures de tendance centrale Auto-évaluation.
La fonction inversement proportionnelle
Et NOMBRES TRIANGLE Exemple: = 10
Estimation de la valeur génétique du Pur-Sang Anglais en République Tchèque Franey Anne Frisée Vincent Vanloocke Denis.
Les mesures de dispersion Camp de jour Âges Groupe 1: 7,8,9,10,11,12,13 Âges Groupe 2: 10,10,10,10,10,10,10 Caractériser ces groupes par 1 seule mesure.
Combat des valeurs. Quelle est la valeur de : 18 unités 18.
Demande stochastique stationnaire
Carte d’identité: Le Lycée rené descartes
Distributions de probabilité discrètes
(analyse en modèle de Cox multivarié - HR [IC95])
Structures des données
SUJET D’ENTRAINEMENT n°1
On cherche des renseignements sur p.
SOMMAIRE CHAPITRE 01_ LES ENJEUX D’UNE BONNE IDENTIFICATION DES SALARIÉS CHAPITRE 02_ DÉFINITION D’UNE IDENTIFICATION FIABLE CHAPITRE 03_ COMPOSITION DU.
Comment construire un graphique ?
Conséquences d’une variation de la mesure de la clarté nucale
01. Liste des noms de candidats avec leur date de naissance.
application à la chimiothérapie
Annexe 2.1 Présentation du justificatif d’impôt sur le revenu et du service de vérification en ligne.
PRESENTATION SUCCINCTE DE GESTHAND
An efficient validation method of Probabilistic Record Linkage including readmissions and twins M. Tromp, A.C.J. Ravelli et al. Methods Inf Med 2008; 47.
Statistiques: mesures de liaisons tests d’hypothèse
Transcription de la présentation:

Probabilistic Record Linkage (PRL)

Base SAMU Base hôpital Base unique Enrichissement des bases locales Combiner plusieurs ensembles de données en un seul RL : objectif

Marie Dupond F 05/05/44 18/11/08 fracture fémur,... Données SAMU Marie Dupond F 05/05/45 18/11/08 cim10 ccam Données hôpital Utiliser des propriétés statistiques des variables communes (nom, prénom...) pour calculer la probabilité que 2 enregistrements concernent le même patient. PRL : méthode

Pour une variable Deux propriétés statistiques Fiabilité Pouvoir discriminant Pour calculer la cote d'un appariement

PRL : fiabilité probabilité d'agrément sur un appariement. (# sensibilité) F = 1 – taux d'erreur taux d'erreur : déterminé à partir d'une analyse manuelle des données ou de recherches précédentes (erreurs de saisie) Ex: variable = nom de famille taux erreur = 5% nom SAMU = nom hospfiabilité F = 0.95 nom SAMU nom hospfiabilité 1- F = 0.05

PRL : pouvoir discriminant probabilité d'un agrément sur un non appariement. P = 1 / nombre valeurs possibles Ex : Variable = mois de naissance (en chiffres) 12 valeurs possibles mois SAMU = mois hospP = 1 / 12 = mois SAMU mois hospP = 0.917

PRL : fiabilité x pouvoir discriminant Mois de naissance 12 valeurs possibles Taux d'erreur = 5% 2 possibilités : agrément mois SAMU = mois hosp :1 mois SAMU mois hosp :18

PRL : en pratique SAMU Hôpital Si 1 enregistrement de la base hôpital s'apparie à 1(et 1 seul) enregistrement de la base SAMU qui contient enregistrements : Cote d'appariement de 2 enregistrements = 1 contre

PRL : agrément sur le prénom F = 0.90 P = 0.01 prénoms identiques : agrément sur le prénom = 90:1 Cote d'appariement = 1 / x 90/1 = 1 contre Marie Dupond F 05/05/44 18/11/08 fracture fémur,... Données SAMU Marie Dupond F 05/05/45 18/11/08 cim10 ccam Données hôpital

PRL : agrément sur le nom F = 0.90 P = noms identiques : agrément sur le nom = 22:1 Cote d'appariement = 1 / x 22 / 1 = 1 contre 51 Marie Dupond F 05/05/44 18/11/08 fracture fémur,... Données SAMU Marie Dupond F 05/05/45 18/11/08 cim10 ccam Données hôpital

PRL : agrément sur le sexe F = 0.99 P = 0.5 sexes identiques ratio : agrément sur le sex = 2 : 1 Cote d'appariement = 1 / 51 x 2 / 1 = 1 contre 25

PRL : agrément sur la date de naissance Jour : F = 0.99P = 0.03 (1/30) jours identiques : agrément sur le jour = 30 : 1 Mois : F = 0.99P = 0.08 (1/12) mois identiques : agrément sur le mois = 12 : 1 Année : F = 0.99P = 0.01 années différentes agrément sur lannée = 0.01 / 0.99 = 1 : 99 Cote d'appariement = 1 / 25 x 4 = 1 contre 6

PRL : validation Sensibilité Spécificité Courbes ROC Valeurs seuils

PRL : agrément sur 2 enregistrements Cote = 1 contre 6 3 classes en fonction de valeurs seuils Cote > S1appariement oui Cote < S2appariement non - S2 < cote < S1 appariement ?