Modèles de prédiction Intérêt de la validation

Slides:



Advertisements
Présentations similaires
Primary French Presentation 2 Saying How You Are.
Advertisements

Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako,
Mission X Superfli Emily Roberts Cette présentation sera écrit en français avec sous-titres anglais violet de couleur. This presentation will be written.
Most Probable Number (MPN)
How to solve biological problems with math Mars 2012.
Girls and Boys, Women and Men - respecting differences, promoting equality and sharing responsibility Filles et garçons, femmes et hommes - respecter les.
Échantillonnage de l'eau et des facteurs connexes pour mesurer les caractéristiques physiques, chimiques et microbiologiques de l'eau de surface et des.
Laboratoire de Bioinformatique des Génomes et des Réseaux Université Libre de Bruxelles, Belgique Introduction Statistics.
Cooling towers: legal requirements for annual maintenance, draining and cleaning.
Les Expressions Négatives
Ce document est la propriété d ’EADS CCR ; il ne peut être communiqué à des tiers et/ou reproduit sans l’autorisation préalable écrite d ’EADS CCR et son.
Information Theory and Radar Waveform Design Mark R. bell September 1993 Sofia FENNI.
Comment poser et répondre aux questions
© Copyright Showeet.com S OCIAL M EDIA T HINKING.
1. THE RELATIVE PRONOUN “QUI”. The relative pronoun qui is a subject pronoun. It may refer to people or things, and corresponds to the English pronouns.
Laboratoire des outils informatiques pour la conception et la production en mécanique (LICP) ÉCOLE POLYTECHNIQUE FÉDÉRALE DE LAUSANNE 1 Petri nets for.
Évaluation des programmes de premier cycle/Evaluation of undergraduate programs Université d’Ottawa/ University of Ottawa 1 Auto-evaluation Report Objectives.
Les normes: Communication 1.2 Comparisons 4.1 Les questions essentielles: 1. What do the expressions depuis, il y a... que, voilà... que, ça fait... que.
Les acteurs du suivi gynécologique, une interdisciplinarité nécessaire ou imposée ?Le point de vue de l’U Pr. A.Gompel Unité Gynécologie Endocrinienne,
Français II Le projet – Le voyage en France.   You are writing a travel/photo journal in order to keep track of your great trip to the cities of France.
"Utilisation des outils hydrogéochimiques, isotopiques et hydrodynamiques pour appréhender le fonctionnement des aquifères de la région de Mogher Al Mer.
Modèles et observations Confidence in the validity of a finding is based on the type, amount, quality, and consistency of evidence (e.g., data, mechanistic.
Objectif: Comment employer un exposant?. Objective: How to use an exponent?
Les verbes réfléchis Les normes: Communication 1.2 Comparisions 4.1
THE ADJECTIVES: BEAU, NOUVEAU AND VIEUX 1.
Questions: -W-W-W-What are their main tasks? - What skills should laboratory technicians have? (quote at least 6) -W-W-W-Why is it important for a lab.
FREE HEALTH CARE AND RISK OF MORTALITY ON UNDER 5 YEARS OLD CHILDREEN IN BURKINA FASO : EVIDENCE FROM SAPONE HDSS By Malik LANKOANDE Msc Demography Projet.
Concepts fondamentaux: statistiques et distributions
Unité 2 La vie courante Leçon 3 Bon appétit. Thème et Objectifs Everyday life in France In this unit, you will learn how to get along in France. You will.
Year 10. Bon appetit unit. Introducing ‘en’. ‘en’ – ‘some of it’ or ‘some of them’ ‘En’ is a small but important word in French that is commonly used.
Techniques de l’eau et calcul des réseaux le calcul hydrologique proprement dit Michel Verbanck 2012.
Synthèse de structure d'entreprise SAP Best Practices.
GREDOR - GREDOR - Gestion des Réseaux Electriques de Distribution Ouverts aux Renouvelables How to plan grid investments smartly? Moulin de Beez, Namur.
Modèles d’interaction et scénarios
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :05 Asymétrie fluctuante.
Welcome everyone.
FINANCE Distribution des rentabilités Professeurr André Farber Solvay Business School Université Libre de Bruxelles.
African Centre for Statistics United Nations Economic Commission for Africa Session : Etapes de mise en oeuvre du SCN 2008 Milestones for implementation.
QUI et QUE (QU’). Un pronom relatif allows us to join deux phrases ensemble quand il y a a repetition of nouns in BOTH SENTENCES. Le commencement de.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :46 1 Régression logistique.
12 Les verbes réfléchis Les normes: Communication 1.2 Comparisions 4.1 Les questions essentielles: 1.What does a reflexive verb show? 2.How is a verb made.
University of Ottawa - Bio 4118 – Applied Biostatistics © Antoine Morin and Scott Findlay 24/07/2015 2:29 PM Bootstrap et permutations.
Département santé et recherche génésiques Department of reproductive health and research Hvh_FIAPAC2004_VIENNA_priming 1 CERVICAL PRIMING EVIDENCE FROM.
WILF: TO BE ABLE TO GIVE AN OPINION FOR LEVEL 3
Unité 6 Leçon B. Forming yes/no questions  To form a yes/no question in French in the simplest way, add a question mark at the end of the sentence, and.
FRACTURES OSTEOPOROTIQUES Antiépileptiques comme facteur de risque.
Many verbs that are irregular in the present also have irregular past participles. Therefore, no rule for formation, you need to memorize them. Each time.
Révision: p60-61 dans le cahier
Rapports équivalents Écrire, modéliser et identifier.
Fabien Plassard December 4 th European Organization for Nuclear Research ILC BDS MEETING 04/12/2014 ILC BDS MEETING Optics Design and Beam Dynamics Modeling.
E CONOMÉTRIE A PPLIQUÉE AVEC R (P ART 03) R. Aloui 2015/2016 Disponible sur
ever for This presentation requires PowerPoint XP or later.
Calcul de puissance en IRMf Réunion 2 CNF 2015/2016.
Les interrogatifs Partie E: l’inversion. DEVOIRS: page Ex. 5 (questions only) 1.À qui est-ce qu’il téléphone? 2.Avec qui est-ce qu’il étudie ?
Les interrogatifs Partie E: l’inversion. DEVOIRS: page Ex. 5 (questions only) 1.À qui est-ce qu’il téléphone? 2.Avec qui est-ce qu’il étudie ?
Echauffement: mardi, le vingt-quatre janvier, deux mille douze Translate the following sentences into French: 1. We go to the store.  Nous allons au magasin.
1 Status de l’étude de mesure d’impulsion par MCS Application aux ‘softs’ muons D. Duchesneau Situation actuelle: algorithme de base et vérification avec.
Measures of Comparative Advantage. 2 Outline 1.Defining measures 2.Some tests and examples.
UNITÉ II: LEÇON 6 PARTIE B: LES MOIS ET LA DATE. LES MOIS DE L’ANNÉE janvier January.
1 Linear Prediction. 2 Linear Prediction (Introduction) : The object of linear prediction is to estimate the output sequence from a linear combination.
PERFORMANCE One important issue in networking is the performance of the network—how good is it? We discuss quality of service, an overall measurement.
IP Multicast Text available on
Quantum Computer A New Era of Future Computing Ahmed WAFDI ??????
Statistics & Econometrics Statistics & Econometrics Statistics & Econometrics Statistics & Econometrics Statistics & Econometrics Statistics & Econometrics.
© 2004 Prentice-Hall, Inc.Chap 4-1 Basic Business Statistics (9 th Edition) Chapter 4 Basic Probability.
Basic Business Statistics, 10e © 2006 Prentice-Hall, Inc. Chap 1-1 Chapter 1 Introduction and Data Collection Basic Business Statistics 10 th Edition.
G. Peter Zhang Neurocomputing 50 (2003) 159–175 link Time series forecasting using a hybrid ARIMA and neural network model Presented by Trent Goughnour.
Author : Moustapha ALADJI PhD student in economics-University of Guyana Co-author : Paul ROSELE Chim HDR Paris 1-Pantheon Sorbonne Economics / Management.
High-Availability Linux Services And Newtork Administration Bourbita Mahdi 2016.
Definition Division of labour (or specialisation) takes place when a worker specialises in producing a good or a part of a good.
Transcription de la présentation:

Modèles de prédiction Intérêt de la validation M. Dramaix-Wilmet Département de Biostatistique

Modèle de prédiction Equation prédiction d’une variable “dépendante” à partir de plusieurs autres Modèles de régression linéaire Modèles de régression logistique Classification Autres …..

Qu’en est-il pour d’autres échantillons? Modèles de prédiction  problème!! “OPTIMISME” Le modèle “prédit” bien pour l’échantillon à partir duquel il est établi Qu’en est-il pour d’autres échantillons?

Modèles de prédiction Validation: un exemple External validation is necessary in prediction research: A clinical example S.E. Bleekera, H.A. Moll, E.W. Steyerberg, A.R.T. Donders, G. Derksen-Lubsen, D.E. Grobbee, K.G.M. Moons Journal of Clinical Epidemiology 56 (2003) 826–832

Modèles de prédiction Validation: un exemple The derivation set was comprised of 376 children with fever without apparent source, and the validation set consisted of 179 children who had been referred for the same reason (three respectively zero patients were excluded because of isolation of Haemophilus influenzae). Except for the variable pale skin, no material differences were found in the distribution of the general characteristics and the predictors between the two sets. A serious bacterial infection was present in 20% of the children in the derivation set and in 25% of the validation set.

Modèles de prédiction Validation: un exemple Strong predictors of serious bacterial infection included age above 1 year, duration of fever, changed crying pattern, nasal discharge or earache in history, ill clinical appearance, pale skin, chest-wall retractions, crepitations, and signs of pharyngitis or tonsillitis. The ROC area of this model was 0.825 (95%CI: 0.78–0.87) and the R² :32.3% (95%CI: 15.1–49.4%). Subsequently, the model was applied to the validation set to test its predictive performance. The ROC area dropped to 0.57 (95%CI: 0.47–0.67) and the R² to 2.0%.

Modèle de prédiction Crières de validation Exemple : régression logistique Performance Discrimination : capacité à différencier les “malades” des “non malades” surface ROC Calibration Concordance entre probabiltés prédites et observées ex: test de Hosmer et Lemeshow Biais: différence entre moyenne des probabiltés prédites et moyenne des probabilités observée Mesures globales Ex: R² de Nagelkerke

Modèles de prédiction Méthodes de Validation Validation interne Data splitting Cross-validation Bootstrap Validation externe Un autre échantillon

Modèles de prédiction Méthodes de Validation « Shrinkage Factor » = facteur de réduction Facteur déterminé à partir des méthodes de validation interne ci-dessus Corrige « l’optimisme » du modèle établit à partir des données Ex. : réduit coefficient de régression réduit le OR, réduit la surface ROC…

Modèles de prédiction Shrinkage factor

Modèles de prédiction Shrinkage factor

Modèles de prédiction Shrinkage factor Données: cancer du sein n=138 Événement: récurrences (76) FUP median: 83 mois Modèle de Cox 1 prédicteur=S-phase fraction HR=exp(b*X) Question: meilleur cut-point?

Modèles de prédiction Shrinkage factor Approche “ad-hoc”: Cutpoint p-value minimum Sans correction Cutpoint=10.7 pmin=0.007 b=0.863 HR=2.37 P-value “corrigée” pour tenir compte de “l’optimisme” Pcor=0.12 facteur de réduction=0.57 Bcor=0.57*0.863 HRcor=1.64

Modèles de prédiction Shrinkage factor

Modèles de prédiction Shrinkage factor

Modèles de prédiction Validation – Data splitting Simple On divise l’échantillon aléatoirement en deux morceaux “Training” “Validation” sample sample

Modèles de prédiction Validation – Data splitting Repeated data splitting On divise aléatoirement l’échantillon en deux morceaux « training sample » et « validation sample » On répète un grand nombre de fois la procédure On analyse la distribution des statistiques étudiées

Modèles de prédiction Validation – Data splitting STATISTICA, anno LXIII, n. 2, 2003 MODEL PERFORMANCE ANALYSIS AND MODEL VALIDATION IN LOGISTIC REGRESSION R. Arboretti Giancristofaro, L. Salmaso

Modèles de prédiction Validation – Data splitting i) Data-splitting The original sample is randomly split into the fitting and validation samples. ii) Model fitting The model is fitted on the fitting sample using the SAS logistic procedure. iii) Event probability estimation We use the fitted model to estimate the probability of a positive outcome for each of the subjects in both the fitting and the validation samples.

Modèles de prédiction Validation – Data splitting iv) Computation of performance measures on both samples For both the fitting and the validation samples we compute the following statistics: - C statistic (measure of discrimination); - Hosmer and Lemeshow chi-squared test (measure of calibration); - bias (measure of calibration). v) Iterations and full model In order for a model to be validated, the above described procedure is repeated 100 times. After that we also fit the model on the full original sample.

Modèles de prédiction Validation – Data splitting vi) Results Each time the procedure is repeated the sample is split into two random portions, the model is fitted on one of the two portions, and its performance is evaluated on both portions. Since each iteration is based on a different split of the original data, it results in different model coefficients, significance levels, and performance values. vii) Presentation of the results Results are presented using both tables and box-plots.

Modèles de prédiction Validation – Data splitting viii) Interpretation of the results variability of the estimates of the model’s parameters over the 100 repetitions. variability large model’s coefficients highly depend on the particular portion of the original data used to fit the model clear symptom of instability of the model and, what is worse, of overfitting (not enough data to compute a reliable estimation of the model’s parameters)

Modèles de prédiction Validation – Data splitting quality of fit distributions of the estimates to be averaged around the same values as the estimates computed on the whole original sample. If this does not happen, the model cannot be validated because of its internal instability. performance outside the fitting sample. comparing the fitting to the validation distributions of the measures of discrimination and calibration. We expect the model to perform better on the fitting sample, i.e. we expect lower levels for both discrimination and calibration when shifting from the fitting to the validation distribution a reduction in the magnitude of the performance measures is to be expected. Drop in value of the measures is too large model does not validate outside the fitting sample.

Modèles de prédiction Validation – Data splitting

Modèles de prédiction Validation – Data splitting

Modèles de prédiction Validation – Data splitting

Modèles de prédiction Validation – Cross-validation K-fold cross-validation On divise l’échantillon en K sous-échantillons mutuellement exclusifs On établit le modèle sur K-1 sous-échantillons pris ensembles On applique le modèle sur le sous-échantillon omis On répète l’opération en omettant tour à tour chacun des K sous échantillon On étudie la distribution des statistiques relevées dans les sous-échantillons de validation (moyenne) ou on détermine un «skrinkage factor» (facteur de réduction) pour estimer «l’optimisme» du modèle dans l’échantillon original

Modèles de prédiction Validation – Cross-validation Cas particulier: leave-in-one =jacknife Les sous-échantillons sont constitués d’un seul sujet on ôte chaque sujet tour à tour; on établit le modèle sur les n-1 autres sujets et on le valide sur le sujet restant

Modèles de prédiction Validation croisée

Modèles de prédiction Validation croisée

Modèles de prédiction Validation croisée

Modèles de prédiction Validation croisée

Modèles de prédiction validation croisée

Modèles de prédiction Validation croisée Titre du document / Document title Construction et validation d'un modèle de prédiction de la date de floraison du colza d'hiver = Modelisation of the winter rape flowering date  Auteur(s) / Author(s) HUSSON F. ; LETERME P. (2) ; Résumé / Abstract Le but de cette étude est de présenter une modélisation de la date de floraison du colza d'hiver. Ce modèle est ensuite paramétré pour différentes variétés de colza: Darmor, Bienvenu, Eurol, Bristol, Aligator, Goéland, Vivol et Symbol. On valide ensuite le modèle en faisant appel à des techniques de validation croisée. Ce type de validation est nécessaire si on doit à la fois paramétrer et valider le modèle avec peu d'observations. Revue / Journal Title OCL. Oléagineux, corps gras, lipides  (OCL, Ol. corps gras lipides)  ISSN 1258-8210  Oléagineux, corps gras, lipides Source / Source 1997, vol. 4, no5, pp. 379-384 (23 ref.)

Modèles de prédiction Validation - Bootstrap Sélection d’un échantillon aléatoire avec remplacement de taille n ou inférieure à n On établit le modèle dans cet échantillon «bootstrap» caractéristiques On répète l’opération un grand nombre de fois (1000, 2000 x) On étudie la distribution des caractéristiques relevées dans les échantillons bootstrap et/ou en un déduit un « shrinkage factor » (facteur de réduction).

Modèles de prédiction Validation - Bootstrap A prediction rule for selective screening of infection Chlamydia trachomatis H M Götz, J E A M van Bergen, I K Veldhuijzen, J Broer, C J P A Hoebe and J H Richardus Sex. Transm. Inf. 2005;81;24-30

Modèles de prédiction Validation - Bootstrap Statistical analysis Univariate logistic regression analyses were performed, with self reported characteristics as independent variables and diagnosis of C trachomatis as the dependent variable. For the odds ratios, 95% confidence intervals (CI) were calculated. Variables showing an association of p,0.2 were included in the multivariable analysis. Backward stepwise selection was performed with a p value for the likelihood ratio test .0.10 as the criterion for elimination of variables from the model. Interactions between predictors and sex were assessed to study whether effects of predictors were different for men and women.

Modèles de prédiction Validation - Bootstrap The goodness of fit (reliability) of the model was tested by the Hosmer-Lemeshow statistic. The model’s ability to discriminate between participants with or without a chlamydial infection was quantified by using the area under the receiver operating characteristic curve (AUC). AUC values 0.7–0.8 are considered acceptable, 0.8–0.9 excellent, and .0.9 outstanding.17 Calibration was assessed graphically by plotting observed frequencies of chlamydial infection against predicted probabilities.

Modèles de prédiction Validation - Bootstrap The performance of screening criteria in a study population, from which the model is developed, is known often to be too optimistic. The internal validity of the regression model was therefore assessed to estimate the performance of the model in new participants, similar to the population used to develop the model. We used bootstrapping techniques: random samples, with replacement, were taken one hundred times from the study population. At each step predictive models were developed, including variable selection.

Modèles de prédiction Validation - Bootstrap Bootstrapping may help to reduce the bias in the estimated regression coefficients, and give an impression of the discriminative ability in similar participants of screening. The outcome is a correction factor for the AUC, and a shrinkage factor to correct for statistical over-optimism in the regression coefficients and to improve calibration of the model in future participants.

Modèles de prédiction Validation externe External validity was assessed by leaving out the four MHS in the sample one by one, and fitting regression models, including variableselection, on the remaining data. The discriminative ability of this model was assessed externally on the MHS data not included in the fitting procedure. This procedure replicates the situation in which the prediction model is applied in another MHS region with a population that may to some extent be different.

Modèles de prédiction Validation - Bootstrap Performance of predictive model and development of prediction score Multivariable logistic regression analysis showed that chlamydial infection was associated with high urbanisation, young age, ethnicity (Surinamese/Antillian), low/intermediate education, multiple lifetime partners, a new contact in the previous two months, no condom use at last sexual contact, and complaints of (post)coital bleeding in women and frequent urination in men (table 1). The only statistically significant interaction term in the model was sex and the number of lifetime partners.

Modèles de prédiction Validation – Bootstrap; externe The Hosmer-Lemeshow goodness of fit test had a p value of 0.12, indicating adequate goodness of fit. The model discriminated well between participants who were and were not infected by C trachomatis, with an AUC of 0.81 (95% CI 0.77 to 0.84). Internal validation showed optimism in the AUC of 0.03, resulting in a correction of the AUC from 0.81 to 0.78. In the external validation similar sets of predictors were selected. When tested in each separate MHS, the AUC varied from 0.74 to 0.80.

Modèles de prédiction Validation – Bootstrap

Modèles de prédiction Validation – Bootstrap

Modèles de prédiction Validation – Bootstrap

Modèles de prédiction Validation – Bootstrap

Modèles de prédiction validation externe - exemple Prognostic Indices for Mortality of Hospitalized Children in Central Africa Michele Dramaix, Daniel Brasseur, Philippe Donnen, Paluku Bawhere, Denis Porignon, Rene Tonglet and Philippe Hennart American Journal of Epidemiology 1996; 143 (12)

Modèles de prédiction validation externe - exemple

Modèles de prédiction validation externe - exemple

Modèles de prédiction validation externe - exemple

Modèles de prédiction Validation - Conclusion Validation indispensable pour utiliser un nouveau modèle Bootstrap plus souvent recommandé pour validation interne Utiliser le modèle corrigé pour son “optimisme” par un facteur de réduction Validation externe: la meilleure!