Intérêt et principes des analyses multivariées

Slides:



Advertisements
Présentations similaires
Corrélation Position du problème Définition covariance (X,Y) r =
Advertisements

Dr Vincent Leroy Grenoble
Cancers bronchiques 1 Essai de phase III IFCT-GFPC 0502 : comparaison d’un traitement de maintenance par gemcitabine ou erlotinib à la simple surveillance.
Patients (n = 530) Biomarqueurs IHC (n = 412) Séquençage (n = 418) 200 patients évaluables pour les facteurs pronostiques cliniques et biologiques Comparaison.
Test statistique : principe
Association entre variables
La régression logistique: fondements et conditions d’application
Inférence statistique
C1 Bio-statistiques F. KOHLER
Comparaison de deux moyennes observées
Faculté de médecine de Nancy - SPI-EAO - Pr. F. KOHLER
Comparaison d'une distribution observée à une distribution théorique
Comparaison de plusieurs moyennes observées
Tests non paramétriques
Courbes de survie C1 Statistiques.
Les TESTS STATISTIQUES
Tests de comparaison de pourcentages
Comparaison de plusieurs moyennes Analyse de variance
Estimation de la survie comparaison des courbes de survie
Optionnel de Statistique appliquée À la lecture critique d’articles
Nombre de sujets nécessaires en recherche clinique
Qualité de vie des personnes sous traitement antirétroviral
Les TESTS STATISTIQUES
Évaluation des traitements ARV de seconde ligne en Afrique et en Asie Pujades-Rodríguez M. Epicentre, Paris.
Dr DEVILLE Emmanuelle J D V 12/07/2006
Estimation de la survie comparaison des courbes de survie FRT C3.
Comparaison de plusieurs moyennes Analyse de variance
Régression -corrélation
Analyse de la variance à un facteur
La perception subjective de la corrélation dans les nuages de points
Relations entre élastométrie, marqueurs biologiques et ponction biopsie hépatique chez 67 patients Sénégalais avec charge virale VHB ≥3.2 log UI/mL.
Traitement de données socio-économiques et techniques d’analyse :
Mémoire de DIU de pathologie infectieuse pédiatrique
Plans à groupes indépendants: organisation
Statistiques Séance 9 – 6 décembre 2005 N. Yamaguchi.
Etude longitudinale d’essais multilocaux: apports du modèle mixte
Nombre de sujets nécessaires en recherche clinique
Régression linéaire simple
Howell, Chap. 1 Position générale
Paul-Marie Bernard Université Laval
Faculté de Médecine Lyon-Sud Module Optionnel de préparation à la lecture critique d ’articles Interprétation des tests statistiques.
L’Analyse de Covariance
Corrélation et régression linéaire simple
L’Analyse de Variance 1 Généralités Le modèle Calculs pratiques
1.Un rang de données multicolores 2. Deux permutations des n premiers entiers 3. b permutations des k premiers entiers 4. Choix de n points dans [0,1]
Régression logistique Eugénie Dostie-Goulet
L’analyse de variance factorielle
La corrélation et la régression multiple
La corrélation et la régression
La corrélation et la régression
Les modèles linéaires (Generalized Linear Models, GLM)
Corrélation Principe fondamental d’une analyse de corrélation
Les analyses multivariées
Analyse factorielle de variance: Principes d’expérimentation
La régression multiple
Régression linéaire multiple : hypothèses & interprétation
Statistiques Séance 10 N. Yamaguchi.
Méthodes de Biostatistique
Analyse de survie.
Tests d’hypothèse Tests de conformité Tests d’égalité
Séance 8 30 novembre 2005 N. Yamaguchi
Statistiques analytiques sous STATA
1.  On souhaite comparer deux traitements dans le cadre d’un essai randomisé sur les lombosciatiques :  corticoïdes par infiltrations  placebo  Critère.
Dr Vincent BIGE Centre de référence Mucoviscidose de Lyon
LECTURE CRITIQUE D’UN ARTICLE
ETUDES PRONOSTIQUES Pr Ganry.
Biostatistique pour le troisième cycle P. Leroy, F. Farnir 2013.
Faculté de Médecine de Marseille, Université de la Méditerranée Laboratoire d’Enseignement et de Recherche sur le Traitement.
Transcription de la présentation:

Intérêt et principes des analyses multivariées FRT C7

Analyse multivariée par opposition à univariée en complément d’une analyse univariée

Rappel sur l’analyse univariée Analyse univariée : relation entre 2 variables Principe : Hypothèse nulle d ’indépendance (H0) Hypothèse alternative de relation (H1) entre une variable dépendante, à expliquer et une variable expliquante Quantification de la différence entre l’observation et la théorie sous l’hypothèse nulle test statistique dépend du type de variable

Principaux tests d ’analyse univariée 2 variables qualitatives (catégorielles) guérison oui/non vs traitement A/B test du chi² ou test exact de Fisher

Principaux tests d ’analyse univariée 2 variables qualitatives (catégorielles) guérison oui/non vs traitement A/B test du chi² ou test exact de Fisher 1 variable qualitative et 1 variable quantitative récidive oui/non vs taille initiale de la tumeur Tests de comparaisons de moyenne : distribution normale de la variable quantitative 2 groupes : test t > 2 groupes : analyse de variance (ANOVA) petits effectifs ou distributions non normales 2 groupes : test de Mann Whitney > 2 groupes test de Kruskall Wallis

Principaux tests d ’analyse univariée 2 variables qualitatives (catégorielles) guérison oui/non vs traitement A/B test du chi² ou test exact de Fisher 1 variables qualitative et 1 variable quantitative récidive oui/non vs taille initiale de la tumeur test t (distrib. normale de la var quantitative) ou test de Mann Whitney (Kruskall Wallis) pour petits effectifs 2 variables quantitatives production d ’une protéine vs dose d’une substance test du coefficient de régression r

Principaux tests d ’analyse univariée 2 variables qualitatives (catégorielles) guérison oui/non vs traitement A/B test du chi² ou test exact de Fisher 1 variables qualitative et 1 variable quantitative récidive oui/non vs taille initiale de la tumeur test t (distrib. normale de la var quantitative) ou test de Mann Whitney (Kruskall Wallis) pour petits effectifs 2 variables quantitatives production d ’une protéine vs dose d’une substance test du coefficient de régression 1 variable qualitative et 1 variable censurée traitement A/B vs délai de récidive tumorale test du log rank

Estimation de courbes de survie par la méthode de Kaplan Meïer Taux de survie 100 % Traitement A Traitement B 50 % 3 6 9 12 Temps (mois)

Principe de l ’analyse unidimensionnelle Sexe Age ? ? Réponse au traitement (Evènement à expliquer) ? Génotype viral Stade histologique ? ? ? ? Charge virale Ancienneté de l ’infection Mode de contamination

Principe de l ’analyse unidimensionnelle Sexe Age S S Réponse au traitement (Evènement à expliquer) S Génotype viral Stade histologique S S NS S Charge virale Ancienneté de l ’infection Mode de contamination

Intérêt de l ’analyse multidimensionnelle Sexe Age Réponse au traitement (Evènement à expliquer) Génotype viral Stade histologique S S S S Ancienneté de l ’infection S Mode de contamination S Charge virale

Intérêt de l’analyse multivariée Sexe Age Réponse au traitement (Evènement à expliquer) Génotype viral Stade histologique Ancienneté de l ’infection Charge virale Mode de contamination Quels sont les facteurs indépendamment liés à l’événement ? Qui apportent chacun une part d’explication complémentaire ?  Stratégies thérapeutiques différentes en fonction de ces facteurs

Types d’analyses multivariées Analyses bivariées : relation entre 2 facteurs en prenant en compte un 3ème : (2 variables explicatives potentielles) Test de Mantel-Haenszel Analyse de variance à 2 facteurs Test du Log rank ajusté

Types d’analyses multivariées Analyses bivariées : relation entre 2 facteurs en prenant en compte un 3ème : (2 variables explicatives potentielles) Test de Mantel-Haenszel Analyse de variance à 2 facteurs Test du Log rank ajusté analyses multidimensionnelles : font appel à des modèles mathématiques Régression logistique Modèle de Cox Régression multiple (analyse discriminante, analyse factorielle ….)

Analyse bivariée : test de Mantel-Haenszel Question : en univariée traitt A > traitt B ; Vrai ou liée à une mauvaise répartition d’un facteur lié à la réponse au traitt ? Réponse : on étudie la relation réponse/traitt à chaque niveau du facteur : Strate Génotype 1 Strate génotype non 1 réponse réponse oui non oui non A pA1 A pAnon1 traitt traitt B pB1 B pBnon1 pA1 > pB1 pAnon1 > pBnon1 Conclusion : A > B indépendamment du génotype (à niveau égal de génotype)

Non & occasional cannabis smokers Daily cannabis smokers Figure 1 Non & occasional cannabis smokers Daily cannabis smokers 80 p=0.03 (Mantel-Haenszel statistics) 57.9% 60 Fibrosis > F2 (%) 42.9% 44.4% 40 22.6% 20 Age at biopsy (yrs)  40 > 40

Exemple numérique Rep + Rep- TtA 70(60)(40)30 100 Tx rép 70 % vs 50 % TtB 50(60)(40)50 100 ² = 8,33 p < 0,001 120 80 200

Exemple numérique Rep + Rep- Rep + Rep - TtA 70 30 100 Geno 1 60 60 120 TtB 50 50 100 Geno non1 60 20 80 120 80 200 120 80 200 Tx rep : 50 % vs 75 %, p< 0,001

Exemple numérique Rep + Rep- Rep + Rep - TtA 70 30 100 Geno 1 60 60 120 TtB 50 50 100 Geno non1 60 20 80 120 80 200 120 80 200 Geno 1 Gnon 1 TtA 40 60 100 33 % vs 75 % de TtA TtB 80 20 100 p < 0,0001 120 80 200

Exemple numérique Test de Mantel Haenszel Geno 1 Geno non1 Rep + Rep- Rep + Rep- TtA 20(20)20 40 TtA 50(45)(15)10 60 TtB 40(40)40 80 TtB 10(15) (5) 10 20 60 60 120 60 20 80 Rep+ Rep- TtA 70(65)(35)30 100 TtB 50(55)(45) 50 100 ² = 2,11 NS 120 80 200

Analyse bivariée : ANOVA à 2 facteurs Question : en univariée traitt A > traitt B sur la taille tumorale; Vrai ou liée à une mauvaise répartition d’un facteur lié à la réponse au traitt ? Réponse : l ’ANOVA permet de tester : l ’effet du traitement « à niveau égal » de l ’autre facteur l ’effet de ce facteur, indépendamment du traitement l ’interaction traitement x facteur : l ’effet du traitement est-il différent selon le niveau de l ’autre facteur ?

Exemple d’ANOVA à 2 facteurs Variable à expliquer : vitesse de progression de la fibrose après TH pour cirrhose C 2 variables explicatives : Le génotype viral VF gén1 > VF gén non1 L’immunosuppresseur : VF ss tacrolimus > VF ss ciclosp Résultats : ciclo tacro Vit Fibrose géno non1 0.316 0.207 0.280 effet génotype géno 1 0.606 0.837 0.659 p = 0.008 0.540 0.627 0.562 interaction : p = 0.315 effet immunosup : p = 0.718

Analyse bivariée : test du Log rank ajusté Taux de survie 100 % Traitement A sans métastase 50 % Traitement B sans métastase Traitement A avec métastases Traitement B avec métastases 0 % 1 2 3 4 5 Temps (ans) Permet de conclure A > B, qu’il y ait ou non des métastases initiales

Stratification vs ajustement Stratification = prendre en compte un facteur lié au critère de jugement dans la méthodologie de l’étude Ajustement = technique  prendre en compte dans un test unique un facteur qui  la variabilité du critère,  pallier la répartition inégale d’un facteur pronostique Stratification Ajustement randomisation randomisation parmi chaque strate sur l’ensemble     Ttt A Ttt B Ttt A Ttt B immunocompétent immunodéprimé

Analyse multidimensionnelle : la régression logistique Permet de prédire la probabilité d’un événement à l’aide de divers facteurs : quantitatifs ou qualitatifs Principe : à partir d’une série d’observations, on cherche à estimer les paramètres d’un modèle mathématique, prédisant au mieux la probabilité d’un événement : Proba (événement) = exp(u) / 1 + exp(u) u = fonction linéaire de la forme :  + i xi x = 0 ou 1 si qualitative, et valeur mesurée xi si quantitative i = coefficient associé au facteur : « poids du facteur » exp  = Odds ratio (OR) associé à une variable et ajusté sur les autres variables du modèle Permet également de calculer un risque relatif en prenant d’office en compte des variables importantes, même non testées tels que sexe, âge, ou autre paramètre connu pour être d’intérêt

Régression logistique : exemple Facteur coef  DS p exp  (OR) IC 95% OR Traitement (A 0 1 ) B - 1,204 0,45 0,001 0,3 0,19 – 0,47 Génotype (1 0 1 ) non 1 1,335 0,54 0,002 3,8 2,21 – 6,52 Histologie (F0F1 0 1 ) F2F3F4 - 0,615 0,30 0,03 0,54 0,40 – 0,7 Charge virale (>6 logUI 0 1 ) <6 logUI 1,172 0,44 0,01 3,2 1,36 – 7,65 4 facteurs indépendamment liés à l’obtention d’une réponse

Régression logistique : exemple Facteur coef  DS p exp  (OR) IC 95% OR Traitement (A 0 1 ) B - 1,204 0,45 0,001 0,3 0,19 – 0,47 Génotype (1 0 1 ) non 1 1,335 0,54 0,002 3,8 2,21 – 6,52 Histologie (F0F1 0 1 ) F2F3F4 - 0,615 0,30 0,03 0,54 0,40 – 0,7 Charge virale (>6 logUI 0 1 ) <6 logUI 1,172 0,44 0,01 3,2 1,36 – 7,65 4 facteurs indépendamment liés à l’obtention d’une réponse : - A > B; geno non1 > geno 1; F0F1 > F2F3F4; faible CV > forte CV

Analyse multidimensionnelle : le modèle de Cox (modèle des risques instantanés proportionnels de Cox) Objectif : évaluer les facteurs pronostiques de mortalité ou tout autre événement lié au temps Principe : On considère le risque instantané de décès (force de mortalité, hazard) = probabilité de mourir à l’instant t pour un sujet qui a survécu jusque là : (t) Fonction du temps passé et de covariables (facteurs de risque x1, x2, …. xk) recueillis en début d’étude ou en cours d’étude Hypothèse de proportionnalité des risques instantanés constante au cours du temps (ex : risque H = toujours 1,5 fois risque F) (t; x1,x2, … xk) = 0(t).f(x1,x2, … xk) où f(x1,x2, … xk) = exp(1x1+2x2+, …+ kxk)

Analyse multidimensionnelle : le modèle de Cox Placebo Traitement B Traitement A temps Le risque instantané de décès est proportionnel selon que les patients reçoivent A ou B : il est décroissant au cours du temps il n’est pas proportionnel sous placebo : le modèle de Cox n’est pas applicable

En conclusion Dans toutes études : recueil de données pertinentes (essai thérapeutique, étude pronostique, étude explicative) 1ére étape : analyse univariée Permet de déterminer les variables qui semblent liées à l’événement Étudie les relations entre les variables explicatives 2ème étape : analyse multivariée Permet de mettre en évidence les variables indépendamment liées à l’événement étudié et leur poids (coefficient , OR) ATTENTION : le modèle déterminé à partir d’une série d’observations doit être validé sur d’autres séries indépendantes de données