La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

DFMG3 SHA.MCS.Quanti Méthode Quantitative. DFMG3 Plan du Cours Rappels sur la méthode scientifique en Sciences de la Vie Rappels sur le raisonnement Rappels.

Présentations similaires


Présentation au sujet: "DFMG3 SHA.MCS.Quanti Méthode Quantitative. DFMG3 Plan du Cours Rappels sur la méthode scientifique en Sciences de la Vie Rappels sur le raisonnement Rappels."— Transcription de la présentation:

1 DFMG3 SHA.MCS.Quanti Méthode Quantitative

2 DFMG3 Plan du Cours Rappels sur la méthode scientifique en Sciences de la Vie Rappels sur le raisonnement Rappels sur les principaux outils statistiques – tests - intervalle de confiance La causalité

3 DFMG3 théorie scientifique et justification (rappels) Popper –Une théorie scientifique ne représente ni une vérité ni même un de ses fragments –Provisoire, elle contribue à un paradigme susceptible d'être réfuté à tout moment par des mises à l'épreuve successives –Plus elle est solide, plus elle résistera et sera corroborée Une propriété fondamentale de toute théorie scientifique est d'être réfutable

4 DFMG3 la démarche expérimentale (rappels) méthode expérimentale émettre une hypothèse: cause effet écrire un protocole: conditions + hypothèse + méthode tester lhypothèse par expériences construites répétées à lidentique –Faire le bilan des variables ayant une action sur le système étudié et isoler le système –Monter une situation où toutes les variables sont fixes sauf 2 (la cause et leffet à observer) –Appliquer la cause et observer la relation entre cause et effet valider ou invalider lhypothèse en sciences de la vie obligatoire Obligatoire Difficile paramètres non tous connus multitude de paramètres difficiles à isoler + variabilité effet relation cause - effet sera entachée dun aléa résultant de laction des variables non maîtrisées dans lexpérience: incertitude

5 DFMG3 variabilité Instrumentale (technique de mesure) Pré-instrumentale (technique prélèvement) variabilité analytique variabilité biologique Intra-sujet Inter-sujet génétique phénotype environnement (,, social) fonde la notion de HASARD et d INCERTITUDE d ALEATOIRE CAUSE EFFET autres causes inconnues connues valeur différente selon les individus

6 DFMG3 la démarche en sciences de la vie (rappels) se rapprocher de la méthode expérimentale –émettre une hypothèse –écrire un protocole: conditions + hypothèse + méthode –tester lhypothèse par une « expérimentation » Sur groupe(s) de sujets aussi déterminé(s) que possible = échantillon(s) Effectuer les mesures –Calculer et comprendre les résultats valider ou invalider lhypothèse sur le(s) groupe(s) en tenant compte de lincertitude due à la variabilité des mesures de leffet chez chaque patient car on ne peut « fixer » tous les paramètres causaux –Généraliser à une population

7 DFMG3 Contraintes et conséquences Contraintes: causes souvent intriquées et effets variables (gradient) selon les individus Expérimentation sur groupe(s) –«similaires» pour les autres causes connues –permettant de simuler un individu «type» Aléa ou Incertitude –«modéliser» laléa ou incertitude ? –«raisonner» et «statuer» sous incertitude ? Généralisation –«généraliser» sous incertitude ? TESTS

8 DFMG3 Plan du Cours Rappels sur la méthode scientifique en Sciences de la Vie Rappels sur le raisonnement –Exemple –Echantillon et population –Variables –Tests & risques Rappels sur les principaux tests La causalité

9 DFMG3 Statuer sous incertitude: exemple lignée de souris présentant 20% de tumeurs malignes spontanées sur 1 échantillon de 100 souris substance X Observé: 31 souris avec tumeur maligne Question: la substance X est-elle cancérigène ?

10 DFMG3 Statuer sous incertitude: exemple lignée de souris présentant 20% de tumeurs malignes spontanées 100 échantillons de 100 souris fluctuations déchantillonnage 100 échantillons de 100 souris substance X tous les échantillons ne sont pas à 20% de tumeurs 31% est une valeur possible on aurait pu observer une autre valeur que 31% 20% est une valeur observable

11 DFMG3 Statuer sous incertitude: exemple lignée de souris présentant 20% de tumeurs malignes spontanées constaté: 31 souris avec tumeur maligne échantillon de 100 souris substance X Question: la substance X est-elle cancérigène ? on a constaté une différence : 31% - 20% = 11% –mais existent les « fluctuations déchantillonnage Question –A-t-on beaucoup de chances dobserver au moins cette différence si X nest pas cancérigène? –à partir de quelle probabilité peut-on considérer X comme cancérigène ? –cette probabilité « seuil » sera le « risque derreur » –conclure en fonction du « seuil de significativité » que lon sest donné

12 DFMG3 Faire un test statistique (cad: tenant compte des fluctuations déchantillonnage) –qui donnera la probabilité dobserver au moins cette différence si X nest pas cancérigène? –conclure en fonction du « seuil de significativité » que lon sest donné Raisonnement –hypothèse (nulle) X non cancérigène = léchantillon provient au hasard de la population avec taux 20% –Test: Comparaison fréquences Calcul probabilité(H0) P = 0,06 –Conclusion / seuil (5%) P > 0,05 donc non rejet de H0 (H0 nest pas réfutée) –Conclusion clinique : on ne peut pas dire S cancérigène Statuer sous incertitude: exemple

13 DFMG3 Plan du Cours Rappels sur la méthode scientifique en Sciences de la Vie Rappels sur le raisonnement –Exemple –Echantillon et population –Variables –Tests & risques Rappels sur les principaux tests La causalité

14 DFMG3 Série statistique collection dobjets, éléments, individus –de même nature –suffisamment semblables pour pouvoir être étudiés ensemble –soumise à des critères inclusion et non-inclusion –exemples ensemble de patients diabétiques âgés de 15 à 30 ans ensemble de cellules infectées par le VIH ensemble de résultats de glycémie analyse portera sur les caractéristiques communes aux éléments de la série dont la valeur varie selon les individus –exemple: sexe, valeur de la glycémie …

15 DFMG3 Population & Echantillon Population : série exhaustive –finie (étudiants en PACES en ) –infinie ou très grande connue (étudiants en France en 2010) inconnue (patients atteints par le VIH) –valeurs en population souvent inconnues Échantillon : sous-ensemble fini –extrait dune population échantillonnage

16 DFMG3 échantillonner ? But des études / expérimentations –émettre des conclusions valables en population –connaître les propriétés des variables dans la population Échantillonnage nécessaire –si population infinie –si les ressources de létude sont limitées –si attente davoir tous les individus impossible exemple: tester un médicament contre le cancer du sein –si la mesure de la variable étudiée est destructrice exemple: mesurer la durée de vie dun objet manufacturé sur tous les objets: plus rien à vendre à la fin !!! Échantillonnage représentatif nécessaire

17 DFMG3 échantillon représentatif ? Sous-ensemble extrait de la population ressemblant le plus possible à celle-ci par tirage au sort ou tirage aléatoire –= prélever au hasard une fraction de la population –chaque individu a la même chance dêtre choisi que les autres –procédure objective –moyens: pile ou face, boule dans une urne (loto), table de nombres aléatoires … –exemple: échantillon aléatoire des étudiants –numérotation de 1 à des étudiants tirage par table de nombres au hasard de 100 numéros les étudiants correspondants forment un échantillon aléatoire de 100 sujets extrait de la population des étudiants

18 DFMG3 Relations échantillon aléatoire # population Échantillon E simple tiré au hasard de population P n observations indépendantes X i – obtenues par tirage avec remise, ou tirage sans remise mais grande population –donc de même loi de probabilité que celle de la population Pour le raisonnement, on prend une variable dintérêt quantitative: Tension Artérielle Systolique (TAS) –Population: moyenne =14, écart-type =2 –Échantillon: moyenne m, écart-type s

19 DFMG3 Mesure de Tension Artérielle Systolique (TAS) Tous les individus nont pas la même TAS Que dire de la TAS sur un ensemble dindividus ? représentée par 2 valeurs –Valeur moyenne de la TAS –Ecart-type montrant la dispersion vis à vis de la moyenne Dans lexemple: –Population: moyenne =14, écart-type =2 –Échantillon: moyenne m, écart-type s Relations échantillon randomisé # population moyenne écart-type

20 DFMG3 Plus la taille des échantillons est grande, plus la distribution de la moyenne m est étroite autour de Relations échantillon aléatoire # population 4000 échantillons de taille échantillons de taille 1000

21 DFMG3 Intérêt & inconvénients des échantillons Intérêt –Aléatoire: représentatif de la population Inférence des valeurs globales en population avec leur écart-type (variance) évite les biais de sélection (choix des « bons patients ») –Coûts plus faibles –Meilleur taux de réponses –Données de meilleure qualité –Rapidité des résultats –Seul utilisable si « analyse destructrice » Inconvénient –Parfois échantillon de grande taille nécessaire –Imprécision

22 DFMG3 Des échantillons comparables … Randomisation –Tirage au sort de la répartition entre les échantillons –Permet de «répartir de façon équilibrée» les sujets et donc les variables qui jouent sur la relation cause-effet –Laléa, lincertitude, encore appelé « hasard » ( cad effet des variables autres que la cause sur la relation) a alors un caractère probabiliste pourra être « modélisé mathématiquement » par des tests et des intervalles de confiance –On pourra alors juger, en probabilité (« davoir raison quand on dit leffet est lié à la cause »)

23 DFMG3 Des échantillons comparables … La randomisation –Permet déviter les biais de sélection (ex: éviter de choisir seulement des patients « bons répondeurs » à un traitement) –Permet de travailler sur des échantillon(s) comparables sur tout sauf la cause –Autorise la comparaison des groupes et des résultats –Permet de «généraliser» à la population les résultats obtenus (lexistence ou non dune relation entre une cause et un effet)

24 DFMG3 Intervalle de confiance (IC) à partir dun échantillon, on aura une estimation ponctuelle dun paramètre –exemple: taille moyenne des individus de léchantillon Mais –Cet échantillon nest quun des échantillons possibles tirés de la même population –Lestimation ponctuelle nest quune des estimations possibles intervalle de confiance à 95% du paramètre –intervalle de valeurs qui a 95% de chance de contenir la vraie valeur du paramètre estimé –cad l'ensemble des valeurs raisonnablement compatibles avec le résultat observé (lestimation ponctuelle) –donne une visualisation de lincertitude de lestimation.

25 DFMG3 Intervalle de confiance (IC) exemple Etude –essai thérapeutique entre molécule et placebo –Critère de jugement: réduction relative de mortalité Résultat: RRR = 0,2 [IC95: 0,05 – 0,35] –Signifie Il y a 95 chances sur 100 dobserver une valeur de réduction relative de la mortalité entre 5% et 35%

26 DFMG3 Plan du Cours Rappels sur la méthode scientifique en Sciences de la Vie Rappels sur le raisonnement –Exemple –Echantillon et population –Variables –Tests & risques Rappels sur les principaux tests La causalité

27 DFMG3 Variable Elément –mesurable / comptable –dont la mesure peut prendre différentes valeurs –exemple Taille dun individu Nombre détudiants Présence de séquelles Caractéristiques –Type: quantitative, qualitative, censurée –Plage / ensemble de valeurs possibles –Dimension: unité de valeurs Aléatoire si –la valeur de la mesure, pour un sujet donné, ne peut être prédite avec certitude –donc à laquelle est associée une loi de probabilité

28 DFMG3 Variable: Types Qualitative –Valeur = une parmi des catégories exclusives –Qualitative nominale : catégories sans relation dordre ex : groupe sanguin, couleur des yeux dichotomique ( booléenne, binaire) ex : sexe –Qualitative ordinale : catégories ordonnées ex : score douleur (nulle-modérée-forte), protéinurie (0,+,++…) Remarques –On peut «éclater une variable à K catégories» en K-1 variables binaires –Aucune opération mathématique na de sens –Les opérations logiques entre catégories ont un sens pour une variable qualitative ordinale –Les effectifs cumulés entre catégories ont un sens pour une variable qualitative ordinale

29 DFMG3 Variable: Types Quantitative : – Valeur = résultat de la mesure d'une quantité –Quantitative continue Valeur est exprimée par un nombre réel ex : taille, poids, glycémie Nombre infini de valeurs possibles entre 2 valeurs quelconques –Quantitative discrète Valeur est exprimé par un nombre entier ex : nombre denfants, nb de selles/jour Nombre fini de valeurs Remarques –On peut transformer une V quantitative en V qualitative ordinale en déterminant des seuils (déterminer des classes de valeurs) –Cette transformation induit une perte dinformation –Les opérations mathématiques et logiques ont un sens

30 DFMG3 Variable: types Censurée : survenue dun événement –Double valeur: Présence ou absence de lévénement Délai dapparition de lévènement –similaire à 2 variables associées ex : Survenue dun décès dans lannée qui suit opération comptage du décès (qualitatif) délai de survenue du décès (quantitatif) ex : Survenue dune séquelle comptage de la séquelle (qualitatif) délai de survenue de la séquelle (quantitatif)

31 DFMG3 Variable: représentation des valeurs suspension de virus de la mosaïque du tabac –inoculée à des plants de tabac –génotypiquement identiques –sur une feuille de même rang entre les nervures d'un rang donné –Mesure du temps de latence de la maladie (en jours) Temps variable (13-34j) Malgré conditions standardisées = Variabilité biologique valeur centrale écarts Tps de latence de léchantillon = valeur centrale ± valeur décart paramètres de position paramètres de dispersion graphique

32 DFMG3 Statistiques descriptives Paramètres théoriques Paramètres observés Ensemble exhaustif de sujets dont on a défini les caractéristiques Sous-ensemble fini issu dune population sélection représentativité tirage au sort populationéchantillon Paramètres de position Paramètres de dispersion

33 DFMG3 Plan du Cours Rappels sur la méthode scientifique en Sciences de la Vie Rappels sur le raisonnement –Exemple –Echantillon et population –Variables –Tests & risques Rappels sur les principaux tests La causalité

34 DFMG3 Statuer sous incertitude ? Pour une variable X : on connaît les paramètres dans la population à quoi peut-on sattendre dans un échantillon ? population échantillon tirage au sort ? Pour une variable X : on a calculé les paramètres dans un échantillon à quoi peut-on sattendre dans la population ? population échantillon tirage au sort Pour une variable X : on a calculé les paramètres dans 2 échantillons peut-on conclure à un effet de la cause dans la population ? population effet ? CAUSE + - échantillon 1 tirage au sort échantillon 2 tirage au sort

35 DFMG3 Statuer sous incertitude: exemple Étude question Problématique Hypothèses –H0 (hypothèse nulle) –H1 (hypothèse alterne) Sous H0 : Test statistique –Choix –Vérification conditions –Calcul de petit p = degré de signification Conclusion / seuil –Seuil –Conclusion / hypothèses Conclusion clinique Population 20% K Échantillon 31% K Substance X cancérigène? Comparaison % obs à % th –Echantillon aléatoire issu de la population avec taux 20% (=X non cancérigène) –Inverse –Comparaison fréquence obs à th –N grand –P = 0,06 –5% = 0,05 –P > 0,05 donc non rejet de H0 Test statistique = test dhypothèse

36 DFMG3 étapes des tests 1. Énoncé de la problématique – question – type de problème statistique (population, échantillons, type de variable) – choix du seuil de signification = risque (en g é n é ral 5%) 2. Hypothèses – toujours formulées en termes de population car fluctuations déchantillonnage on veut conclure sur la (les) population(s) dont est/sont extrait(s) le(s) échantillon(s) observé(s) – toujours 2 hypothèses hypoth è se nulle (H0) : « rien ne change, pas deffet … » – échantillon(s) extrait(s) au hasard de la même population – en général = inverse de ce que lon cherche à montrer hypoth è se alternative (H1) – échantillon(s) non extrait(s) au hasard de la même population

37 DFMG3 étapes des tests 3. H0 est supposée vraie (démarche expérimentale) et calcul de petit p (degré de signification = proba davoir au moins une différence égale à celle observée) au moyen dun test statistique –Choix du test –vérification conditions nombre de sujets normalité de distribution des variables 4. Conclusion statistique – p > : non rejet de H0 – p : rejet de H0 au risque p 5. Évaluation des biais éventuels – biais de sélection – biais de classement – biais de confusion 6. Conclusion clinique cf cours biais

38 DFMG3 Risques et règles de décision avant la décision … – Supposition H0 vraie (hypothèse à réfuter) – Test effectué donnant p (p-value): degré de signification = probabilité davoir une différence au moins égale à celle observée Règle de décision – Si p : H0 peu probable rejet de H0 au risque p – Si p > : H0 probable non rejet de H0 au risque p 0 seuil écart-réduit non rejet de H0rejet de H0 H0 vraie p

39 DFMG3 risque α – Seuil de signification ou risque de 1 è re esp è ce ou erreur de type 1 – probabilit é de rejeter H0 alors que H0 est vraie – exemple: risque de consid é rer un produit actif alors qu il est inactif – Fix é a priori avant le test en g é n é ral 5% (mais < 5% dans les essais th é rapeutiques si nouveau produit toxique) risque β – risque de 2ème espèce ou erreur de type II – probabilit é de ne pas rejeter H0 alors que H1 est vraie – exemple: risque de considérer un produit inactif alors quil est actif – Fixé a priori avant le test en général 20% si comparaison de 2 produits à toxicité et coût similaires) décision rejet de H 0 non rejet de H 0 réalité H 0 est vraie risque α faux positifs 1- α H 1 est vraie1-β (puissance) risque β faux négatifs Risques et règles de décision

40 DFMG3 Degré de signification et conclusion statistique Comparaison de 2 traitements différence cliniquement intéressante ou non cliniquement intéressante rejet de H 0 (différence statistiquement significative) cest peut être vrai (1-β) cest peut être faux (α) non rejet de H 0 (différence non statistiquement significative) Cest peut être par manque de puissance (β) La différence est peut être suffisamment faible (1- α)

41 DFMG3 règles de décision à 5% – Si p (5%) : H0 peu probable rejet de H0 au risque p – Si p > (5%) mais p 10% : H0 probable non rejet de H0 au risque p mais tendance à la significativité – Si p > (5%) : H0 probable non rejet de H0 au risque p Seuil (5%) 0 écart-réduit non rejet de H0rejet de H0 H0 vraie p 10% tendance

42 DFMG3 Plan du Cours Rappels sur la méthode scientifique en Sciences de la Vie Rappels sur le raisonnement Rappels sur les principaux tests La causalité

43 DFMG3 Les tests Choix du test statistique dépend –de la question: comparaison, liaison –des types des variables: quantitative, qualitative, censurée Variable à expliquer (effet) Variables explicatives (cause, facteurs de confusion) –des lois de probabilité suivies par les variables –de la taille du/des échantillon(s) petits grands (N > 30) mais –sont toujours des tests dhypothèse –demandent de suivre la même démarche

44 DFMG3 Tests: variables qualitatives Comparaison Fréquence (%) observée à fréquence (%) théorique H0 : F = F th H1 : F F th Écart-réduit Chi2 de Pearson Fischer exact exemple: le % de diabétiques à Montpellier est-il le même que dans la population française ? question, variables hypothèses tests Comparaison K fréquences observées séries appariées H0 : égalité F T1 = F T2 H0 : différence F T1 F T2 Chi2 de Mc Nemar exemple: % de fumeurs est-il constant avant et après une nouvelle méthode de sevrage ? Comparaison K fréquences (%) observées échantillons indépendants H0 : F A = F B = F C H1 : au moins une F est Chi2 de Pearson Fischer exact exemple: % dasthmatiques identiques dans 5 capitales européennes ? Liaison/relation deux variables qualitatives H0 : Indépendance, OR = 1 H1 : Liaison, OR 1 Chi2 de Pearson IC 1- de OR Fisher exact exemple: maladie coronarienne et sexe ?

45 DFMG3 Tests: variables quantitatives Comparaison 2 moyennes observées 2 séries appariées H0 : égalité µ T1 = µ T2 H1 : différence µ T1 µ T 2 Student apparié, paired T test Wilcoxon apparié, test des signes (sign ou signed rank test) exemple: VEMS avant et après réadaptation à leffort Comparaison moyenne observée à moyenne théorique H0 : µ = µ th H1 : µ µ th Écart-réduit Student, T test exemple: taux de glycémie des enfants « obèses » est-il dans la normale ? question, variables hypothèses tests Comparaison 2 moyennes observées 2 échantillons indépendants H0 : µ A = µ B H1 : µ A µ B Écart-réduit Student, T test Mann-Whitney, exemple: VEMS chez les asthmatiques selon le statut addiction au tabac Comparaison 2 variances observées 2 séries appariées H0 : égalité v T1 = v T2 H1 : différence v T1 v T 2 Test F exemple: variance TAS entre 2 groupes : sain # atteint de drépanocytose

46 DFMG3 Tests: variables quantitatives Comparaison K moyennes Échantillons indépendants H0 : indépendance, µ A = µ B = µ C H1 : liaison, au moins une µ est ANOVA Kruskall-Wallis exemple: groupe sanguin et carence martiale Liaison 2 variables quantitatives H0 : Indépendance, = 0 H1 : Liaison, 0 Coefficient de corrélation linéaire de Pearson de Spearman exemple: taux de CD4 et charge virale chez les HIV naïfs de traitement question, variables hypothèses tests

47 DFMG3 X et Y = 2 variables aléatoires continues –événement élémentaire [x< X

48 DFMG3 Corrélation linéaire - population Coefficient de corrélation linéaire théorique –Valeur: –Propriétés nombre sans dimensions 0 1 ou –1 +1 renseigne sur lindépendance entre X et Y –Si = 1 alors Y = aX +b (dépendance totale) –Si X et Y indépendants (en proba) alors Cov(X,Y)=0 donc = 0 attn : linverse nest pas vrai –Si > 0 alors X et Y varient dans le même sens –Si < 0 alors X et Y varient en sens contraire

49 DFMG3 Corrélation linéaire - échantillon –Un échantillon de taille N –2 variables aléatoires X et Y mesurées sur les mêmes sujets 1er sujetx 1 y 1 2ème sujetx 2 y 2 … Nième sujetx N y N –Valeurs calculées Mêmes propriétés que

50 DFMG3 Statistique inférentielle –r est une variable aléatoire –Seul point abordé comparaison de r à la valeur théorique 0 en considérant que cela revient à tester lindépendance à la condition que les deux variables X et Y soient normales –Problème échantillon taille N –2 variables normales X et Y –coefficient observé r Hypothèses –H 0 : E avec r provient au hasard de Pop avec = 0 –H 1 : E avec r provient au hasard de Pop avec 0 Calcul de r Lecture dans la table à (N-2) ddl Corrélation linéaire - échantillon

51 DFMG3 Plan du Cours Rappels sur la méthode scientifique en Sciences de la Vie Rappels sur le raisonnement Rappels sur les principaux tests La causalité

52 DFMG3 et la conclusion … mesure effet randomisation cause E1E2 test RESULTAT statistique Conclusion généralisable si Mesure effet valide, fiable Nombre de sujets suffisants Bonne randomisation Peu de perdus de vue Test statistiques adéquats Absence de biais CONCLUSION CLINIQUE ….

53 DFMG3 Et généraliser ….

54 DFMG3 Causalité lien causal = faisceau d'arguments 1. Preuves expérimentales 2. Reproductibilité : caractère systématique ou presque du lien 3. Temporalité: la cause doit précéder son effet 4. Relation dose-effet: plus la "dose" de cause augmente plus son effet (positif ou négatif) est augmenté 5. Suppression de la cause: si la cause est supprimée, l'effet dû à la cause disparaît 6. Spécificité: innocenter d'autres causes 7. Cohérence avec d'autres données scientifiques 8. Force de l'association statistique (RR ou OR élevé)

55 DFMG3 Schémas détude

56 DFMG3 Conclusion: de la rigueur Rigueur –dans lénoncé des hypothèses, de la question de recherche et des objectifs –dans le choix et le recueil des variables à mesurer pour représenter la cause et leffet … et les autres –dans la sélection de la population –dans la sélection des échantillons (groupes) – TAS/randomisation –dans les analyses statistiques et –dans la démarche amenant aux conclusions


Télécharger ppt "DFMG3 SHA.MCS.Quanti Méthode Quantitative. DFMG3 Plan du Cours Rappels sur la méthode scientifique en Sciences de la Vie Rappels sur le raisonnement Rappels."

Présentations similaires


Annonces Google