SHA.MCS.Quanti Méthode Quantitative.

SHA.MCS.Quanti Méthode Quantitative

Rappels sur la méthode scientifique en Sciences de la Vie
Plan du Cours Rappels sur la méthode scientifique en Sciences de la Vie Rappels sur le raisonnement Rappels sur les principaux outils statistiques – tests - intervalle de confiance La causalité

théorie scientifique et justification (rappels)
Popper Une théorie scientifique ne représente ni une vérité ni même un de ses fragments Provisoire, elle contribue à un paradigme susceptible d'être réfuté à tout moment par des mises à l'épreuve successives Plus elle est solide, plus elle résistera et sera corroborée Une propriété fondamentale de toute théorie scientifique est d'être réfutable

la démarche expérimentale (rappels)
méthode expérimentale émettre une hypothèse: cause  effet écrire un protocole: conditions + hypothèse + méthode tester l’hypothèse par expériences construites répétées à l’identique Faire le bilan des variables ayant une action sur le système étudié et isoler le système Monter une situation où toutes les variables sont fixes sauf 2 (la cause et l’effet à observer) Appliquer la cause et observer la relation entre cause et effet valider ou invalider l’hypothèse en sciences de la vie obligatoire Obligatoire Difficile paramètres non tous connus multitude de paramètres difficiles à isoler + variabilité effet relation cause - effet sera entachée d’un aléa résultant de l’action des variables non maîtrisées dans l’expérience: incertitude

(technique prélèvement)
variabilité Instrumentale (technique de mesure) Pré-instrumentale (technique prélèvement) variabilité analytique biologique Intra-sujet Inter-sujet génétique phénotype environnement (, , social) fonde la notion de HASARD et d’INCERTITUDE d’ALEATOIRE CAUSE EFFET autres causes inconnues connues valeur différente selon les individus

la démarche en sciences de la vie (rappels)
se rapprocher de la méthode expérimentale émettre une hypothèse écrire un protocole: conditions + hypothèse + méthode tester l’hypothèse par une « expérimentation » Sur groupe(s) de sujets aussi déterminé(s) que possible = échantillon(s) Effectuer les mesures Calculer et comprendre les résultats valider ou invalider l’hypothèse sur le(s) groupe(s) en tenant compte de l’incertitude due à la variabilité des mesures de l’effet chez chaque patient car on ne peut « fixer » tous les paramètres causaux Généraliser à une population

Contraintes et conséquences
Contraintes: causes souvent intriquées et effets variables (gradient) selon les individus Expérimentation sur groupe(s) «similaires» pour les autres causes connues permettant de simuler un individu «type» Aléa ou Incertitude «modéliser» l’aléa ou incertitude ? «raisonner» et «statuer» sous incertitude ? Généralisation «généraliser» sous incertitude ? TESTS

Rappels sur le raisonnement
Plan du Cours Rappels sur la méthode scientifique en Sciences de la Vie Rappels sur le raisonnement Exemple Echantillon et population Variables Tests & risques Rappels sur les principaux tests La causalité

Statuer sous incertitude: exemple
lignée de souris présentant 20% de tumeurs malignes spontanées sur 1 échantillon de 100 souris substance X Observé: 31 souris avec tumeur maligne Question: la substance X est-elle cancérigène ?

lignée de souris présentant 20% de tumeurs malignes spontanées 100 échantillons de 100 souris substance X 100 échantillons de 100 souris fluctuations d’échantillonnage tous les échantillons ne sont pas à 20% de tumeurs 31% est une valeur possible on aurait pu observer une autre valeur que 31% 20% est une valeur observable

lignée de souris présentant 20% de tumeurs malignes spontanées constaté: 31 souris avec tumeur maligne échantillon de 100 souris substance X Question: la substance X est-elle cancérigène ? on a constaté une différence : 31% - 20% = 11% mais existent les « fluctuations d’échantillonnage Question A-t-on beaucoup de chances d’observer au moins cette différence si X n’est pas cancérigène? à partir de quelle probabilité peut-on considérer X comme cancérigène ? cette probabilité « seuil » sera le « risque d’erreur » conclure en fonction du « seuil de significativité » que l’on s’est donné

Faire un test statistique (cad: tenant compte des fluctuations d’échantillonnage) qui donnera la probabilité d’observer au moins cette différence si X n’est pas cancérigène? conclure en fonction du « seuil de significativité » que l’on s’est donné Raisonnement hypothèse (nulle) X non cancérigène = l’échantillon provient au hasard de la population avec taux 20% Test: Comparaison fréquences Calcul probabilité(H0) P = 0,06 Conclusion / seuil (5%) P > 0,05 donc non rejet de H0 (H0 n’est pas réfutée) Conclusion clinique: on ne peut pas dire S cancérigène

collection d’objets, éléments, individus
Série statistique collection d’objets, éléments, individus de même nature suffisamment semblables pour pouvoir être étudiés ensemble soumise à des critères inclusion et non-inclusion exemples ensemble de patients diabétiques âgés de 15 à 30 ans ensemble de cellules infectées par le VIH ensemble de résultats de glycémie analyse portera sur les caractéristiques communes aux éléments de la série dont la valeur varie selon les individus exemple: sexe, valeur de la glycémie …

Population & Echantillon
Population: série exhaustive finie (étudiants en PACES en ) infinie ou très grande connue (étudiants en France en 2010) inconnue (patients atteints par le VIH) valeurs en population souvent inconnues Échantillon: sous-ensemble fini extrait d’une population échantillonnage

But des études / expérimentations
échantillonner ? But des études / expérimentations émettre des conclusions valables en population connaître les propriétés des variables dans la population Échantillonnage nécessaire si population infinie si les ressources de l’étude sont limitées si attente d’avoir tous les individus impossible exemple: tester un médicament contre le cancer du sein si la mesure de la variable étudiée est destructrice exemple: mesurer la durée de vie d’un objet manufacturé sur tous les objets: plus rien à vendre à la fin !!! Échantillonnage représentatif nécessaire

échantillon représentatif ?
Sous-ensemble extrait de la population ressemblant le plus possible à celle-ci par tirage au sort ou tirage aléatoire = prélever au hasard une fraction de la population chaque individu a la même chance d’être choisi que les autres procédure objective moyens: pile ou face, boule dans une urne (loto), table de nombres aléatoires … exemple: échantillon aléatoire des étudiants numérotation de 1 à des étudiants tirage par table de nombres au hasard de 100 numéros les étudiants correspondants forment un échantillon aléatoire de 100 sujets extrait de la population des étudiants

Relations échantillon aléatoire # population
Échantillon E simple tiré au hasard de population P n observations indépendantes Xi obtenues par tirage avec remise, ou tirage sans remise mais grande population donc de même loi de probabilité que celle de la population Pour le raisonnement, on prend une variable d’intérêt quantitative: Tension Artérielle Systolique (TAS) Population: moyenne =14, écart-type =2 Échantillon: moyenne m, écart-type s

Relations échantillon randomisé # population
Mesure de Tension Artérielle Systolique (TAS) Tous les individus n’ont pas la même TAS Que dire de la TAS sur un ensemble d’individus ? représentée par 2 valeurs Valeur moyenne de la TAS Ecart-type montrant la dispersion vis à vis de la moyenne Dans l’exemple: Population: moyenne =14, écart-type =2 Échantillon: moyenne m, écart-type s moyenne écart-type

Relations échantillon aléatoire # population
Plus la taille des échantillons est grande, plus la distribution de la moyenne m est étroite autour de  4000 échantillons de taille 1000 4000 échantillons de taille 100

Intérêt & inconvénients des échantillons
Aléatoire: représentatif de la population Inférence des valeurs globales en population avec leur écart-type (variance) évite les biais de sélection (choix des « bons patients ») Coûts plus faibles Meilleur taux de réponses Données de meilleure qualité Rapidité des résultats Seul utilisable si « analyse destructrice » Inconvénient Parfois échantillon de grande taille nécessaire Imprécision

Des échantillons comparables …
Randomisation Tirage au sort de la répartition entre les échantillons Permet de «répartir de façon équilibrée» les sujets et donc les variables qui jouent sur la relation cause-effet L’aléa, l’incertitude, encore appelé « hasard » (cad effet des variables autres que la cause sur la relation) a alors un caractère probabiliste pourra être « modélisé mathématiquement » par des tests et des intervalles de confiance On pourra alors juger, en probabilité (« d’avoir raison quand on dit l’effet est lié à la cause »)

Des échantillons comparables …
La randomisation Permet d’éviter les biais de sélection (ex: éviter de choisir seulement des patients « bons répondeurs » à un traitement) Permet de travailler sur des échantillon(s) comparables sur tout sauf la cause Autorise la comparaison des groupes et des résultats Permet de «généraliser» à la population les résultats obtenus (l’existence ou non d’une relation entre une cause et un effet)

Intervalle de confiance (IC)
à partir d’un échantillon, on aura une estimation ponctuelle d’un paramètre exemple: taille moyenne des individus de l’échantillon Mais Cet échantillon n’est qu’un des échantillons possibles tirés de la même population L’estimation ponctuelle n’est qu’une des estimations possibles intervalle de confiance à 95% du paramètre intervalle de valeurs qui a 95% de chance de contenir la vraie valeur du paramètre estimé cad l'ensemble des valeurs raisonnablement compatibles avec le résultat observé (l’estimation ponctuelle) donne une visualisation de l’incertitude de l’estimation.

Intervalle de confiance (IC) exemple
Etude essai thérapeutique entre molécule et placebo Critère de jugement: réduction relative de mortalité Résultat: RRR = 0,2 [IC95: 0,05 – 0,35] Signifie Il y a 95 chances sur 100 d’observer une valeur de réduction relative de la mortalité entre 5% et 35%

Variable Elément Caractéristiques Aléatoire si mesurable / comptable
dont la mesure peut prendre différentes valeurs exemple Taille d’un individu Nombre d’étudiants Présence de séquelles Caractéristiques Type: quantitative, qualitative, censurée Plage / ensemble de valeurs possibles Dimension: unité de valeurs Aléatoire si la valeur de la mesure, pour un sujet donné, ne peut être prédite avec certitude donc à laquelle est associée une loi de probabilité

Variable: Types Qualitative
Valeur = une parmi des catégories exclusives Qualitative nominale : catégories sans relation d’ordre ex : groupe sanguin, couleur des yeux dichotomique ( booléenne, binaire) ex : sexe Qualitative ordinale : catégories ordonnées ex : score douleur (nulle-modérée-forte), protéinurie (0,+,++…) Remarques On peut «éclater une variable à K catégories» en K-1 variables binaires Aucune opération mathématique n’a de sens Les opérations logiques entre catégories ont un sens pour une variable qualitative ordinale Les effectifs cumulés entre catégories ont un sens pour une variable qualitative ordinale

Variable: Types Quantitative :
Valeur = résultat de la mesure d'une quantité Quantitative continue Valeur est exprimée par un nombre réel ex : taille, poids, glycémie Nombre infini de valeurs possibles entre 2 valeurs quelconques Quantitative discrète Valeur est exprimé par un nombre entier ex : nombre d’enfants, nb de selles/jour Nombre fini de valeurs Remarques On peut transformer une V quantitative en V qualitative ordinale en déterminant des seuils (déterminer des classes de valeurs) Cette transformation induit une perte d’information Les opérations mathématiques et logiques ont un sens

Censurée : survenue d’un événement
Variable: types Censurée : survenue d’un événement Double valeur: Présence ou absence de l’événement Délai d’apparition de l’évènement similaire à 2 variables associées ex : Survenue d’un décès dans l’année qui suit opération comptage du décès (qualitatif) délai de survenue du décès (quantitatif) ex : Survenue d’une séquelle comptage de la séquelle (qualitatif) délai de survenue de la séquelle (quantitatif)

Variable: représentation des valeurs
suspension de virus de la mosaïque du tabac inoculée à des plants de tabac génotypiquement identiques sur une feuille de même rang entre les nervures d'un rang donné Mesure du temps de latence de la maladie (en jours) graphique paramètres de position Temps variable (13-34j) Malgré conditions standardisées = Variabilité biologique valeur centrale paramètres de dispersion écarts Tps de latence de l’échantillon = valeur centrale ± valeur d’écart

Statistiques descriptives
tirage au sort population échantillon sélection représentativité Ensemble exhaustif de sujets dont on a défini les caractéristiques Sous-ensemble fini issu d’une population Paramètres théoriques Paramètres observés Paramètres de position Paramètres de dispersion

Statuer sous incertitude
? Pour une variable X : on connaît les paramètres dans la population à quoi peut-on s’attendre dans un échantillon ? population échantillon tirage au sort ? Pour une variable X : on a calculé les paramètres dans un échantillon à quoi peut-on s’attendre dans la population ? population échantillon tirage au sort Pour une variable X : on a calculé les paramètres dans 2 échantillons peut-on conclure à un effet de la cause dans la population ? population effet ? CAUSE + - échantillon 1 tirage au sort échantillon 2

question Problématique Hypothèses H0 (hypothèse nulle) H1 (hypothèse alterne) Sous H0 : Test statistique Choix Vérification conditions Calcul de petit p = degré de signification Conclusion / seuil Seuil Conclusion / hypothèses Conclusion clinique Population 20% K Échantillon 31% K Substance X cancérigène? Comparaison % obs à % th Echantillon aléatoire issu de la population avec taux 20% (=X non cancérigène) Inverse Comparaison fréquence obs à th N grand P = 0,06 5% = 0,05 P > 0,05 donc non rejet de H0 Test statistique = test d’hypothèse

étapes des tests 1. Énoncé de la problématique 2. Hypothèses question
type de problème statistique (population, échantillons, type de variable) choix du seuil de signification = risque  (en général 5%) 2. Hypothèses toujours formulées en termes de population car fluctuations d’échantillonnage on veut conclure sur la (les) population(s) dont est/sont extrait(s) le(s) échantillon(s) observé(s) toujours 2 hypothèses hypothèse nulle (H0) : « rien ne change, pas d’effet … » échantillon(s) extrait(s) au hasard de la même population en général = inverse de ce que l’on cherche à montrer hypothèse alternative (H1) échantillon(s) non extrait(s) au hasard de la même population

étapes des tests 3. H0 est supposée vraie (démarche expérimentale) et calcul de petit p (degré de signification = proba d’avoir au moins une différence égale à celle observée) au moyen d’un test statistique Choix du test vérification conditions nombre de sujets normalité de distribution des variables 4. Conclusion statistique p >  : non rejet de H0 p   : rejet de H0 au risque p 5. Évaluation des biais éventuels biais de sélection biais de classement biais de confusion 6. Conclusion clinique cf cours biais

Risques et règles de décision
avant la décision … Supposition H0 vraie (hypothèse à réfuter) Test effectué donnant p (p-value): degré de signification = probabilité d’avoir une différence au moins égale à celle observée Règle de décision Si p   : H0 peu probable  rejet de H0 au risque p Si p >  : H0 probable  non rejet de H0 au risque p seuil  écart-réduit non rejet de H0 rejet de H0 H0 vraie p

Risques et règles de décision
rejet de H0 non rejet de H0 réalité H0 est vraie risque α faux positifs 1- α H1 est vraie 1-β (puissance) risque β faux négatifs risque α Seuil de signification ou risque de 1ère espèce ou erreur de type 1 probabilité de rejeter H0 alors que H0 est vraie exemple: risque de considérer un produit actif alors qu’il est inactif Fixé a priori avant le test en général 5% (mais < 5% dans les essais thérapeutiques si nouveau produit toxique) risque β risque de 2ème espèce ou erreur de type II probabilité de ne pas rejeter H0 alors que H1 est vraie exemple: risque de considérer un produit inactif alors qu’il est actif en général < 20% (parfois > 20% si comparaison de 2 produits à toxicité et coût similaires)

Degré de signification et conclusion statistique
Comparaison de 2 traitements différence cliniquement intéressante ou non cliniquement intéressante rejet de H0 (différence statistiquement significative) c’est peut être vrai (1-β) c’est peut être faux (α) non rejet de H0 (différence non statistiquement significative) C’est peut être par manque de puissance (β) La différence est peut être suffisamment faible (1- α)

règles de décision à 5% Si p   (5%) : H0 peu probable  rejet de H0 au risque p Si p > (5%) mais p  10% : H0 probable  non rejet de H0 au risque p mais tendance à la significativité Si p >  (5%) : H0 probable  non rejet de H0 au risque p 10% Seuil (5%) écart-réduit non rejet de H0 rejet de H0 H0 vraie p tendance

Rappels sur les principaux tests
Plan du Cours Rappels sur la méthode scientifique en Sciences de la Vie Rappels sur le raisonnement Rappels sur les principaux tests La causalité

Choix du test statistique dépend
Les tests Choix du test statistique dépend de la question: comparaison, liaison des types des variables: quantitative, qualitative, censurée Variable à expliquer (effet) Variables explicatives (cause, facteurs de confusion) des lois de probabilité suivies par les variables de la taille du/des échantillon(s) petits grands (N > 30) mais sont toujours des tests d’hypothèse demandent de suivre la même démarche

Tests: variables qualitatives
question, variables hypothèses tests Comparaison Fréquence (%) observée à fréquence (%) théorique H0 : F = Fth H1 : F  Fth Écart-réduit Chi2 de Pearson Fischer exact exemple: le % de diabétiques à Montpellier est-il le même que dans la population française ? Comparaison K fréquences (%) observées échantillons indépendants H0 : FA = FB = FC H1 : au moins une F est  Chi2 de Pearson Fischer exact exemple: % d’asthmatiques identiques dans 5 capitales européennes ? Comparaison K fréquences observées séries appariées H0 : égalité FT1 = F T2 H0 : différence F T1  F T2 Chi2 de Mc Nemar exemple: % de fumeurs est-il constant avant et après une nouvelle méthode de sevrage ? Liaison/relation deux variables qualitatives H0 : Indépendance, OR = 1 H1 : Liaison, OR  1 Chi2 de Pearson IC1- de OR Fisher exact exemple: maladie coronarienne et sexe ?

Tests: variables quantitatives
question, variables hypothèses tests Comparaison moyenne observée à moyenne théorique H0 : µ = µth H1 : µ  µth Écart-réduit Student, T test exemple: taux de glycémie des enfants « obèses » est-il dans la normale ? Comparaison 2 moyennes observées 2 échantillons indépendants H0 : µA = µB H1 : µA  µB Écart-réduit Student, T test Mann-Whitney, exemple: VEMS chez les asthmatiques selon le statut addiction au tabac Comparaison 2 moyennes observées 2 séries appariées H0 : égalité µT1 = µ T2 H1 : différence µ T1  µ T2 Student apparié, paired T test Wilcoxon apparié, test des signes (sign ou signed rank test) exemple: VEMS avant et après réadaptation à l’effort Comparaison 2 variances observées 2 séries appariées H0 : égalité vT1 = vT2 H1 : différence v T1  v T2 Test F exemple: variance TAS entre 2 groupes : sain # atteint de drépanocytose

Tests: variables quantitatives
question, variables hypothèses tests Comparaison K moyennes Échantillons indépendants H0 : indépendance, µA = µB = µC H1 : liaison, au moins une µ est  ANOVA Kruskall-Wallis exemple: groupe sanguin et carence martiale Liaison 2 variables quantitatives H0 : Indépendance,  = 0 H1 : Liaison,   0 Coefficient de corrélation linéaire  de Pearson  de Spearman exemple: taux de CD4 et charge virale chez les HIV naïfs de traitement

Corrélation linéaire 2 variables quantitatives
X et Y = 2 variables aléatoires continues événement élémentaire [x< X <x+dx , y< Y <y+dy] probabilité : P (x< X <x+dx , y< Y <y+dy) = f(x,y)dx.dy x = E(X) espérance de X y x2 = V(X) variance de X y Y = E(Y) espérance de Y x y2 = V(Y) variance de Y x Cov(X,Y) = E[(X- x)(Y- Y)] covariance théorique de X et de Y f(x,y) x y f(x) loi de Laplace-Gauss à deux dimensions

Corrélation linéaire - population
Coefficient de corrélation linéaire théorique Valeur: Propriétés nombre sans dimensions 0    1 ou –1    +1 renseigne sur l’indépendance entre X et Y Si  = 1 alors Y = aX +b (dépendance totale) Si X et Y indépendants (en proba) alors Cov(X,Y)=0 donc  = 0 attn : l’inverse n’est pas vrai Si  > 0 alors X et Y varient dans le même sens Si  < 0 alors X et Y varient en sens contraire

Corrélation linéaire - échantillon
Un échantillon de taille N 2 variables aléatoires X et Y mesurées sur les mêmes sujets 1er sujet x1 y1 2ème sujet x2 y2 … Nième sujet xN yN Valeurs calculées Mêmes propriétés que 

Corrélation linéaire - échantillon
Statistique inférentielle r est une variable aléatoire Seul point abordé comparaison de r à la valeur théorique 0 en considérant que cela revient à tester l’indépendance à la condition que les deux variables X et Y soient normales Problème échantillon taille N 2 variables normales X et Y coefficient observé r Hypothèses H0: E avec r provient au hasard de Pop avec  = 0 H1: E avec r provient au hasard de Pop avec   0 Calcul de r Lecture dans la table à (N-2) ddl

La causalité Plan du Cours
Rappels sur la méthode scientifique en Sciences de la Vie Rappels sur le raisonnement Rappels sur les principaux tests La causalité

et la conclusion … CONCLUSION CLINIQUE …. Conclusion généralisable si
randomisation Conclusion généralisable si Mesure effet valide, fiable Nombre de sujets suffisants Bonne randomisation Peu de perdus de vue Test statistiques adéquats Absence de biais cause mesure effet E1 E2 test RESULTAT statistique

Et généraliser ….

lien causal = faisceau d'arguments
Causalité lien causal = faisceau d'arguments Preuves expérimentales Reproductibilité : caractère systématique ou presque du lien Temporalité: la cause doit précéder son effet Relation dose-effet: plus la "dose" de cause augmente plus son effet (positif ou négatif) est augmenté Suppression de la cause: si la cause est supprimée, l'effet dû à la cause disparaît Spécificité: innocenter d'autres causes Cohérence avec d'autres données scientifiques Force de l'association statistique (RR ou OR élevé)

Schémas d’étude

Conclusion: de la rigueur
dans l’énoncé des hypothèses, de la question de recherche et des objectifs dans le choix et le recueil des variables à mesurer pour représenter la cause et l’effet … et les autres dans la sélection de la population dans la sélection des échantillons (groupes) – TAS/randomisation dans les analyses statistiques et dans la démarche amenant aux conclusions

SHA.MCS.Quanti Méthode Quantitative.

Présentations similaires

Présentation au sujet: "SHA.MCS.Quanti Méthode Quantitative."— Transcription de la présentation:

Présentations similaires

Notre projet

Feed-back

Entrer

S'autoriser via un réseau social:

SHA.MCS.Quanti Méthode Quantitative.

Présentations similaires

Présentation au sujet: "SHA.MCS.Quanti Méthode Quantitative."— Transcription de la présentation:

Présentations similaires

Notre projet

Feed-back