La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Génétique des Maladies Multifactorielles Stéphanie Debette MCU-PH Epidémiologie – Neurologie Lariboisière

Présentations similaires


Présentation au sujet: "Génétique des Maladies Multifactorielles Stéphanie Debette MCU-PH Epidémiologie – Neurologie Lariboisière"— Transcription de la présentation:

1 Génétique des Maladies Multifactorielles Stéphanie Debette MCU-PH Epidémiologie – Neurologie Lariboisière

2 Approche épidémiologique Epidémiologie génétique = Branche de lépidémiologie qui étudie le rôle de facteurs génétiques et de leur interaction avec des facteurs environnementaux dans la survenue de maladies Khoury et al., Fundamentals of Genetic Epidemiology, Oxford University Press 1993 Génétique des maladies multifactorielles

3 Physiopathologie: Meilleure compréhension des mécanismes moléculaires conduisant à la maladie Prédiction de risque: Identification de populations à risque de développer maladie, en fonction de patrimoine génétique Prévention ciblée (ou « Médecine personnalisée ») Pharmacogénétique: Identification de meilleurs répondeurs à traitement ou dindividus à risque accru deffets secondaires « Traitement personnalisé » McCarthy, Nat Rev Med 2008 Génétique des maladies multifactorielles: pourquoi?

4 Physiopathologie: Meilleure compréhension des mécanismes moléculaires conduisant à la maladie Prédiction de risque: Identification de populations à risque de développer maladie, en fonction de patrimoine génétique Prévention ciblée (ou « Médecine personnalisée ») Pharmacogénétique: Identification de meilleurs répondeurs à traitement ou dindividus à risque accru deffets secondaires « Traitement personnalisé » McCarthy, Nat Rev Med 2008 Génétique des maladies multifactorielles: pourquoi?

5 McCarthy, Nat Rev Genet 2008 Epidemiologie génétique Physiopathologie Identification de facteurs de susceptibilité génétique Meilleure compréhension de biologie sous-jacente Nouvelles Cibles thérapeutiques BiomarqueursPrévention ex: monitorer évolution maladie ex: mise en évidence FDR environnemental

6 McCarthy, Nat Rev Genet 2008 Identification de facteurs de susceptibilité génétique Meilleure compréhension de biologie sous-jacente Nouvelles Cibles thérapeutiques BiomarqueursPrévention ex: monitorer évolution maladie ex: mise en évidence FDR environnemental Epidemiologie génétique Physiopathologie

7 Découverte gènes de susceptibilité maladie de Crohn a révélé rôle central autophagie et exposition à microbes intestinaux Yano & Kurata, Nat Immunol 2009 Nouvelles voies pour approches thérapeutiques Abraham, NEJM 2009; Feero, NEJM 2010 Exemple de la maladie de Crohn… Gène NOD2: détecteur intracellulaire de peptidoglycanes bactériens Gène ATG16L1: dirige composants intracellulaires (microbes) vers lysosomes Targeting the human microbiome with antibiotics, probiotics, and prebiotics: gastroenterology enters the metagenomics era. Preidis, Gastroenterology 2009

8 McCarthy, Nat Rev Genet 2008 Identification de facteurs de susceptibilité génétique Meilleure compréhension de biologie sous-jacente Nouvelles Cibles thérapeutiques Biomarqueurs Prévention ex: monitorer évolution maladie ex: mise en évidence FDR environnemental Epidemiologie génétique Physiopathologie

9 Tabac risque de polyarthrite rhumatoïde de 1.5 en population générale, mais dun facteur > 20 si certains variants génétiques sur HLA et PTPN22 sont présents! Identification de FDR environnementaux par la génétique… Klareskog, Arthritis Rheum 2006 Amish porteurs de variant génétique sur gène FTO risque obésité sont protégés de obésité par activité physique Rampersaud, Arch Intern Med 2008; Kilpeläinen, PLOS Med 2011

10 Physiopathologie: Meilleure compréhension des mécanismes moléculaires conduisant à la maladie Prédiction de risque: Identification de populations à risque de développer maladie, en fonction de patrimoine génétique Prévention ciblée (ou « Médecine personnalisée ») Pharmacogénétique: Identification de meilleurs répondeurs à traitement ou dindividus à risque accru deffets secondaires « Traitement personnalisé » McCarthy, Nat Rev Med 2008 Génétique des maladies multifactorielles: pourquoi?

11 Cho & Gregersen, NEJM 2011 Ripatti, Lancet 2010 Epidemiologie génétique Prédiction de risque? Décevant jusquici, car variants génétiques identifiés jusquici = associés à augmentation modeste de risque (OR < 1.5) Même quand risque relatif plus élevé, pour linstant pas dapplication clinique dans majorité des cas: Allèle Epsilon4 de lApolipoprotéine E pour maladie dAlzheimer Allèles HLA pour maladies autoimmunes Combiner Différents variants génétiques (« scores de risque ») Variants génétiques + autres biomarqueurs (circulants, imagerie…)

12 Physiopathologie: Meilleure compréhension des mécanismes moléculaires conduisant à la maladie Prédiction de risque: Identification de populations à risque de développer maladie, en fonction de patrimoine génétique Prévention ciblée (ou « Médecine personnalisée ») Pharmacogénétique: Identification de meilleurs répondeurs à traitement ou dindividus à risque accru deffets secondaires « Traitement personnalisé » McCarthy, Nat Rev Med 2008 Génétique des maladies multifactorielles: pourquoi?

13 CYP2C19 = enzyme impliquée dans bioactivation du clopidogrel Allele CYP2C19*2 du variant génétique rs = associé à risque dévènements cardiovasculaires Scott, Clin Pharmacol Ther 2011 Pharmacogénétique, Exemple FDA / AHA: « boxed warning », évaluer au cas par cas Utilisation du Clopidogrel en fonction de génotype rs CYP2C19 chez patients traités par angioplastie pour syndrome coronarien aigu

14 I.Maladies complexes/multifactorielles vs. mendéliennes II.Etudes dassociation génétique vs. analyses de liaison III.Quelques rappels I.Variation génétique II.Equilibre de Hardy-Weinberg III.Déséquilibre de liaison IV.Etudes dassociation génétique (EAG) I.Etudes dassociation sur « gènes candidats » II.Etudes dassociation génétique pangénomiques V.Analyse et interprétation des EAG I.Tests multiples II.Hétérogénéité de population III.Réplication VI.Caractérisation des signaux identifiés, perspectives Génétique des maladies multifactorielles

15 I.Maladies complexes/multifactorielles vs. mendéliennes II.Etudes dassociation génétique vs. analyses de liaison III.Quelques rappels I.Variation génétique II.Equilibre de Hardy-Weinberg III.Déséquilibre de liaison IV.Etudes dassociation génétique (EAG) I.Etudes dassociation sur « gènes candidats » II.Etudes dassociation génétique pangénomiques V.Analyse et interprétation des EAG I.Tests multiples II.Hétérogénéité de population III.Réplication VI.Caractérisation des signaux identifiés, perspectives Génétique des maladies multifactorielles

16 Maladies mendéliennes Maladies mendéliennes (ou monogéniques) = causées par mutation dans un seul gène Trois modes de transmission: – Autosomique dominant – Autosomique récessif – Récessif lié à lX

17 Maladies complexes ou multifactorielles Maladies ayant de multiples facteurs de susceptibilité génétiques et facteurs de risque environnementaux Ne suit pas un mode de transmission mendélien Différentes façon de mesurer contribution de facteurs génétiques: Héritabilité: proportion de variance phénotypique due à effets génétiques Risque de récurrence: compare proportion dapparentés de cas qui sont atteints par maladie versus proportion dindividus atteints en population générale

18 I.Maladies complexes/multifactorielles vs. mendéliennes II.Etudes dassociation génétique vs. analyses de liaison III.Quelques rappels I.Variation génétique II.Equilibre de Hardy-Weinberg III.Déséquilibre de liaison IV.Etudes dassociation génétique (EAG) I.Etudes dassociation sur « gènes candidats » II.Etudes dassociation génétique pangénomiques V.Analyse et interprétation des EAG I.Tests multiples II.Hétérogénéité de population III.Réplication VI.Caractérisation des signaux identifiés, perspectives Génétique des maladies multifactorielles

19 Analyses de liaison (familles): Examiner la co-transmission dune génération à lautre du phénotype et des allèles de marqueurs génétiques Etudes dassociation génétique (population générale, cas/témoins): Comparer fréquence des variants génétiques, entre patients et témoins Outils en épidémiologie génétique Courtesy Dr. Dupuis

20 Analyses de liaison (familles): Examiner la co-transmission dune génération à lautre du phénotype et des allèles de marqueurs génétiques plus puissant pour maladies complexes Risch, Science 1996 Etudes dassociation génétique (population générale, cas/témoins): Comparer fréquence des variants génétiques, entre patients et témoins Outils en épidémiologie génétique

21 A A/CTGT T C Copie 1 A A/CTGT T C Copie témoins: CC : n= 10 AC : n= 180 AA : n= patients avec AVC: CC : n= 50 AC : n= 250 AA : n= 700 Single nucleotide polymorphism (SNP) Etudes dassociation génétique

22 Un allèle est associé à un phénotype si sa fréquence diffère plus entre cas et témoins que par le simple hasard. Cela nimplique PAS nécessairement un lien de causalité chromosome Phénotype A Variant génotypé B Variant causal non observé Déséquilibre de liaison Association directe (non observée) Association indirecte (observée) Etudes dassociation génétique

23 I.Maladies complexes/multifactorielles vs. mendéliennes II.Etudes dassociation génétique vs. analyses de liaison III.Quelques rappels I.Variation génétique II.Equilibre de Hardy-Weinberg III.Déséquilibre de liaison IV.Etudes dassociation génétique (EAG) I.Etudes dassociation sur « gènes candidats » II.Etudes dassociation génétique pangénomiques V.Analyse et interprétation des EAG I.Tests multiples II.Hétérogénéité de population III.Réplication VI.Caractérisation des signaux identifiés, perspectives Génétique des maladies multifactorielles

24 Quelques chiffres… ~3 milliards de paires de bases (nucléotides) dans séquence dADN humain 20,000 – 25,000 gènes: – 1.5% du génome (reste contient ADN non-codant, dont introns et séquences régulatrices) – Taille variable, de x100 bases à > 2 millions de bases 99.9% de la séquence dADN est identique dun individu à lautre – Portion variable fait la différence…

25 Types de variation génétique Single Nucleotide Polymorphism (SNP) = polymorphisme mononucléotidique – Variation individuelle dans séquence nucléotidique – Plusieurs millions de SNPs, fréq >1% (<1% = mutation ou SNV) A A/CTGT T C Copie 1 Chr (brin+) A A/CTGT T C 2 Allèles possibles: C ou A 3 Génotypes possibles: CC, CA, AA Copie 2 Chr (brin+)

26 Types de variation génétique Single Nucleotide Polymorphism (SNP) = polymorphisme mononucléotidique – Variation individuelle dans séquence nucléotidique – Plusieurs millions de SNPs, fréq >1% (<1% = mutation ou SNV) – Conséquences: Neutre: Séquence non codante, non régulatrice Séquence codante mais « synonyme »: exemple: ACC ou ACA même acide aminé (thréonine) Modification taux dexpression de gène Séquence régulatrice (non codante) Modification composition protéine: Séquence codante «non-synonyme» ou «missense» Séquence codante «non-sense» (induit codon stop) Intron, site dépissage (non codante)

27 Types de variation génétique « Copy number variants » = CNV: segment dADN ou gène présent en nombre variable de copies dun individu à lautre – Perte ou gain – Taille variable (10,000 – 5,000,000 bases) – Découverte plus récente que SNPs – Intra- ou intergénique Polymorphismes de répétition – Répétition de séquences en tandem, en nombre variable – Taille variable: Microsatellites, STR, VNTR – Intra- ou intergénique

28 Calcul de fréquences alléliques pour un SNP GénotypeN individus% AA20020% AG50050% GG30030% TOTAL % Quelle est la fréquence de lallèle A?

29 Calcul de fréquences alléliques pour un SNP GénotypeN individusN allèles AA A AG A 500 G GG G TOTAL Quelle est la fréquence de lallèle A? Freq (A) = (200x ) / 2000 = 0.45 Quelle est la fréquence de lallèle G?

30 Calcul de fréquences alléliques pour un SNP GénotypeN individusN allèles AA A AG A 500 G GG G TOTAL Quelle est la fréquence de lallèle A? Freq (A) = (200x ) / 2000 = 0.45 Quelle est la fréquence de lallèle G? Freq (G) = (300x ) / 2000 = 0.55

31 I.Maladies complexes/multifactorielles vs. mendéliennes II.Etudes dassociation génétique vs. analyses de liaison III.Quelques rappels I.Variation génétique II.Equilibre de Hardy-Weinberg III.Déséquilibre de liaison IV.Etudes dassociation génétique (EAG) I.Etudes dassociation sur « gènes candidats » II.Etudes dassociation génétique pangénomiques V.Analyse et interprétation des EAG I.Tests multiples II.Hétérogénéité de population III.Réplication VI.Caractérisation des signaux identifiés, perspectives Génétique des maladies multifactorielles

32 Equilibre de Hardy-Weinberg Dans une population dont l'effectif est infini (très grand), panmictique (mariages au hasard), en l'absence de mutation et de sélection, les fréquences alléliques et génotypiques restent constantes dune génération à lautre: Fréquence du génotype aa = p 2 Fréquence du génotype aA = 2pq Fréquence du génotype AA = q 2 où p = fréquence de lallèle a q = fréquence de lallèle A

33 Conditions de Hardy-Weinberg (HW) ne sont généralement pas strictement remplies dans la plupart des populations, mais généralement les génotypes suivent assez bien léquilibre de HW En labsence déquilibre de HW on doit se poser la question des causes potentielles Par exemple lors de génotypage sur plateformes à haut débit, labsence déquilibre de HW dans une population témoin est considéré un signe de génotypage de mauvaise qualité Equilibre de Hardy-Weinberg

34 Comment tester si équilibre de Hardy-Weinberg est présent? Equilibre de Hardy-Weinberg Test de « Goodness of Fit » où Oi = effectif observé pour génotype i Ei = effectif attendu pour génotype i si équilibre de HW X 2 suit une loi de Chi-2 à 1 degré de liberté En effet, normalement pour un test de chi-2 de 2 x 3 classes (observé/attendu, aa/aA/AA) il y a 2 degrés de liberté, mais ici on retire un degré de liberté supplémentaire, car on estime les fréquences alléliques à partir des génotypes observés Si équilibre de HW, alors test de Chi-2 est non significatif

35 Déséquilibre de liaison Soit 2 variants génétiques sur même chromosome -Variant 1: Alleles a et A, fréquences = p(a), p(A) -Variant 2: Alleles b et B, fréquences = p(b), p(B) On a 4 combinaisons (ou haplotypes) possibles: AB Ab aB ab Si les deux variants sont indépendants, i.e. en « équilibre de liaison », alors: p(AB)=p(A) x p(B) A/a B/b

36 Déséquilibre de liaison Soit 2 variants génétiques sur même chromosome -Variant 1: Alleles a et A, fréquences = p(a), p(A) -Variant 2: Alleles b et B, fréquences = p(b), p(B) On a 4 combinaisons (ou haplotypes) possibles: AB Ab aB ab Si les deux variants ne sont pas indépendants, ils sont dits en déséquilibre de liaison, i.e. p(AB)p(A) x p(B) Fréquence de AB dépend non seulement de p(A) et p(B) mais aussi du degré de déséquilibre de liaison (r2, D) A/a B/b

37 A/a B/b Indépendants Recombinaison

38 A/a B/b Dépendants Recombinaison

39 Un allèle est associé à un phénotype si sa fréquence diffère plus entre cas et témoins que par le simple hasard. Cela nimplique PAS nécessairement un lien de causalité chromosome Phénotype A Variant génotypé B Variant causal non observé Déséquilibre de liaison Association directe (non observée) Association indirecte (observée) Etudes dassociation génétique

40 I.Maladies complexes/multifactorielles vs. mendéliennes II.Etudes dassociation génétique vs. analyses de liaison III.Quelques rappels I.Variation génétique II.Equilibre de Hardy-Weinberg III.Déséquilibre de liaison IV.Etudes dassociation génétique (EAG) I.Etudes dassociation sur « gènes candidats » II.Etudes dassociation génétique pangénomiques V.Analyse et interprétation des EAG I.Tests multiples II.Hétérogénéité de population III.Réplication VI.Caractérisation des signaux identifiés, perspectives Génétique des maladies multifactorielles

41 Etudes dassociation sur gènes candidats: – Tester association de phénotype avec polymorphismes génétiques candidats Basé sur hypothèses a priori sur physiopathologie –Centaines détudes dassociation gène candidat publiées sur AVC, HSB, infarctus: peu de loci répliqués de façon convaincante –Principaux problèmes méthodologiques Petits effectifs Absence de réplication pré-planifiée Mauvais candidat... Etudes dassociation génétique

42 Exemples dhypothèses a priori conduisant à la sélection dun gène candidat: – Expérimentation animale: Etudes gène candidat Inactivation gène LRP1 dans cell. Musculaires lisses souris Anévrysmes Variants génétiques dans LRP1 = associés aux anévrysmes aorte chez lhomme? Boucher, Science 2003

43 Exemples dhypothèses a priori conduisant à la sélection dun gène candidat: –Association connue avec dautres maladies qui sont corrélées avec la maladie dintérêt Etudes gène candidat Alzheimer AVC Variants génétiques associés: GeneSNPchrFréq allèleOR (AD) ApoEepsilon CR1rs BIN1rs CLUrs PICALMrs Lambert, 2009; Seshadri, 2010; Naj, 2011; Hollingsworth, 2011

44 Exemples dhypothèses a priori conduisant à la sélection dun gène candidat: –Fonction du gène laisse supposer que pourrait être impliqué dans physiopathologie maladie Etudes gène candidat AVC Debette & Seshadri, Circ Cardiovasc Genet 2009 GenesPolymorphismsOR (IC95%) PAI-1 (Plasminogen activator inhibitor 1) Catto, 1997rs (-668/4G>5G)NS Jood, 2005rs NS CPB2 (Carbopeptidase B2, plasma = Thrombin-activable fibrinolysis inhibitor) Leebeek, A>G, 505A>G,1040C>TNS Ladenvall, 2007rs /rs /rs /rs /rs940OR=2.5( ) PLAT (Plasminogen activator, tissue) Jood, 2005rs NS Yamada, 2006rs NS VKORC1 (vitamin K epoxide reductase complex, subunit 1) Wang, 2006rs (2255T>C)OR=1.8( ) Shen, 2007rs OR=1.7( ) Gène de coagulation, hémostase

45 Choix des SNPs: par gènes, en fonction de coût et taille gène SNPs « indépendants » si possible, i.e. pas en déséquilibre de liaison SNPs potentiellement fonctionnels: –Codant non-synonyme –Dans région régulatrice (promoteur, 3UTR, site de fixation facteur transcription) –Dans intron, site épissage Etudes gène candidat

46 Etudes dassociation génétique pangénomiques = GWAS (genome-wide association study) – Génotyper un très grand nombre (500,000-5,000,000) de variants génétiques distribués sur lensemble des chromosomes PAS dhypothèse a priori sur les loci dintérêt – Récemment possible grâce au projet HapMap et aux technologies de génotypage à haut débit HapMap = projet international décrivant les variations génétiques fréquentes dans différents groupes ethniques Génotypage automatisé et rapide de milliers déchantillons, pour des x100,000 SNPs. Zeggini, Nature Genet 2005 Etudes dassociation génétique

47 Feero, NEJM 2010 Création micropuce Hybridisation dADN « marqué » Détection de fixation « séquence-spécifique » Interpretation informatisée

48 GWAS visant à identifier FDR génétiques dAVC (accident vasculaire cérébral) Population: 19,602 individus dorigine européenne Phénotype: AVC, 1,544 cas incidents SNPs: 2.5 Millions, sur les 22 autosomes GWAS – présentation résultats « Manhattan plot »

49 GWAS visant à identifier FDR génétiques dAVC (accident vasculaire cérébral) Population: 19,602 individus dorigine européenne Phénotype: AVC, 1,544 cas incidents SNPs: 2.5 Millions, sur les 22 autosomes GWAS – présentation résultats « Manhattan plot » p = 5 x10 -8 rs rs NINJ2 (chr12p13)

50 GWAS visant à identifier FDR génétiques dAVC (accident vasculaire cérébral) Population: 19,602 individus dorigine européenne Phénotype: AVC, 1,544 cas incidents SNPs: 2.5 Millions, sur les 22 autosomes GWAS – présentation résultats « Manhattan plot » p = 5 x10 -8 rs rs NINJ2 (chr12p13)

51 Ikram et al., NEJM 2009 GWAS – présentation résultats Représentation régionale des associations de SNPs avec AVC (chr 12p13)

52 Zondervan, Nature Protocols 2007 GWAS – contraintes logistiques Très grands effectifs nécessaires: – > 1,000, voire > 10,000 – Plus si variant rare – Plus si risque relatif faible Gènes candidat (18 ou 11 SNPs) GWAS (500,000 ou 300,000 SNPs)

53 Zondervan, Nature Protocols 2007 GWAS – contraintes logistiques Très grands effectifs nécessaires: – > 1,000, voire > 10,000 – Plus si variant rare – Plus si risque relatif faible Gènes candidat (18 ou 11 SNPs) GWAS (500,000 ou 300,000 SNPs)

54 GWAS – contraintes logistiques Supercalculateurs pour analyser données prestige des U.S.A et dAMD Nœud de connexion, travail sur Unix

55 GWAS – contraintes logistiques Coût encore élevés: – ~ 500 Euros pour génotyper 1 SNP sur 2000 sujets – ~ 400,000 Euros pour un GWAS sur 600,000 SNPs sur 2000 sujets – ~ 800,000 Euros pour un GWAS sur 5,000,000 SNPs sur 2000 sujets

56 Gènes candidats Limite analyse à régions sélectionnées sur données ou hypothèses préalables Avantages: – Coûte moins cher – Nécessite effectifs moindres Inconvénients: – Ne permet pas de découvrir de nouveaux gènes, non suspectés – Résultats très décevants en moyenne Genome-wide Analyse de variants répartis sur lensemble du génome, sans hypothèse préalable Avantages: – Permet de découvrir de nouveaux gènes (approche agnostique) – Couvre mieux variation génétique – A permis découverte x100 gènes Inconvénients: – Nécessite très grands effectifs (collaborations…) – Coût élevé – Infrastructure (supercalculateur) Etudes dassociation génétique

57 I.Maladies complexes/multifactorielles vs. mendéliennes II.Etudes dassociation génétique vs. analyses de liaison III.Quelques rappels I.Variation génétique II.Equilibre de Hardy-Weinberg III.Déséquilibre de liaison IV.Etudes dassociation génétique (EAG) I.Etudes dassociation sur « gènes candidats » II.Etudes dassociation génétique pangénomiques V.Analyse et interprétation des EAG I.Tests multiples II.Hétérogénéité de population III.Réplication VI.Caractérisation des signaux identifiés, perspectives Génétique des maladies multifactorielles

58 Tests multiples en étude dassociation génétique – Multiples SNPs – Dans un ou plusieurs gènes candidats – Genome-wide (500,000 à 5,000,000 SNPs) – Multiples phénotypes Comment en tenir compte dans interprétation résultats? Tests multiples

59 H 0 : pas dassociation entre SNP et M Tests multiples Réalité DécisionH 0 fauxH 0 vrai Rejeter H 0 correctfaux positif Ne pas rejeter H 0 faux négatifcorrect α = probabilité derreur de type I = probabilité de rejeter H 0, alors que H 0 = vrai = probabilité de déclarer une association à tort α = seuil de significativité pour un seul test statistique (α = 0.05) ß = probabilité derreur de type II = probabilité de ne pas rejeter H 0, alors que H 0 = faux = probabilité de ne pas détecter une association qui existe 1-ß = puissance du test

60 H 0 : pas dassociation entre SNP et M Tests multiples Réalité DécisionH 0 fauxH 0 vrai Rejeter H 0 correctfaux positif Ne pas rejeter H 0 faux négatifcorrect α = probabilité derreur de type I = probabilité de rejeter H 0, alors que H 0 = vrai = probabilité de déclarer une association à tort α = seuil de significativité pour un seul test statistique (α = 0.05) ß = probabilité derreur de type II = probabilité de ne pas rejeter H 0, alors que H 0 = faux = probabilité de ne pas détecter une association qui existe 1-ß = puissance du test

61 Correction de Bonferroni Si n tests: seuil de significativité = 0.05/n ou garder seuil à 0.05 mais multiplier p par n Exemple Testp Test Test20.03 Test Test40.10 Test50.02

62 Correction de Bonferroni Si n tests: seuil de significativité = 0.05/n ou garder seuil à 0.05 mais multiplier p par n Exemple Testp Test Test20.03 Test Test40.10 Test50.02 Surcorrige (conservateur) si tests ne sont pas indépendants, par exemple: SNPs en déséquilibre de liaison

63 En pratique… – Bonferroni – Autres méthodes: False Discovery Rate, Permutations – Dans GWAS, généralement seuil fixe à p=5x10 -8 Correspond à ~ 1 Million de tests indépendants Reflète à peu près la réalité, quelque soit la densité des puces Pour populations européennes… Tests multiples

64 Il faut tenir compte de la structure de la population Faux positifs (associations faussement significatives) si « stratification » de la population, i.e. si population contient plusieurs sous-populations différant par leur caractéristiques génétiques, notamment fréquences alléliques Campbell, Nat Genet 2005 Hétérogénéité ethnique

65 Population 1 Population 2 Allele 2 = 20% in cases and controls Allele 2 = 60% in cases and controls Population Allele 2 = 33% in cases and 45% in controls! cases controls

66 Il est donc essentiel de… – choisir des témoins de la même origine ethnique que les cas – autant que possible du même pays, voire de la même région Si différentes origines géographiques dans population étudiée, on peut: – stratifier lanalyse par origine géographique (i.e. par pays) – effectuer une analyse groupée en corrigeant sur la stratification par des méthodes statistiques (contrôle génomique, composantes principales) Hétérogénéité ethnique

67 Analyse en composantes principales = appliquée aux données GWAS (génotypes pangénomiques) pour inférer des axes continus de variation génétique Price, Nat Genet 2006

68 Essentielle pour confirmer quune association est réelle Importance dutiliser des échantillons de réplication indépendants Credibilité augmentée quand groupes dinvestigateurs multiples Réplication +++ Ikram, NEJM 2009 Réplication dans article initial 652/3613 caucasiens 2430 personnes avec 215 AVC incidents afro-américains Réplication dans étude asiatique 3784/3102 asiatiques Matsushita, J Hum Genet 2010

69 Essentielle pour confirmer quune association est réelle Importance dutiliser des échantillons de réplication indépendants Crédibilité augmentée quand groupes dinvestigateurs multiples Réplication +++ Ikram, NEJM 2009 Réplication dans article initial 652/3613 caucasiens 2430 personnes avec 215 AVC incidents afro-américains Réplication dans étude asiatique 3784/3102 asiatiques Matsushita, J Hum Genet 2010 Rosand, NEJM 2010

70 Calcul deffectif nécessaire doit tenir compte du winners curse Létude initiale tend typiquement à surestimer la force de lassociation Même groupe ethnique initialement Du fait de différences en fréquence allélique, déséquilibre de liaison, force de lassociation Extension à dautres groupes ethniques dans un 2è temps: Important pour la généralisabilité des résultats Permet daffiner le signal du fait de différences de déséquilibre de liaison, plus forte densité en SNPs... Réplication +++

71 Nature 2011; 475:

72 I.Maladies complexes/multifactorielles vs. mendéliennes II.Etudes dassociation génétique vs. analyses de liaison III.Quelques rappels I.Variation génétique II.Equilibre de Hardy-Weinberg III.Déséquilibre de liaison IV.Etudes dassociation génétique (EAG) I.Etudes dassociation sur « gènes candidats » II.Etudes dassociation génétique pangénomiques V.Analyse et interprétation des EAG I.Tests multiples II.Hétérogénéité de population III.Réplication VI.Caractérisation des signaux identifiés, perspectives Génétique des maladies multifactorielles

73 Refining the signal Ioannidis, Nat Rev Genet 2009 Where is the causative variant?

74 Refining the signal Ioannidis, Nat Rev Genet 2009 Where is the causative variant? Resequencing and fine mapping around confirmed signals

75 Refining the signal Ioannidis, Nat Rev Genet 2009 Where is the causative gene?

76 Refining the signal Ioannidis, Nat Rev Genet 2009 Where is the causative gene? Genome annotation Expression quantitative trait loci Experiments…

77 En ~5 ans, GWAS ont identifié des centaines de nouveaux loci associé avec diverses maladies, avec réplication solide La plupart dans gènes préalablement non suspectés Catalogue online (http://www.genome.gov/gwastudies ) 71 gènes pour maladie de Crohn Franke, Nat Genet gènes pour diabète de type 2 Voight, Nat Genet gènes pour maladie coronaire Shunkert, Nat Genet gènes pour Alzheimer Hollingworth, Nat Genet gènes pour AVC (problème hétérogénéité…) Succès et limites des GWAS…

78 Published Genome-Wide Associations through 6/2010, 904 published GWA at p<5x10 -8 for 165 traits NHGRI GWA Catalog

79 Prédisposition génétique aux AVC ischémiques Risque de et susceptibilité aux Facteurs de risque traditionnels Influence méchanismes responsables des sous-types dAVC ischémique HTA Diabète Hyperchol Obesité Tabac Athérome Maladie petites artères Fibrillation auriculaire Dissection Predispose to arterial thrombosis Module tolérance à ischémie cérébrale ? NINJ2 PITX2, ZFHX2 9p21, HDAC9 ? Other Gretarsdottir, Ann Neurol 2008 Bellenguez, Nat Genet 2012 Traylor, Lancet Neurol 2012 Ikram, NEJM 2009

80 En ~5 ans, GWAS ont identifié des centaines de nouveaux loci associé avec diverses maladies, avec réplication solide La plupart dans gènes préalablement non suspectés Catalogue online (http://www.genome.gov/gwastudies ) 71 gènes pour maladie de Crohn 23% héritabilité 38 gènes pour diabète de type 2 10% héritabilité 25 gènes pour maladie coronaire 10% heritabilité 12 gènes pour Alzheimer 4 gènes pour AVC (problème hétérogénéité…) Succès et limites des GWAS…

81 Variants rares 1000 génome Séquençage exons / genome entier (ESP-GO, CHARGE-S…) Exome chip Copy number variants Segments dADN présents en nombre variable de copies Modifications épigénétiques Modulent « emballage » ADN dans noyau et influencent expression ADN mitochondrial Perspectives Au-delà du GWAS…

82 Merci pour votre attention!


Télécharger ppt "Génétique des Maladies Multifactorielles Stéphanie Debette MCU-PH Epidémiologie – Neurologie Lariboisière"

Présentations similaires


Annonces Google