Génétique d’association Domenica MANICACCI Julie FIEVET UMR de génétique végétale du Moulon, Gif sur Yvette
Qu’est ce que la génétique d’association ? Génétique quantitative moderne : Recherche de gènes impliqués dans la variation de caractères quantitatifs - mutants/sauvages : phénotypes extrêmes, « qualitatifs » - localisation de QTL: recherche d’associations statistiques entre variation phénotypique et variation moléculaire de marqueurs dans une population en ségrégation diversité génétique faible dans une population précision réduite IC = 10 à 50 cM OK pour introgression, SAM Pb. pour identification de gènes - génétique d’association : recherche d’associations statistiques entre variation phénotypique et variation moléculaire dans une population à large diversité très recombinée
Etapes de la génétique d’association Choix du matériel génétique (population) Caractérisation des polymorphismes moléculaires dans la population Caractérisation phénotypique de la population Analyse statistique d’association « génotype – phénotype »
entre génotype et phénotype Un exemple trivial… SNP Pheno A=1/G=0 9 SNP ou IDP 1 1 1 1 1 00000 1 1 1 1 1 00000 Association stricte entre génotype et phénotype 10 individus Mise en évidence statistique de l’association génotype – phénotype Interprétation de l’association statistique en termes biologiques
Interprétation d’une association statistique Les individus portant l’allèle 1 au locus L sont plus grands que ceux portant l’allèle 2 le locus L est un gène de taille causalité directe le locus L est proche (génétiquement) d’un gène de taille déséquilibre de liaison entre le locus L et le gène de taille dû à leur liaison génétique l’allèle 1 et l’allèle 2 viennent de sous-populations différentes pour la taille déséquilibre de liaison entre le locus L et le gène de taille dû à la structuration de la population
DL local et recherches d’associations Rafalski, 2002 QTL QTL consensus gènes cartographiés (fonction physio) Données synténiques riz Le DL local détermine la résolution des recherches d’associations
Le DL global (structure de la pop. et apparentement) peut générer des faux positifs dans les associations
63 RFLP : structure d’un panel de lignées de maïs ACP (analyse en composantes principales) Cornées européennes DL à l’échelle du génome entre marqueurs RFLP -1.93 -0.77 0.38 1.53 AXIS1 -1.34 0.12 1.58 3.04 AXIS2 -1.49 0.17 1.83 3.49 AXIS3 Chrj Chri LD Dentées Américaines Dubreuil et al. 1996
Choix de la population Population à DL restreint aux régions génétiquement proches : Population naturelle panmictique (diversité parfois réduite, panmixie réelle?) Génération d'une population artificielle diverse et panmictique (long!) Population représentative d’une espèce Core-collection : diversité maximale (max. nombre d’allèles) sur-représentation des origines rares ou intéressantes rarement panmictique, très souvent structurée Estimation du DL à grande échelle par estimation de la structure de la population
Etude de la structuration d’une population Inférence de la structure de l’échantillon par ACP sur marqueurs neutres. -1.93 -0.77 0.38 1.53 AXIS1 -1.34 0.12 1.58 3.04 AXIS2 -1.49 0.17 1.83 3.49 AXIS3 Dubreuil et al. 1996 Coordonnées sur les premiers axes de l’ACP
Etude de la structuration d’une population Inférence de la structure de l’échantillon à l’aide de marqueurs neutres et indépendants par approche bayésienne (cf notamment Pritchard et al.). Simulation : « Admixture » de 2 populations (d=0.5), 200 individus, 30 locus bialléliques supposés indépendants Pop1 Pop2 Pop3 Portion du génome issue des populations 1 et 2 Répartition probabiliste des individus dans les deux populations (proportions d’admixture) Individus Identification du nombre de populations (Max. Vrais.)
association SNP-phénotype Analyse d’association Structure ignorée : association SNP-phénotype Phénotype (Y) 1 SNP ANOVA à 1 facteurs : SNP Yi = moy + a*SNP + ei ≠
Analyse d’association : prise en compte de la structure POP1 POP2 Structure prise en compte : pas d’effet du SNP sur le phénotype Phénotype (Y) SNP1 SNP2 SNP3 SNP4 POP 1 2 ANOVA à 2 facteurs : SNP + POP Yi = moy + b*POP + a*SNP + ei ≠ = 1 SNP
Structure probabiliste SNP1 SNP2 SNP3 SNP4 POP1 POP2 1 0.2 0.8 0.5 0.3 0.7 0.6 0.4 0.9 0.1 1.0 0.0 POP1 POP2 i Phénotype (Y) Haplotypes + Population ANOVA avec covariable ( régression linéaire sur Pop1) Yi = moy + b*Prob(i->POP1) + a*SNP + ei Prob(i->POPj) : probabilité que l’individu i provienne de la population Pj = proportion de génome de i provenant de Pj
Caractérisation plus fine de l'apparentement dans l'échantillon: le model linéaire mixte (Yu et al. 2006) Phéno = μ + a.SNP + b.Q + ε Allèle au SNP K : Matrice d'apparentement entre individus SPAGeDi (Hardy & Vekemans 2002) γ.K + ε' Q : Matrice d'admixture pour faire de la genet d'assoc, il faut caracteriser la diversite neutre : Q et K la diversite pheno et la variabilite des genes candidats Implémenté dans TASSEL : http://www.maizegenetics.net/
Principe de la génétique d’association Objectif : Déceler si un gène est impliqué dans la variabilité d’un caractère agronomique d’intérêt. Choix d’une population à large diversité Diversité phénotypique Diversité neutre expérimentations contrôlées mesures quantitatives STRUCTURE Génétique d’association Diversité de gènes Séquençage, typage SNP
Recherche d’association Dwarf8 – précocité de floraison homologue à Gai (Arabidopsis) et Rht (blé) mutants nains et précoces colocalisation avec QTL de précocité (chr. 1) chez le maïs gène candidat pour ce QTL 6bp IDP (Thornsberry et al, 2001)
Définition d’une collection et étude de sa structure (Camus-Kulandaivelu et al. 2006) 375 inbred lines x 55 SSR Northern Flint European Stiff Stalk Corn Belt Dent Tropical Population structure
Recherche d’association Dwarf8 – précocité de floraison Phénotype : précocité en °J: Σ[(Tmax-Tmin)/2 – 6°] si Tmax>30, Tmax=30°C Structure : 67 SSR STRUCTURE 5 groupes qij = % d’appartenance de la lignée i au groupe j Cornés européens Tropicaux Corn Belt Dent Cornés américains Stiff Stalk Génotype : IDP6bp Dwarf8 0 = délétion ; 1 = insertion . = données manquantes 0 0 0 1 0 . 1 0 0 M. Fourmann, pers. com.
Recherche d’association Dwarf8 – précocité de floraison Ficher de données (DataD8.xls, 349 lignées) : . . . Y a-t-il une association entre génotype (IDP) et phénotype (précocité) ? Y a-t-il une différenciation génotypique pour l’IDP-6bp de Dwarf8 ? Y a-t-il une différenciation phénotypique entre groupes ? Y a-t-il une association entre génotype (IDP) et phénotype (précocité) en contrôlant pour l’effet de la structuration (SSR)
Association Dwarf8 – précocité de floraison Insertion Tropical Northern Flint European Stiff Stalk Corn Belt Dent Différenciation entre groupes pour la fréquence de l’IDP : Χ(4)² = 77,7; P = 5,4 10-16 Différenciation entre groupes pour la précocité : R²= 0.46; P = 5,3 10-45 Association Précocité – IDP: sans considérer les groupes R² = 0.11 F(1;346) = 44,24 P = 1,14 10-10 en considérant la structure R² = 0,004 F(1;342) = 2,77 P = 0.097 n.s. Adaptation géographique en partie due à D8 ? Problème de faux négatif ? Etude d’autres SNP voisins, dans et hors D8 (DL à courte distance)
Même effet inter et intra-groupe Insertion Tropical Northern Flint European Stiff Stalk Corn Belt Dent Même effet inter et intra-groupe adaptation locale + faible effet restant intra-groupe