Matthieu Foll 28 aout 2008 Journées MAS A genome scan method to identify selected loci : A Bayesian perspective. Matthieu Foll 28 aout 2008 Journées MAS CMPG
L’adaptation locale Environnement Migration Taille efficace Différentiation génétique Dérive Sélection naturelle Fitness Quel facteur ? Quel facteur ? Quel gène ? Intensité ? Intensité ?
L’adaptation locale Environnement Migration Taille efficace Différentiation génétique Dérive Sélection naturelle Fitness Quel facteur ? Quel facteur ? Quel gène ? Intensité ? Intensité ?
Mesurer les variations génétiques « La variation, qu’elle qu’en soit la cause, est le phénomène essentiel de l’évolution » William Bateson Variation des fréquences alléliques Outils : Statistiques bayésiennes Marqueurs moléculaires Génétique des populations
L’ile et le continent p ~ Beta(θp, θ(1-p)) θ=4Nm A de fréquence p a de fréquen 1- p FST=1/(1+θ) Probabilité que deux gènes tirés aléatoirement dans une population aient un ancêtre commun dans celle-ci
Sewall Wright, 1931
Avec plusieurs allèles : Avec plusieurs iles : p p1 p2 … pJ Avec plusieurs allèles : Beta Dirichlet
Sans continent, avec beaucoup d’iles : FST 1 FST 3 FST 4 FST 2 p
Estimer les fréquences alléliques Dans chaque population j : Deux allèles : A de fréquence pj et a 1- pj On prélève nj allèles aléatoirement : épreuves de Bernoulli Le nombre total de A est une loi binomiale de paramètres nj et pj nj pj probabilité nj pj
Cas multi-allélique : A1, A2… Ak Chaque tirage peut donner k différents allèles La distribution binomiale devient « multinomiale »
Le modèle complet : … n1 p1 n2 p2 nJ pJ p FST 1 FST 2 FST J Multinomial Dirichlet N p FST Dirichlet-Multinomial
L’adaptation locale Environnement Migration Taille efficace Différentiation génétique Dérive Sélection naturelle Fitness
Identifier la sélection Force neutre : influence tous les marqueurs Force adaptative : influence certains marqueurs FST plus élevé : sélection directionnelle FST plus faible : sélection balancée On peut séparer ces effets en posant (Beaumont et Balding 2004) :
Les améliorations : Pour chaque locus i on propose le modèle neutre alternatif (αi=0) Sauts réversibles pour estimer la probabilité que chaque locus soit soumis à la sélection Extension aux marqueurs dominants Foll & Gaggiotti 2008 (in press)
Les AFLP : un marqueur dominant Détecte la présence d’une bande d’une longueur donnée chez un individu Pas de différence détectable si un individu possède 2 fois la même bande (homozygote) Présence [A] = AA ou Aa Absence [a] = aa
Les marqueurs AFLP Comment estimer les fréquences alléliques ? Hardy-Weinberg : f([a])=f(a)²=q² Hypothèses restrictives Prise en compte de la consanguinité : f([a])=f(aa) =q² (1-FIS)+q FIS AA: p² Aa: 2pq aa: q² AA: p aa: q (1-FIS) FIS Outbred Inbred
Simulations : 10 scénarios avec 1000 marqueurs chacun SNP AFLP Microsatellites très performants
Données humaine HGDP 53 populations, 1056 individus Forte violation du modèle en iles supposé Simulations de l’expansion spatiale : 4-5% de faux positifs pour p>0.99 Sur 560 marqueurs : 15% sous sélection directionnelle, 8% sous sélection balancée
Résumé Fst = indicateur de la différentiation locale Séparation variation neutre / adaptative Modèle bayesien en iles, plutôt robuste Avoir plusieurs populations : permet de détecter de la sélection balancée Utilisable pour des espèces non-modèles (AFLP) Merci : Oscar Gaggiotti, Mark Beaumont