MODULE FTH 2007 Diversité génétique Des notes en trois chapitres sur le cours Ivan Scotti, Caroline Scotti-Saintagne
1. Des diapos « bien », qui vous expliquent tout…
Quelques indices de diversité génétique Parallèle avec la diversité spécifique Ivan Scotti, Caroline Scotti-Saintagne Laboratoire de génétique écologique Kourou FTH 2006
! On raisonne maintenant au niveau INTRA SPECIFIQUE Importance d’étudier la diversité génétique L’importance d’étudier la diversité génétique réside dans la capacité adaptive des espèces à répondre aux variations environnementales. Faculté adaptative des espèces
A l’intérieur de la population Paramètres de polymorphisme Entre plusieurs populations La diversité génétique indique la présence ou l’absence de variants génétiques dans des entités génétiques différentes. Différentes mesures sont utilisées. A l’intérieur d’une population, la diversité sera mesurée par le niveau de polymorphisme Entre les populations, la diversité sera mesurée par la différenciation génétique. Paramètre de différenciation
PARAMETRES DE POLYMORPHISME
A) Richesse allélique Sensible à la taille de l’échantillon Nombre d’allèles différents présents dans une population - Pour un locus donné : - Si plusieurs loci : Nombre moyen d’allèle par locus 1 locus ayant 4 formes alléliques Nombre individu=12 Sensible à la taille de l’échantillon Ne tient pas compte de l’abondance La richesse allélique est sensible à la taille de la population : si la population contient beaucoup d’allèles rares, il est nécessaire d’échantillonner un grand nombre d’individus. Il existe d’autres indices de diversité qui prennent en compte les fréquences alléliques. Un allèle rare a le même poids qu’un allèle commun A=4 A=4
B) Taux d’hétérozygotie observé Nombre d’hétérozygotes dans la population Pour un locus donné : Nombre total d’individus H0= Au niveau multi locus :
C) Taux d’hétérozygotie attendue (théorique) Postulat de base de l’équilibre de Hardy-Weinberg : La population est panmictique : le choix du conjoint se fait de manière aléatoire Tous les individus participant au processus de reproduction appartiennent à la même génération La population est isolée : aucun gène n'est introduit par des migrants extérieurs La taille de la population est infinie Il n'y a pas de mutation au locus considéré 6 Il n'y a pas de sélection agissant sur le locus considéré Il faudra quelques années pour fonder la génétique des populations. En 1908, la loi dite de Hardy et Weinberg, permettant de calculer les fréquences génotypiques dans une population à l'équilibre, est proposée indépendamment par le mathématicien anglais Godfrey H. Hardy (1877-1947) et le médecin allemand Wilhelm Weinberg (1862-1937).
Loi de Hardy-Weinberg: Equilibre de la fréquence des allèles et des génotypes au cours des générations. Fréquence allélique Gamète 1 Gamète 2 A (p) a (q) AA Aa aa Cas d’un locus bi-allélique Fréquence génotypique p2+2pq+q2=1 Soit A et a, deux allèles de fréquence respectivement p et q. Avec : p² :la fréquence d'un génotype homozygote AA pour leux alléles q² : la fréquence d'un génotype homozygote aa pour leux allèles 2pq : la fréquence d'un génotype hétérozygote Aa La loi d'Hardy-Weinberg est : Dans une population isolée d'effectif limité, non soumise à la sélection, et dans laquelle il n'y a pas de mutations, les fréquences alléliques restent constantes. Si les accouplements sont panmictiques, les fréquences génotypiques se déduisent des fréquences alléliques. Cette loi décrit la structure génétique de nombreuses populations pour lesquelles les hypothèses de départ ne sont pas prospectées. Construction des courbes de prédiction des fréquences génotypiques.
l'axe horizontal indique les deux fréquences d'allèle p et q, Prédiction des fréquences génotypiques de la génération t+1 à partir des fréquences alléliques de la génération t Génotype : l’ensemble des allèles d’un individu l'axe horizontal indique les deux fréquences d'allèle p et q, l'axe vertical indique la fréquence des génotypes les trois génotypes possibles sont représentés par des courbes différents
= 1 Taux d’hétérozygotie attendue à l’équilibre de H-W: fréquence des génotypes hétérozygotes Somme des fréquences génotypiques He= + = = = La diversité génétique H est très peu sensible aux allèles rares (Pi2 proche de 0). La taille de la population à échantillonner est de l’ordre de 40 à 50 individus. = 1
Taux d’hétérozygotie attendue : Exprime la fréquence attendue d’hétérozygotes dans une population panmictique Mathématiquement équivalent à la probabilité de tirer au hasard deux gamètes de génotype différents dans la population des gamètes Quantité également appelée “Diversité génétique de Nei”. Formellement équivalente à l’indice de diversité de Simpson La formule de He est facilement adaptable au cas de n allèles avec fréquences p1, p2, p3, p4, ..., pn Existence d’organismes diploïdes générés par le croisement de deux gamètes Mais dérivée d’une réalité biologique :
Quelques chiffres pour illustrer : Homme : 6.7 % des individus en moyenne sont hétérozygotes pour un locus pris au hasard Espèces tropicales : Cedrela odorata H=0.033 Voshia ferriginosa H=0.16 Sweitenia macrophila H=0.22 Lonchocarpus costaricensis H=0.21 Chêne :
II. DIFFERENCIATION GENETIQUE
Locus bi-allélique (A,a) POP1 POP2 A l’équilibre de Hardy Weinberg : Fréquence alléliques égales dans les deux populations A1=pA1 A2=pA2 a1=qa1 a2=qa2 Si barrière aux flux de gènes : Fréquence alléliques différentes dans les deux populations A1=pA1 a1=qa1 A2=pA2 a2=qa2 POP1 POP2 Soient deux population 1 et 2. Soient un locus biallélique (A, a) avec pA1 et qa1 les fréquences respectives des allèles A et a dans la population 1 Et avec pA2 et qa2 les fréquences respectives des allèles A et a dans la population 2. La colonisation d'une région préalablement inoccupée par une espèce peut conduire à la formation de deux populations (ou sous-populations) qui tendront à avoir des fréquences alléliques similaires si le flux migratoire persiste. Cependant si le flux cesse, les deux populations évoluent de manière indépendante et peuvent acquérir, sous le simple effet du hasard, des constitutions génétiques différentes. La différenciation génétique mesure l’écart entre le taux d’hétérozygotes attendu dans l’hypothèse que les populations échangent librement des gènes et le taux d’hétérozygotes moyen observé
H1= 1-(pA12+qa12) H2= 1-(pA22+qa22) POP théorique (pA1+pA2) 2 AT= - Diversité intra- population : H1= 1-(pA12+qa12) H2= 1-(pA22+qa22) - Diversité moyenne intra- population Pour estimer le taux d’hétérozygotes théorique il faut estimer la diversité intra population (taux d’hétérozygote dans la pop1=1(-la proba de tirer des homozygotes aa +la proba de tirer des homozygotes aa). Idem pour la pop2 Calcule de la diversité moyenne sur les deux pop Calcule de la diversité dans une population virtuelle qui regroupe les individus de la pop1 et de la pop2 (cas où les pop 1 et 2 échangeraient librement des gènes). 1-(frequence des homozygotes AA dans la pop virtuelle + fréquence des homo aa dans la pop virtuelle) Diversité totale de la population théorique à l’équilibre :
Différenciation génétique Mesure l’écart entre le taux d’hétérozygotes attendu dans l’hypothèse que les populations échangent librement des gènes (HT) et le taux d’hétérozygotes moyen observé (HS) Différentiation génétique = HT - HS Une autre façon de voir la chose : FST de Wright FST représente la proportion de la diversité totale expliquée par l’écart des fréquences alléliques entre populations. S’il y a des barrières aux flux de gènes, toutes les populations ne partagent pas les mêmes allèles avec les mêmes fréquences la diversité cumulative est donc inévitablement supérieure à la diversité de la moyenne des populations. HT>HS si barrière aux flux de gènes HT=HS si population à l’équilibre de Hardy-Weinberg Une autre façon de voir la chose : FST représente la proportion de la diversité totale expliquée par l’écart des fréquences alléliques entre populations. On est donc conceptuellement dans le cadre de l’analyse de la variance. Ce lien intuitif peut être démontré mathématiquement. Permet de tester statistiquement la différenciation en posant comme hypothèse nulle que HT=Hs à l’équilibre de HW. Il y a donc un lien direct entre la variance des fréquences alléliques et la différenciation des populations. Ce lien permet de tester statistiquement la différenciation sur la base d’un modèle, car on peut établir un attendu théorique pour la diversité et pour la différenciation Permet de tester statistiquement la différenciation
Illustrations : Les gymnospermes sont moins différenciés entre populations que les angiospermes Lié au système de reproduction : Allogamie supérieure chez les gymnospermes Les populations de ligneux sont moins différenciées que les annuelles Populations d’espèces boréales et tempérées moins différenciées que les populations d’espèces tropicales Les espèces à répartition endémique sont plus différenciées que les espèces à distribution continentale Espèces tropicales réparties dans des petites populations. Beaucoup d’espèces rares Cedrela odorata fst entre 20 et 40% Voshia ferriginosa 30.7% Sweitenia macrophila 38, 2% Lonchocarpus costaricensis 20% Swietenia macrophylla (Meliaceae): as in the Amazonian forest (see above), this species has been subject to extensive extraction for timber and is increasingly threatened. Cedrela odorata (Meliaceae): an economically important timber species, which is already the subject of a number of tree improvement programmes and provenance trials in central America. It is monoecious , insect pollinated, and has wind dispersed seed. Vochysia ferruginea (Vochysiaceae): a multipurpose, self compatable, tree species, pollinated by insects and hummingbirds, with wind- and animal-dispersed seed. It is a promising timber species suited to commercial development as regenerated forest on degraded land. Lonchocarpus costaricensis (Leguminoseae): an important species for fuelwood, timber and the production of a natural nematicide. It is endemic to the Pacific coast of Costa Rica. It is bee-pollinated. Variation entre populations : Conifères : entre 5 et 10 % Chênes entre 3 et 8 % Arbres tropicaux (4) entre 20 et 40%
2. Une autre façon, un peu plus tordue, de voir la chose…
Calcul des fréquences génotypiques à partir des fréquences des allèles (en conditions de croisement aléatoire) Gamète 1 A (p) a (q) Gamète 2 A (p) AA Aa a (q) Aa aa
Hétérozygosité “attendue” Exprime la fréquence attendue d’hétérozygotes dans une population panmictique; mathématiquement équivalent à la probabilité de tirer au hasard deux gamètes de génotype différent dans la population des gamètes Cette quantité est également appelée “Diversité génétique de Nei”; elle est formellement équivalente à l’indice de diversité de Shannon mais est dérivée d’une réalité biologique: l’existence d’organismes diploïdes générés par le croisement de deux gamètes La formule de He est facilement adaptable au cas de n allèles avec fréquences p1, p2, p3, p4, ..., pn
Diversité et différenciation Selon le formalisme emprunté à l’analyse de la variance, il est possible de lier la diversité génétique (variabilité des fréquences alléliques à l’intérieur d’une population) et la différenciation génétique (variabilité des fréquences alléliques entre populations) Pour n populations A, B, C,...N, et m allèles 1,2,3,..., m: La diversité génétique est une fonction de la variance des éléments de chaque colonne; La différenciation génétique est une fonction de la variance des éléments de chaque ligne
Diversité et différenciation Pour estimer la différenciation il est pratique d’introduire un paramètre, le F de Wright, qui exprime le manque d’hétérozygotes, par rapport à l’attendu, causé par des restrictions imposées au libre croisement (intra population: croisement préférentiel; entre populations: barrières au flux de gènes). Fréquences génotypiques attendues avec croisement libre… …et avec restrictions au croisement libre:
Différenciation entre populations La différenciation entre populations est exprimée par la valeur de F de Wright appliquée au niveau des comparaisons entre populations: Ecart entre la diversité de l’ensemble des populations (HT) et la moyenne des diversités (HS) de chaque population. S’il y a des barrières au flux de gènes, toutes les populations ne partagent pas les mêmes allèles avec les mêmes fréquences: la diversité cumulative est donc inévitablement supérieure à la diversité de la moyenne des populations. Une autre façon de voir la chose: FST représente la proportion de la diversité totale expliquée par l’écart des fréquences alléliques entre populations. On est donc conceptuellement dans le cadre de l’analyse de la variance. Ce lien intuitif peut être démontré mathématiquement.
Différenciation et variance Sur la base de la formule de la fréquence attendue des homozygotes en présence de restriction au flux de gènes: Il y a donc un lien direct entre la variance des fréquences alléliques et la différenciation des populations. Ce lien permet de tester statistiquement la différenciation sur la base d’un modèle, car on peut établir un attendu théorique pour la diversité et pour la différenciation .
3. Cadeau: les notes du cours au tableau
1/2
2/2