Campus International de Baillarguet, Thierry de Meeûs Centre International de Recherche-Développement sur l’Elevage en zone Subhumide (CIRDES), N559, rue 5.31, 01 BP 454, Bobo-Dioulasso 01, Burkina-Faso. Laboratoire de recherches et de coordination sur les Trypanosomoses, UMR177 IRD/CIRAD, TA A-17/G, Campus International de Baillarguet, 34398 Montpellier Cedex 5, France. E-mail: demeeus@mpl.ird.fr http://gemi.mpl.ird.fr/SiteSGASS/SiteTDM/EnseignMeeus.html
Proportions de Hardy-Weinberg f( ) = + = p f( ) = q f( ) = p² ; f( ) = 2pq ; f( ) = q²
ft(A)=pt, ft(a)=qt=1-pt Equilibre de Hardy-Weinberg Aa Ht aa Rt AA Dt ft(A)=pt, ft(a)=qt=1-pt Panmixie (hermaphrodites) Taille de population N~∞ Migration m=0 Mutation u=0 Pas de sélection En une génération
ft(A)=pt, ft(B)=qt , ft(C)=rt=1-pt-qt Equilibre de Hardy-Weinberg avec trois allèles AA At AB Bt AC Ct BB Dt BC Et CC Jt ft(A)=pt, ft(B)=qt , ft(C)=rt=1-pt-qt En une génération
Equilibre de Hardy-Weinberg avec Dominance AA Aa aa Rt Dt ft(A)=pt, ft(a)=qt=1-pt Hypothèse: la population vérifie des proportions panmictiques; hypothèse (très) forte
Equilibre de Hardy-Weinberg quand N petit: la dérive Ft: probabilité de tirer deux allèles identiques par ascendance dans la population à la génération t
Equilibre de Hardy-Weinberg quand N petit: la dérive Ft: probabilité de tirer deux allèles identiques par ascendance dans la population à la génération t
Equilibre de Hardy-Weinberg quand N petit: la dérive Panmixie, Migration m=0, Mutation u=0, Pas de sélection
Effectif efficace d'une population dioïque Chez des monoïques, la probabilité de tirer deux fois le même allèle par hasard est τe=1/2N Quelle probabilité τd chez des dioïques, avec N=Nf+Nm et accouplements aléatoires (pangamie)? Si même grand mère Si même grand père
Effectif efficace d'une population dioïque Chez des monoïques, la probabilité de tirer deux fois le même allèle par hasard est τe=1/2N Quelle probabilité τd chez des dioïques, avec N=Nf+Nm et accouplements aléatoires (pangamie)? Si même grand mère Si même grand père 2 2
Effectif efficace d'une population dioïque Chez des monoïques, la probabilité de tirer deux fois le même allèle par hasard est τe=1/2N Quelle probabilité τd chez des dioïques, avec N=Nf+Nm et accouplements aléatoires (pangamie)? On cherche Ne tel que τd=τe Si Nf=99 et Nm=1 alors Ne=3.96
Effectif efficace d'une population dioïque Tailles de populations réduites Balloux Sex ratio équilibré Sex ratio équilibré
Pour plus d’un locus: les désequilibres de liaison Deux loci 1 et 2 Locus 1 Locus 2 11 12 22 11 12 22 D1 H1 R1 D2 H2 R2 1→p1 1→p2 Gamètes ou haplotypes 1_1: p1p2+Dt 1_2: p1(1-p2)-Dt 2_1: (1-p1)p2-Dt 2_2: (1-p1)(1-p2)+Dt Dt=p1_1-p1p2 Au maximum D=[-0.25,+0.25] e.g. quand p1_2 et p2_1=0.5, ou quand p1_1 et p2_2=0.5
Pour plus d’un locus: les désequilibres de liaison Deux loci 1 et 2 Locus 1 Locus 2 Gamètes 1_1: P1_1=p1p2+Dt 1_2: P1_2= p1(1-p2)-Dt 2_1: P2_1=(1-p1)p2-Dt 2_2: P2_2=(1-p1)(1-p2)+Dt 11 12 22 11 12 22 D1 H1 R1 D2 H2 R2 1→p1 1→p2 Dmax alors P1_2=0 ou p2_1=0, P1_2 et P2_1 devant être ≥0 Dmin alors P1_1=0 ou p2_2=0, P1_1 et P2_2 devant être ≥0
Pour plus d’un locus: les désequilibres de liaison Deux loci 1 et 2 Locus 1 Locus 2 Gamètes 1_1: P1_1=p1p2+Dt 1_2: P1_2= p1(1-p2)-Dt 2_1: P2_1=(1-p1)p2-Dt 2_2: P2_2=(1-p1)(1-p2)+Dt 11 12 22 11 12 22 D1 H1 R1 D2 H2 R2 1→p1 1→p2 Si le taux de recomninaison est r et la reproduction panmictique N grand
Pour plus d’un locus: les désequilibres de liaison Quelles forces évolutives génèrent et/ou maintiennent du déséquilibre de liaison? Toutes: mutation, dérive, système de reproduction, sélection, migration et bien sûr le degré de liaison
Altérations des proportions de Hardy Weinberg Déficits en hétérozygotes Taenia solium Nasonia vitripenis Endogamies Sousdominance Effet Wahlund Rh-Rh- Rh+Rh- Homogamie Causes techniques Allèles nuls Dominance des allèles courts
Autofécondation A 1/2 a A 1/2 AA 1/4 Aa a 1/2 aa AA Aa aa Dt Ht Rt s: autofécondation 1-s: panmixie Taille de population, N grand Taux de mutation u=0 Taux de migration m=0 A 1/2 a A 1/2 AA 1/4 Aa a 1/2 aa
Autofécondation AA Aa aa Dt Ht Rt
Autofécondation AA Aa aa Dt Ht Rt
A l’équilibre, Ht=Ht+1=Heq Autofécondation AA Aa aa Dt Ht Rt A l’équilibre, Ht=Ht+1=Heq
A l’équilibre, Ht=Ht+1=Heq Autofécondation AA Aa aa Dt Ht Rt A l’équilibre, Ht=Ht+1=Heq
A l’équilibre, Ht=Ht+1=Heq Autofécondation AA Aa aa Dt Ht Rt A l’équilibre, Ht=Ht+1=Heq
A l’équilibre, Ht=Ht+1=Heq Formule généralisée de Wright Autofécondation AA Aa aa Dt Ht Rt A l’équilibre, Ht=Ht+1=Heq Formule généralisée de Wright
Endogamies Pour les loci concernés 0.1 0.2 0.3 0.4 0.5 10 20 30 40 50 0.1 0.2 0.3 0.4 0.5 10 20 30 40 50 t H Autofécondation 100% ou homogamie codominante Croisements frère/soeur 100 % Homogamie 100% (p=0.5) Homogamie 100% (p=0.25) Homogamie 100% (p=0.75) Pour les loci concernés dominante
Effet Wahlund
Effet Wahlund
Effet Wahlund
Effet Wahlund
fNpt²+ 2pt(1-pt)(1-s)fN+ fN(1-pt)² Sousdominance Panmixie, grande population de taille N, pas de mutation ni de migration, fécondité de f (>1) 2 allèles, A et a de fréquence pt et 1-pt à la génération t AA Aa aa Fitness 1 1-s Zygotes fNpt² 2pt(1-pt)(1-s)fN fN(1-pt)² Régulation fNpt²+ 2pt(1-pt)(1-s)fN+ fN(1-pt)² Fréquences t+1 Fitness moyenne
2 allèles, A et a de fréquence pt et 1-pt à la génération t Sousdominance 2 allèles, A et a de fréquence pt et 1-pt à la génération t AA Aa aa Fitness 1 1-s Fréquences t+1
Sousdominance 2 allèles, A et a de fréquence pt et 1-pt à la génération t Equilibre quand les fréquences ne bougent plus i.e. quand Δp=pt+1- pt=0 =A2*(1-A2)*(2*A2-1)
Altérations des proportions de Hardy Weinberg Excès d'hétérozygotes Superdominance Hétérogamie Anémie falciforme et Plasmodium falciparum HLA Clonalité Candida albicans Trypanosoma brucei Biais de dispersion sexe spécifique Ixodes ricinus Hétérosis Schistosoma
fNpt²(1-s)+ 2pt(1-pt)fN+ fN(1-pt)²(1-s) Superdominance Panmixie, grande population de taille N, pas de mutation ni de migration, fécondité de f (>1) 2 allèles, A et a de fréquence pt et 1-pt à la génération t AA Aa aa Fitness 1-s 1 Zygotes fNpt²(1-s) 2pt(1-pt) fN fN(1-pt)²(1-s) Régulation fNpt²(1-s)+ 2pt(1-pt)fN+ fN(1-pt)²(1-s) Fréquences t+1
2 allèles, A et a de fréquence pt et 1-pt à la génération t Superdominance 2 allèles, A et a de fréquence pt et 1-pt à la génération t AA Aa aa Fitness 1-s 1 Fréquences t+1
Superdominance 2 allèles, A et a de fréquence pt et 1-pt à la génération t s<1 =A2*(1-A2)*(1-2*A2) AA: 1-s; Aa: 1; Aa: 1-s; féquilibre(AA)+féquilibre(aa)=1/2 s/2 individus perdus à chaque génération=Fardeau génétique
Donc l’équilibre est atteint quand ABeq=ACeq=BCeq=1/3 Hétérogamie AB AC BC ABt ACt BCt Donc l’équilibre est atteint quand ABeq=ACeq=BCeq=1/3
Hétérogamie Allèle D? AB AC BC ABt ACt BCt
Clonalité Pas de mutation ni de migration, grande population, pas de sélection proportion c investie en reproduction clonale et 1-c en panmixie AA Aa aa Dt Ht Rt A l’équilibre Ht=Ht+1=Heq et donc: Convergence vers HW mais forts désequilibres de liaison attendus
Clonalité +Dérive +Mutation AA Aa aa Dt Ht Rt Aa Ho_eq~1
F statistiques de Wright AA Aa aa Do Ho Ro H: probabilité de tirer deux allèles différents, dans un individu d’une sous-population (HI) dans deux individus de la même sous-population (HS)
Modèle en îles de Wright
F-statistiques de Wright Modèle en îles de Wright, n très grand, 2 allèles n îles, un locus à deux allèles de fréquences pi et 1-pi dans l’île i HI: Hétérozygotie moyenne des individus sur l’ensemble des îles HeS: Hétérozygotie observée si la reproduction était panmictique à l’intérieur de chaque sous-population HeT: Hétérozygotie observée si la reproduction était panmictique sur l’ensemble
F-statistiques de Wright Modèle en îles de Wright, n très grand, 2 allèles n îles, un locus à deux allèles de fréquences pi et 1-pi dans l’île i FIT: Homozygotie relative des individus dans la totalité qui prend en compte les effets de la subdivision et de la déviation locale par rapport à HW FST: Homozygotie relative entre individus des sous-populations en supprimant l’effet de la déviation locale par rapport à HW et en ne tenant donc compte que de l’effet de subdivision (Wahlund)
F-statistiques de Wright Modèle en îles de Wright, n très grand, 2 allèles FST: Homozygotie relative entre individus des sous-populations en supprimant l’effet de la déviation locale par rapport à HW et en ne tenant donc compte que de l’effet de subdivision (Wahlund)
F-statistiques de Wright Modèle en îles de Wright, n très grand, 2 allèles FST: Homozygotie relative entre individus des sous-populations en supprimant l’effet de la déviation locale par rapport à HW et en ne tenant donc compte que de l’effet de subdivision (Wahlund)
F-statistiques de Wright Modèle en îles de Wright, n très grand, 2 allèles FST: Homozygotie relative entre individus des sous-populations en supprimant l’effet de la déviation locale par rapport à HW et en ne tenant donc compte que de l’effet de subdivision (Wahlund) Variance maximale des fréquences alléliques obtenues quand: dans populations et dans populations
F-statistiques de Wright Modèle en îles de Wright, n très grand, 2 allèles FST: Homozygotie relative entre individus des sous-populations en supprimant l’effet de la déviation locale par rapport à HW et en ne tenant donc compte que de l’effet de subdivision (Wahlund) Les F de Wright sont aussi des rapports de variance
F-statistiques de Wright cas général: plus de deux allèles, n quelconque H: probabilité de tirer deux allèles différents, dans un individu d’une sous-population (HI) dans deux individus de la même sous-population (HS) dans deux sous-populations différentes du total (HT)
F-statistiques de Wright cas général: plus de deux allèles (K>>2), n quelconque H: probabilité de tirer deux allèles différents, dans un individu d’une sous-population (HI) dans deux individus de la même sous-population (HS) dans deux sous-populations différentes du total (HT) Q=1-H: probabilité de tirer deux allèles identiques, dans un individu QI, dans deux individus de la même sous-population QS et dans deux sous-populations différentes QT HI: Hétérozygotie moyenne observée HS: Diversité génétique des sous-populations HT: Diversité génétique totale Nei
F-statistiques de Wright cas général: plus de deux allèles, n quelconque Chesser & Nei (1-FIT)=(1-FIS)(1-FST) Weir Rousset
Les F-Statistiques de Wright FIT FIS F IS l
Les F-Statistiques de Wright Inférences Autofécondation AA Aa aa Dt Ht Rt A l’équilibre, Ht=Ht+1=Heq Formule généralisée de Wright
Les F-Statistiques de Wright Inférences Modèle en îles de Wright, n grand, m et u petit, K grand: QT~0 panmixie locale: QI=QS
Les F-Statistiques de Wright Inférences Modèle en îles de Wright, n grand, m et u petit, K grand: QT~0 panmixie locale: QI=QS A l’équilibre migration/mutation/dérive
Les F-Statistiques de Wright Inférences Modèle en îles de Wright, n grand, m et u petit, K grand: QT~0 panmixie locale: QI=QS A l’équilibre migration/mutation/dérive
Les F-Statistiques de Wright Inférences Modèle en îles de Wright, n grand, m et u petit, K grand: QT~0 panmixie locale: QI=QS A l’équilibre migration/mutation/dérive On néglige les termes en m², u² et mu On néglige les termes en m et u devant 1
Les F-Statistiques de Wright Inférences Modèle en îles de Wright, n grand, m et u petit, K grand: QT~0 panmixie locale: QI=QS; FST=QS A l’équilibre migration/mutation/dérive si u<<m FST_max si m=0 FST_max ≈QS=1-HS FST’ =FST/FST_max
Les F-Statistiques de Wright Modèle en îles fini (n petit), avec homoplasie (K petit) et une proportion s d’autofécondation locale
Les F-Statistiques de Wright Autres modèles de populations Stepping stone (en pas Japonais) et Voisinage 1 D 3 D 2 D
Les F-Statistiques de Wright Autres modèles de populations Stepping stone (en pas Japonais) et Voisinage 2 D 1 D
Stepping stone (en pas Japonais) et Voisinage Rousset 2 D 1 D Pente b De: Densité efficace d’individus (/m ou /m²) σ: distance entre adultes reproducteurs et leurs parents
Estimations d’effectifs efficaces Différenciation génétiques entre échantillons séparés dans le temps Ne: Waples Dans l’espace et le temps Ne et m: Wang & Whitlock Déséquilibres de liaisons Ne: Bartley et al., Waples & Do Excès d’hétérozygotes (dioïques ou autoincompatibles) Ne: Balloux Déséquilibres inter et intra loci sur données spatiales Ne et m: Vitalis & Couvet
Les F-Statistics de Wright FIT FIS Taille de sous-échantillons Ns=1 Estimations RAPPEL: Variance: s² = [1/n].Si[(xi-x)²] ; s² = [1/(n-1)].Si[(xi-x)²] Estimateurs f et θ de Weir & Cockerham F IS l
Estimateurs des F de Wright variance d’estimation forte pour K allèles noté de A=1 à K Weir & Cockerham non biaisés variance d’estimation forte FIS FST FIT
F-statistiques pour plus de trois niveaux hiérarchiques >>0 ~0 ~0 ~0 Yang
F-statistiques chez les clones Que des hétérozygotes => QI=0 Si n grand et m petit QT~0 Si n=2 et m petit
Procédures statistiques Calculs d’intervalles de confiance (IC) des F-statistiques Bootstrap (e.g. sur les loci): on rééchantillonne aléatoirement k fois (e.g. 5000) avec remise. On peut donc tirer plusieurs fois le même item (e.g. locus) et on calcule F à chaque tirage.
Procédures statistiques Calculs d’intervalles de confiance (IC) des F-statistiques Jackknife (e.g. sur les sous-échantillons): on retire un item à la fois (e.g. un sous-échantillon) et on recalcule F sur ceux qui restent. On obtient autant de valeurs qu’il y a d’items dont on tire une moyenne et une variance pour F qui sert au calcul d’une erreur standard du F. Sous l’hypothèse de normalité on peut estimer un IC qui correspond à F±StdErr(F)tα,γ, où t se trouve dans une table du t, où α correspond au seuil désiré (0.05 pour un CI à 95%, 0.01 pour 99%) et γ au degré de liberté (i.e. nombre d’items-1)
Procédures statistiques: IC 95% du Jackknife Table du t n-1 t(α=0.05) 1 12.706 21 2.08 45 2.014 2 4.303 22 2.074 50 2.009 3 3.182 23 2.069 55 2.004 4 2.776 24 2.064 60 5 2.571 25 2.06 65 1.997 6 2.447 26 2.056 70 1.994 7 2.365 27 2.052 80 1.99 8 2.306 28 2.048 90 1.987 9 2.262 29 2.045 100 1.984 10 2.228 30 2.042 110 1.982 11 2.201 31 2.04 120 1.98 12 2.179 32 2.037 130 1.978 13 2.16 33 2.035 140 1.977 14 2.145 34 2.032 150 1.976 15 2.131 35 2.03 200 1.972 16 2.12 36 2.028 250 1.97 17 2.11 37 2.026 300 1.968 18 2.101 38 2.024 400 1.966 19 2.093 39 2.023 500 1.965 20 2.086 40 2.021 1000 1.962 FIS=0.2 10 loci StdErr(FIS)=0.01 l’IC 95% sera 0.2-2.2620.01 et 0.2+2.2620.01 soit 95% IC=[0.177, 0.223]
Procédures statistiques Tests de significativité des F, des déséquilibres de liaison ou de différences entre groupes ou types d'individus Tests de randomisations: Simuler H0 un très grand nombre de fois; la P-value du test = la proportion des valeurs simulées qui sont aussi extrêmes ou plus extrêmes que celle observée dans l’échantillon Il est important de bien appréhender ce qu’il y a derrière H0 et H1: que cherche-t-on à tester exactement? Nombre de randomisations: 10000 si permutations, au moin 1 000 000 si chaine de Markhov
Analyses multivariées AFC ACP PC1 (48%inertia) P < 0.001 PC2 (21%inertia) P < 0.001 Mouette Guillemot Macareux Tests d’assignment Macareux – 95% Mouette – 82% Guillemot – 89% ACP des populations de tique
Exploration d’une structure cachée d’inférence de structure AFC Méthodes Bayésiennes d’inférence de structure de populations Structure BAPS
Méthodes directes Méthodes indirectes
Structure d'une Population Taille des Unités de Reproduction Migration
Phe-Pro-Leu-Ileu-Val Neutralité: une hypothèse assez forte TYPES DE MARQUEURS Microsatellites Primer1 CTCTCTCT AGAGAGAG Primer2 mRNA Primer1 CTCTCTCTCT AGAGAGAGAG AUGCAGCCAUAGGCG Primer2 PCR Enzymes Phe-Pro-Leu-Ileu-Val + + - - Electrophorèse Neutralité: une hypothèse assez forte
Génétique des populations d' Ixodes ricinus et borréliose de Lyme en Suisse B. burgdorferi B. valaisiana B. garinii B. afzelii B. Spielmanii
Déficits en hétérozygotes 0.1 0.2 0.3 0.4 0.5 0.6 0.7 IR8 IR25 IR27 IR32 IR39 All f ( F is estimator) -1 -0.75 -0.5 -0.25 0.25 0.5 0.75 1 109 111 113 115 117 119 121 123 125 127 129 131 Allele size F is (partials) 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 111 113 115 117 119 121 123 125 127 129 131 Allele size F is pi's balanced pi's bell shaped pi's decreasing pi's increasing pi's randomised
Distribution sexe spécifique du polymorphisme Biais de dispersion sexe spécifique des tiques B. burgdorferi B. valaisiana B. garinii B. afzelii
Détection des Borrelia dans les tiques Pour Borrelia burgdorferi P =0.012 ss 0.08 0.07 B. burgdorferi 0.06 0.05 0.04 Prévalence of 0.03 0.02 F M Sex of the tick
Détection des borrélies dans les tiques Pour Borrelia afzelii Saines Infectées Saines Infectées
Saint Clou Paris Match Molecular epidemiology requires collaborative skills