Thierry de Meeûs Centre International de Recherche-Développement sur lElevage en zone Subhumide (CIRDES), N559, rue 5.31, 01 BP 454, Bobo-Dioulasso 01, Burkina-Faso. Laboratoire de recherches et de coordination sur les Trypanosomoses, UMR177 IRD/CIRAD, TA A-17/G, Campus International de Baillarguet, Montpellier Cedex 5, France.
f( ) = + = p f( ) = q Proportions de Hardy-Weinberg f( ) = p² ; f( ) = 2pq ; f( ) = q²
Aa H t aa R t AA D t f t (A)=p t, f t (a)=q t =1-p t Equilibre de Hardy-Weinberg Panmixie (hermaphrodites) Taille de population N~ Migration m=0 Mutation u=0 Pas de sélection En une génération
Equilibre de Hardy-Weinberg avec trois allèles AB B t AC C t AA A t BB D t BC E t CC J t f t (A)=p t, f t (B)=q t, ft(C)=r t =1-p t -q t En une génération
Equilibre de Hardy-Weinberg avec Dominance Aaaa R t AA f t (A)=p t, f t (a)=q t =1-p t DtDt Hypothèse: la population vérifie des proportions panmictiques; hypothèse (très) forte
Equilibre de Hardy-Weinberg quand N petit: la dérive F t : probabilité de tirer deux allèles identiques par ascendance dans la population à la génération t
Equilibre de Hardy-Weinberg quand N petit: la dérive F t : probabilité de tirer deux allèles identiques par ascendance dans la population à la génération t
Equilibre de Hardy-Weinberg quand N petit: la dérive Panmixie, Migration m=0, Mutation u=0, Pas de sélection
Effectif efficace d'une population dioïque Chez des monoïques, la probabilité de tirer deux fois le même allèle par hasard est τ e =1/2N Quelle probabilité τ d chez des dioïques, avec N=N f +N m et accouplements aléatoires (pangamie)? Si même grand mère Si même grand père
Effectif efficace d'une population dioïque Chez des monoïques, la probabilité de tirer deux fois le même allèle par hasard est τ e =1/2N Quelle probabilité τ d chez des dioïques, avec N=N f +N m et accouplements aléatoires (pangamie)? Si même grand mère Si même grand père
Effectif efficace d'une population dioïque Chez des monoïques, la probabilité de tirer deux fois le même allèle par hasard est τ e =1/2N Quelle probabilité τ d chez des dioïques, avec N=N f +N m et accouplements aléatoires (pangamie)? On cherche N e tel que τ d =τ e Si N f =99 et N m =1 alors N e =3.96
Effectif efficace d'une population dioïque Tailles de populations réduites Balloux Sex ratio équilibré
Pour plus dun locus: les désequilibres de liaison Deux loci 1 et Locus 1 Locus 2 D 1 H 1 R 1 D 2 H 2 R 2 1p 1 1p 2 Gamètes ou haplotypes 1_1: p 1 p 2 +D t 1_2: p1(1-p 2 )-D t 2_1: (1-p 1 )p 2 -D t 2_2: (1-p 1 )(1-p 2 )+D t D t =p 1_1 -p 1 p 2 Au maximum D=[-0.25,+0.25] e.g. quand p 1_2 et p 2_1 =0.5, ou quand p 1_1 et p 2_2 =0.5
Pour plus dun locus: les désequilibres de liaison Deux loci 1 et Locus 1Locus 2 D 1 H 1 R 1 D 2 H 2 R 2 1p 1 1p 2 Gamètes 1_1: p 1 p 2 +D t 1_2: p1(1-p 2 )-D t 2_1: (1-p 1 )p 2 -D t 2_2: (1-p 1 )(1-p 2 )+D t D max alors P 1_2 =0 ou p 2_1 =0, P 1_2 et P 2_1 devant être 0 D min alors P 1_1 =0 ou p 2_2 =0, P 1_1 et P 2_2 devant être 0
Pour plus dun locus: les désequilibres de liaison Deux loci 1 et Locus 1Locus 2 D 1 H 1 R 1 D 2 H 2 R 2 1p 1 1p 2 Gamètes 1_1: p 1 p 2 +D t 1_2: p1(1-p 2 )-D t 2_1: (1-p 1 )p 2 -D t 2_2: (1-p 1 )(1-p 2 )+D t Si le taux de recomninaison est r et la reproduction panmictique N grand
Pour plus dun locus: les désequilibres de liaison Quelles forces évolutives génèrent du déséquilibre de liaison? Toutes: mutation, dérive, système de reproduction, sélection, migration et bien sûr le degré de liaison
Altérations des proportions de Hardy Weinberg Déficits en hétérozygotes Effet Wahlund Taenia solium Nasonia vitripenis Endogamies Rh - Rh - Rh + Rh - Sousdominance Causes techniques Allèles nuls Dominance des allèles courts Homogamie
Autofécondation AA Aa aa D t H t R t s: autofécondation 1-s: panmixie Taille de population, N grand Taux de mutation u=0 Taux de migration m=0 A 1/2 a 1/2 A 1/2 AA 1/4 Aa 1/4 a 1/2 Aa 1/4 aa 1/4
Autofécondation AA Aa aa D t H t R t
Autofécondation AA Aa aa D t H t R t
Autofécondation AA Aa aa D t H t R t A léquilibre, H t =H t+1 =H eq
Autofécondation AA Aa aa D t H t R t A léquilibre, H t =H t+1 =H eq
Autofécondation AA Aa aa D t H t R t A léquilibre, H t =H t+1 =H eq
Autofécondation AA Aa aa D t H t R t A léquilibre, H t =H t+1 =H eq Formule généralisée de Wright
t H Autofécondation 100% ou homogamie codominante Croisements frère/soeur 100 % Homogamie 100% (p=0.5) Homogamie 100% (p=0.25) Homogamie 100% (p=0.75) Endogamies dominante Pour les loci concernés
Effet Wahlund
Sousdominance AAAaaa Fitness11-s1 ZygotesfNp t ²2p t (1-p t )(1-s)fNfN(1-p t )² RégulationfNp t ²+ 2p t (1-p t )(1-s)fN+ fN(1-p t )² Fréquences t+1 Panmixie, grande population de taille N, pas de mutation ni de migration, fécondité de f (>1) 2 allèles, A et a de fréquence p t et 1-p t à la génération t Fitness moyenne
Sousdominance AAAaaa Fitness11-s1 Fréquences t+1 2 allèles, A et a de fréquence p t et 1-p t à la génération t
Sousdominance 2 allèles, A et a de fréquence p t et 1-p t à la génération t Equilibre quand les fréquences ne bougent plus i.e. quand Δp=p t+1 - p t =0
Sousdominance 2 allèles, A et a de fréquence p t et 1-p t à la génération t Equilibre quand les fréquences ne bougent plus i.e. quand Δp=p t+1 - p t =0 s1
Sousdominance 2 allèles, A et a de fréquence p t et 1-p t à la génération t Equilibre quand les fréquences ne bougent plus i.e. quand Δp=p t+1 - p t =0 p eq =0, A éliminé p eq =1, A fixé p eq =1/2, équilibre polymorphe instable
Sousdominance 2 allèles, A et a de fréquence p t et 1-p t à la génération t Equilibre quand les fréquences ne bougent plus i.e. quand Δp=p t+1 - p t =0 =A2*(1-A2)*(2*A2-1)
Schistosoma Candida albicans Altérations des proportions de Hardy Weinberg Excès d'hétérozygotes HLA Ixodes ricinus Anémie falciforme et Plasmodium falciparum Superdominance Hétérogamie Clonalité Biais de dispersion sexe spécifique Hétérosis Trypanosoma brucei
Superdominance AAAaaa Fitness1-s1 ZygotesfNp t ²(1-s)2p t (1-p t ) fNfN(1-p t )²(1-s) RégulationfNp t ²(1-s)+ 2p t (1-p t )fN+ fN(1-p t )²(1-s) Fréquences t+1 Panmixie, grande population de taille N, pas de mutation ni de migration, fécondité de f (>1) 2 allèles, A et a de fréquence p t et 1-p t à la génération t
Superdominance AAAaaa Fitness1-s1 Fréquences t+1 2 allèles, A et a de fréquence p t et 1-p t à la génération t
Superdominance 2 allèles, A et a de fréquence p t et 1-p t à la génération t Equilibre quand Δp=p t+1 - p t =0 s1
Superdominance 2 allèles, A et a de fréquence p t et 1-p t à la génération t p eq =0, A éliminé p eq =1, A fixé p eq =1/2, équilibre polymorphe stable
Superdominance 2 allèles, A et a de fréquence p t et 1-p t à la génération t s<1 =A2*(1-A2)*(1-2*A2)
Hétérogamie ABAC BC AB t AC t BC t Donc léquilibre est atteint quand AB eq =AC eq =BC eq =1/3
Hétérogamie ABACBC AB t AC t BC t Allèle D?
Clonalité Pas de mutation ni de migration, grande population, pas de sélection proportion c investie en reproduction clonale et 1-c en panmixie AA Aa aa D t H t R t A léquilibre H t =H t+1 =H eq et donc: Convergence vers HW mais forts désequilibres de liaison attendus
Clonalité +Dérive +Mutation AA Aa aa D t H t R t Aa H eq ~1
F statistiques de Wright AA Aa aa D o H o R o H: probabilité de tirer deux allèles différents, dans un individu dune sous-population (H I ) dans deux individus de la même sous-population (H S )
Modèle en îles de Wright
F-statistiques de Wright H I : Hétérozygotie moyenne des individus sur lensemble des îles Modèle en îles de Wright, n très grand, 2 allèles n îles, un locus à deux allèles de fréquences p i et 1-p i dans lîle i H eS : Hétérozygotie observée si la reproduction était panmictique à lintérieur de chaque sous-population H eT : Hétérozygotie observée si la reproduction était panmictique sur lensemble
F-statistiques de Wright Modèle en îles de Wright, n très grand, 2 allèles n îles, un locus à deux allèles de fréquences p i et 1-p i dans lîle i F IeT : Homozygotie relative des individus dans la totalité qui prend en compte les effets de la subdivision et de la déviation locale par rapport à HW F SeT : Homozygotie relative entre individus des sous-populations en supprimant leffet de la déviation locale par rapport à HW et en ne tenant donc compte que de leffet de subdivision (Wahlund)
F-statistiques de Wright Modèle en îles de Wright, n très grand, 2 allèles F SeT : Homozygotie relative entre individus des sous-populations en supprimant leffet de la déviation locale par rapport à HW et en ne tenant donc compte que de leffet de subdivision (Wahlund)
F-statistiques de Wright Modèle en îles de Wright, n très grand, 2 allèles F SeT : Homozygotie relative entre individus des sous-populations en supprimant leffet de la déviation locale par rapport à HW et en ne tenant donc compte que de leffet de subdivision (Wahlund)
F-statistiques de Wright Modèle en îles de Wright, n très grand, 2 allèles F SeT : Homozygotie relative entre individus des sous-populations en supprimant leffet de la déviation locale par rapport à HW et en ne tenant donc compte que de leffet de subdivision (Wahlund) Variance maximale des fréquences alléliques obtenues quand: danspopulations et dans populations
F-statistiques de Wright Modèle en îles de Wright, n très grand, 2 allèles F SeT : Homozygotie relative entre individus des sous-populations en supprimant leffet de la déviation locale par rapport à HW et en ne tenant donc compte que de leffet de subdivision (Wahlund) Les F de Wright sont aussi des rapports de variance
F-statistiques de Wright cas général: plus de deux allèles, n quelconque H: probabilité de tirer deux allèles différents, dans un individu dune sous-population (H I ) dans deux individus de la même sous-population (H S ) dans deux sous-populations différentes du total (H T )
F-statistiques de Wright cas général: plus de deux allèles (K>>2), n quelconque H: probabilité de tirer deux allèles différents, dans un individu dune sous-population (H I ) dans deux individus de la même sous-population (H S ) dans deux sous-populations différentes du total (H T ) Q=1-H: probabilité de tirer deux allèles identiques, dans un individu Q I, dans deux individus de la même sous-population Q S et dans deux sous-populations différentes Q T H I : Hétérozygotie moyenne observée H S : Diversité génétique des sous-populations H T : Diversité génétique totale Nei
Chesser & Nei F-statistiques de Wright cas général: plus de deux allèles, n quelconque (1-F IT )=(1-F IS )(1-F ST ) Weir Rousset
Les F-Statistiques de Wright F IS l F IS F ST F IT
Les F-Statistiques de Wright Inférences Autofécondation AA Aa aa D t H t R t A léquilibre, H t =H t+1 =H eq Formule généralisée de Wright
Les F-Statistiques de Wright Inférences Modèle en îles de Wright, n grand, m et u petit, K grand: Q T ~0 panmixie locale: Q I =Q S
Les F-Statistiques de Wright Inférences Modèle en îles de Wright, n grand, m et u petit, K grand: Q T ~0 panmixie locale: Q I =Q S A léquilibre migration/mutation/dérive
Les F-Statistiques de Wright Inférences Modèle en îles de Wright, n grand, m et u petit, K grand: Q T ~0 panmixie locale: Q I =Q S A léquilibre migration/mutation/dérive
Les F-Statistiques de Wright Inférences Modèle en îles de Wright, n grand, m et u petit, K grand: Q T ~0 panmixie locale: Q I =Q S A léquilibre migration/mutation/dérive On néglige les termes en m², u² et mu devant 1
Les F-Statistiques de Wright Inférences Modèle en îles de Wright, n grand, m et u petit, K grand: Q T ~0 panmixie locale: Q I =Q S A léquilibre migration/mutation/dérive On néglige les termes en m², u² et mu devant 1
Les F-Statistiques de Wright Inférences Modèle en îles de Wright, n grand, m et u petit, K grand: Q T ~0 panmixie locale: Q I =Q S A léquilibre migration/mutation/dérive
Les F-Statistiques de Wright Inférences Modèle en îles de Wright, n grand, m et u petit, K grand: Q T ~0 panmixie locale: Q I =Q S A léquilibre migration/mutation/dérive On néglige les termes en m², u² et mu On néglige les termes en m et u devant 1
Les F-Statistiques de Wright Inférences Modèle en îles de Wright, n grand, m et u petit, K grand: Q T ~0 panmixie locale: Q I =Q S ; F ST =Q S A léquilibre migration/mutation/dérive si u<<m F ST_max si m=0 F ST_maxQ S =1-H S F ST = F ST /F ST_max
Les F-Statistiques de Wright Modèle en îles fini (n petit), avec homoplasie (K petit) et une proportion s dautofécondation locale
Les F-Statistiques de Wright Autres modèles de populations Stepping stone (en pas Japonais) et Voisinage 1 D 2 D 3 D
1 D 2 D Les F-Statistiques de Wright Autres modèles de populations Stepping stone (en pas Japonais) et Voisinage
1 D 2 D Stepping stone (en pas Japonais) et Voisinage Rousset Pente b D e : Densité efficace dindividus (/m ou /m²) σ: distance entre adultes reproducteurs et leurs parents
Estimations deffectifs efficaces Différenciation génétiques entre échantillons séparés dans le temps N e : Waples Dans lespace et le temps N e et m: Wang & Whitlock Déséquilibres de liaisons N e : Bartley et al., Waples & Do Excès dhétérozygotes (dioïques ou autoincompatibles) N e : Balloux Déséquilibres inter et intra loci sur données spatiales N e et m: Vitalis & Couvet
Les F-Statistics de Wright F IS l F IS F ST Estimations RAPPEL: Variance: ² = [1/n]. i [(x i -x)²] ; s² = [1/(n-1)]. i [(x i -x)²] Estimateurs f et θ de Weir & Cockerham F IT Taille de sous-échantillons N s =1
pour K allèles noté de A=1 à K Estimateurs des F de Wright F IS F ST F IT Weir & Cockerham non biaisés variance destimation forte Robertson & Hill biaisés variance destimation faible (meilleure « statistique »)
F-statistiques pour plus de trois niveaux hiérarchiques ~0 >>0 Yang
F-statistiques chez les clones Que des hétérozygotes => Q I =0 Si n grand et m petit Q T ~0 Si n=2 et m petit
Génétique des populations des diploïdes clonaux ou partiellement clonaux F is 0 Loci C=[ ], Nm not small F is 0 Loci C=1, Nm small F ST ~0.5 F is 0 Loci C=[ ], Nm small F st >>0.5 F is 0 Loci C=1, Nm not small F st <<0.5
Procédures statistiques Calculs dintervalles de confiance (IC) des F-statistiques Bootstrap (e.g. sur les loci): on rééchantillonne aléatoirement k fois (e.g. 5000) avec remise. On peut donc tirer plusieurs fois le même item (e.g. locus) et on calcule F à chaque tirage.
Procédures statistiques Calculs dintervalles de confiance (IC) des F-statistiques Jackknife (e.g. sur les sous-échantillons): on retire un item à la fois (e.g. un sous-échantillon) et on recalcule F sur ceux qui restent. On obtient autant de valeurs quil y a ditems dont on tire une moyenne et une variance pour F qui sert au calcul dune erreur standard du F. Sous lhypothèse de normalité on peut estimer un IC qui correspond à F±StdErr(F) t α,γ, où t se trouve dans une table du t, où α correspond au seuil désiré (0.05 pour un CI à 95%, 0.01 pour 99%) et γ au degré de liberté (i.e. nombre ditems-1)
n-1t(α=0.05)n-1t(α=0.05)n-1t(α=0.05) Table du t F IS = loci StdErr(F IS )=0.01 lIC 95% sera et soit 95% IC=[0.177, 0.223] Procédures statistiques: IC 95% du Jackknife
Procédures statistiques Tests de significativité des F et déséquilibres de liaison par randomisation Tests de randomisations: Simuler H 0 un très grand nombre de fois; la P-value du test = la proportion des valeurs simulées qui sont aussi extrêmes ou plus extrêmes que celle observée dans léchantillon Il est important de bien appréhender ce quil y a derrière H 0 et H 1 : que cherche-t-on à tester exactement? Nombre de randomisations: si permutations, au moin si chaine de Markhov
Procédures statistiques Tests de significativité des F par randomisation F is Utilisation dautres estimateurs (Robertson & Hill) comme statistique Tests exacts de Haldane (pas de test global sur les sous-échantillons et loci) Tester si F IS > 0 P-value P 1 ou < 0 P-value P 2 ou 0 P-value P 3 F IS 0 (bilatéral) P 3 =min(P 1,P 2 )+[1-max(P 1,P 2 )] Significativité du F IS = tester la panmixie locale
Procédures statistiques Tests de significativité des F par randomisation F ST Tester si F ST > 0
Statistique G: logarithme du rapport de maximum de vraisemblance des fréquences alléliques dans les différents sous-échantillons. Propriété additive du G permet de tester globalement sur les loci Procédures statistiques Tester si la répartition des génotypes est aléatoire à laide de la statistique G H 0 : le G observé nest pas plus grand que ceux générés par permutation aléatoire des individus entre sous-échantillons
Procédures statistiques Tester la significativité dune corrélation entre deux matrices de distances tel que dans la cas dun isolement par la distance Les cases sont auto-corrélées Test de Mantel: on permute les cases dune des matrices et on recalcule la corrélation à chaque fois. La P-value=la proportion de corrélations randomisées aussi grandes ou plus grandes que lobservée Test assez conservateur
Locus_ 2 Locus_ 1 Mesures multiLocus Procédures statistiques Déséquilibres de liaison
Procédures statistiques Déséquilibres de liaison Les génotypes des loci (nous navons en général pas les haplotypes=la phase) sont réassociés un grand nombre de fois et une statistique mesurée à chaque fois la P-value du test correspond à la proportion des valeurs randomisées supérieures ou égales à lobservée. Tests par paires de loci: Statistique utilisée: G permet un test sur lensemble des sous-populations mais par paire de loci=>autant de P-values que de paires de loci Tests multilocus: Statistique utilisée: r D par exemple permet un test sur lensemble des loci mais par sous-échantillon=>autant de P-values que de sous-échantillons Dans tous les cas il faudra tenir compte de cette répétition de tests
Procédures statistiques F-statistiques pour plus de trois niveaux hiérarchiques
Procédures statistiques Facteurs imbriqués et croisés Différenciation entre genres Différenciation géographique F ST_1 ; P-value_1 F ST_2 ; P-value_2 Procédure pour combiner ces tests multiples
Procédures statistiques Comparaison de groupes S=F IS, F ST, AI c, H o, H s etc… S Obs =(S Obs1 - S Obs2 )² Sylvestres Champêtres
Comparaison de catégories dindividus S Obs =(S Obs1 - S Obs2 )² Randomisation du statut en gardant le ratio local constant Procédures statistiques S=F IS, F ST, AI c, H o, H s etc…
Procédures pour combiner k tests Quels tests sont significatifs?La série des k tests est-elle significative? P 1, P 2, P 3, …P k Bonferroni sequentiel P min k P min-1 (k-1) etc.. Les P-values corrigées qui restent significatives désignent les tests qui les ont. Test hyper-conservateur à nutiliser que sur les tests les plus puissants (gros échantillons les plus polymorphes) Procédure de Fisher Procédure Z de Stouffer Z i =LOI.NORMALE.INVERSE(P i ;0;1) P-value=LOI.NORMALE.STANDARD(Z) Test binomiale (tests non indépendants) et Procédure binomiale généralisée
Analyses multivariées AFC ACP PC1 (48%inertia) P < PC2 (21%inertia) P < Mouette Guillemot Macareux Tests dassignment Macareux – 95% Mouette – 82% Guillemot – 89% ACP des populations de tique
Exploration dune structure cachée AFC Méthodes Bayésiennes dinférence de structure de populations Structure BAPS
Méthodes indirectes Méthodes directes
Structure d'une Population Taille des Unités de Reproduction Migration
Neutralité: une hypothèse assez forte TYPES DE MARQUEURS Enzymes mRNA +- CTCTCTCT AGAGAGAG Primer1 Primer2 PCR CTCTCTCTCT AGAGAGAGAG Primer1 Primer2 + - Microsatellites Electrophorèse AUGCAGCCAUAGGCG Phe-Pro-Leu-Ileu-Val
Génétique des populations d' Ixodes ricinus et borréliose de Lyme en Suisse B. burgdorferi B. valaisiana B. garinii B. afzelii B. Spielmanii
IR8IR25IR27IR32IR39All f ( F is estimator) Déficits en hétérozygotes
Distribution sexe spécifique du polymorphisme B. burgdorferi B. valaisiana B. garinii B. afzelii Biais de dispersion sexe spécifique des tiques
Détection des Borrelia dans les tiques Pour Borrelia burgdorferi P= FM Sex of the tick Prévalence of B. burgdorferi ss
Pour Borrelia afzelii SainesInfectées Détection des borrélies dans les tiques SainesInfectées
Vers adultes (couple) dans la veine mésenthérique. La femelle est contenue dans le canal gynécophore du mâle Œuf évacué avec les selles de lhôte définitif Eclosion dune larve aquatique: miracidium Reproduction sexuée Biomphalaria glabrata mollusque deau douce hôte intermédiaire Emission massive de cercaires clonales Reproduction asexuée Rattus rattus (rat noir) infecté lors dun "bain" Zone de transmission Site de transmission (arrière mangrove) Région détude Schistosoma mansoni et ses hôtes (rat et mollusque) en Guadeloupe
F is male F st Schistosoma mansoni en Guadeloupe
F is male F st
Clones structurés en nombreux dèmes F st =-F is /(1-F is ); F it =0
Candida albicans à Abidjan (Côte dIvoire) 42 Patients AIDS 19 patientes 23 patients J0 Traitement anti-fungique J15 Rechute de 13 patients F Patient 0.5 (P<0.001) F Sex 0.08 (P<0.02) F D0-D (P<0.001) 14 loci enzymatiques F is =-0.66 F is =-0.97
Structuration de Candida albicans chez des patients HIV + de Côte d'Ivoire
Molecular epidemiology requires collaborative skills Saint Clou Paris Match