des populations naturelles de vecteurs: Cours de génétique des populations naturelles de vecteurs: théorie, empirisme et inférences Master International d'Entomologie Médicale et Vétérinaire Bobo-Dioulasso, Novembre 2011 Thierry de Meeûs UMR 177 IRD-CIRAD "INTERTRYP" WHO Collaborating Center for research on host/vector/parasite interactions for surveillance and control of Human African Trypanosomiasis Centre International de Recherche-Développement sur l’Elevage en zone Subhumide (CIRDES), N559, rue 5.31, 01 BP 454, Bobo-Dioulasso 01, Burkina-Faso. E-mail: thierry.demeeus@ird.fr http://gemi.mpl.ird.fr/SiteSGASS/SiteTDM/EnseignMeeus.html
Introduction
Méthodes directes Méthodes indirectes
Structure d'une Population Taille des Unités de Reproduction Migration
Détection de la variation génétique Marqueurs cytpolasmiques ♀ ♂
Détection de la variation génétique Marqueurs nucléaires AA Aa aa Marqueurs dominants [A] [a] RAPD (Randomly Amplified Polymorphic DNA) ATGCAC TACGTG TCATGA AGTACT Amorces PCR aléatoires ATGATC TACTAG AATCTG TTAGTA Présence ou absence d'amplification=>marqueur dominant Maladies génétiques récessives
Détection de la variation génétique: marqueurs codominants A1A1 A1A2 A2A2 Microsatellites Primer1 CTCTCTCT AGAGAGAG Primer2 mRNA Primer1 CTCTCTCTCT AGAGAGAGAG AUGCAGCCAUAGGCG Primer2 PCR Enzymes Phe-Pro-Leu-Ileu-Val + + - - Electrophorèse RFLP, MLST, SNP… Hypothèse importante pour les inférences=Neutralité
Bases théoriques
La population unité de base de l'écologie une notion démographique Un groupe d'individus partagent les mêmes paramètres démographiques Population 1 Population 2 Population 3 Population 4 N1 N2 N3 N4 Multiplication et migration Régulation N1 N2 N3 N4 Taille constante des populations
Le modèle de Hardy-Weinberg Une seule population Taille de la population N=∞ Reproduction sexuée panmictique Pas de mutation Pas de migration Pas de sélection Générations discrètes Hardy G.H. (GB) et Weinberg W. (D) (1908)
sous l'hypothèse panmictique Proportions de Hardy-Weinberg Tableau des gamètes et des zygotes formés sous l'hypothèse panmictique p q pp pq qp qq ♀ + ♂ - f( ) = = p + f( ) = q=1-p f( ) = p² ; f( ) = 2pq ; f( ) = q²
ft(A)=pt, ft(a)=qt=1-pt Equilibre de Hardy-Weinberg Aa Ht aa Rt AA Dt ft(A)=pt, ft(a)=qt=1-pt Panmixie (hermaphrodites) Taille de population N~∞ Migration m=0 Mutation u=0 Pas de sélection Générations discrètes En une génération
ft(A)=pt, ft(B)=qt , ft(C)=rt=1-pt-qt Equilibre de Hardy-Weinberg avec trois allèles AA At AB Bt AC Ct BB Dt BC Et CC Jt ft(A)=pt, ft(B)=qt , ft(C)=rt=1-pt-qt En une génération
Equilibre de Hardy-Weinberg avec Dominance AA Aa aa Rt Dt ft(A)=pt, ft(a)=qt=1-pt Si on fait l'hypothèse que Rt=qt² Hypothèse: la population vérifie des proportions panmictiques: hypothèse (très) forte
Equilibre de Hardy-Weinberg quand N petit: la dérive Ft: probabilité de tirer deux allèles identiques par ascendance dans la population à la génération t ils étaient déjà identiques à la génération t ils deviennent identiques à la génération t+1 Diversité génétique
Equilibre de Hardy-Weinberg quand N petit: la dérive Ft: probabilité de tirer deux allèles identiques par ascendance dans la population à la génération t
Equilibre de Hardy-Weinberg quand N petit: la dérive Plecoptera Panmixie, Migration m=0, Mutation u=0, Pas de sélection
Effectif efficace Une population focale Pf Une population idéale Pi Taille de la population Nc Reproduction sexuée panmictique Pas de mutation Pas de migration Pas de sélection Une population idéale Pi Taille de la population Ne Reproduction sexuée panmictique Pas de mutation Pas de migration Pas de sélection
Effectif efficace Population idéale (Pi) de taille Ne (effectif efficace): Idéale=panmictique, sans mutation ni migration ni sélection (mais de taille limitée Ne) Population focale (Pf) de taille Nc (census=recensement) Effectif efficace de consanguinité (inbreeding): Evolution de la consanguinité de Pf = Evolution de la consanguinité de Pi Effectif efficace de variance: Variance des fréquences alléliques identiques entre Pf et Pi d'une génération à l'autre Effectif efficace de valeur propre: Evolution de l'hétérozygotie identique entre Pf et Pi Effectif efficace de coalescence: Temps de coalescence identique entre Pf et Pi (coalescence=premier ancêtre commun entre deux gènes pris au hasard)
Temps moyen de coalescence =(11+12+23+34+15+16)/9≈4 Temps moyen de coalescence =(11+12+23+34+15+16)/9≈4
Effectif efficace Population idéale (Pi) de taille Ne (effectif efficace): Idéale=panmictique, sans mutation ni migration ni sélection Population focale (Pf) de taille Nc (census=recensement) Effectif efficace de consanguinité (inbreeding): Evolution de la consanguinité de Pf = Evolution de la consanguinité de Pi Effectif efficace de variance: Variance des fréquences alléliques identiques entre Pf et Pi d'une génération à l'autre Effectif efficace de valeur propre: Evolution de l'hétérozygotie identique entre Pf et Pi Effectif efficace de coalescence: Temps de coalescence identique entre Pf et Pi (coalescence=premier ancêtre commun entre deux gènes pris au hasard) En principes tous identiques mais pas toujours
Effectif efficace d'une population dioïque Chez des monoïques, la probabilité de tirer deux fois le même allèle par hasard est τe=1/2N Quelle probabilité τd chez des dioïques, avec N=Nf+Nm et accouplements aléatoires (pangamie)? Si même grand mère Si même grand père
Effectif efficace d'une population dioïque Chez des monoïques, la probabilité de tirer deux fois le même allèle par hasard est τe=1/2N Quelle probabilité τd chez des dioïques, avec N=Nf+Nm et accouplements aléatoires (pangamie)? Si même grand mère Si même grand père
Effectif efficace d'une population dioïque Chez des monoïques, la probabilité de tirer deux fois le même allèle par hasard est τe=1/2N Quelle probabilité τd chez des dioïques, avec N=Nf+Nm et accouplements aléatoires (pangamie)? Si même grand mère Si même grand père
Effectif efficace d'une population dioïque Chez des monoïques, la probabilité de tirer deux fois le même allèle par hasard est τe=1/2N Quelle probabilité τd chez des dioïques, avec N=Nf+Nm et accouplements aléatoires (pangamie)? On cherche Ne tel que τd=τe Si Nf=99 et Nm=1 alors Ne=3.96~4
Effectif efficace d'une population dioïque Tailles de populations réduites Balloux Sex ratio équilibré
Pour plus d’un locus: les désequilibres de liaison Deux loci 1 et 2 Locus 1 Locus 2 11 12 22 11 12 22 D1 H1 R1 D2 H2 R2 1→p1 1→p2 Gamètes ou haplotypes 1_1: p1_1=p1p2+Dt 1_2: p1_2=p1(1-p2)-Dt 2_1: p2_1=(1-p1)p2-Dt 2_2: p2_2=(1-p1)(1-p2)+Dt Dt=p1_1-p1p2 Au maximum D=[-0.25,+0.25] e.g. quand p1_2 et p2_1=0.5, ou quand p1_1 et p2_2=0.5
Désequilibres de liaison maximaux Deux loci 1 et 2 Locus 1 Locus 2 11 12 22 11 12 22 D1 H1 R1 D2 H2 R2 1→p1 1→p2 Gamètes ou haplotypes 1_1: p1_1=p1p2+Dt 1_2: p1_2=p1(1-p2)-Dt 2_1: p2_1=(1-p1)p2-Dt 2_2: p2_2=(1-p1)(1-p2)+Dt Dt=p1_1-p1p2 Quand p1_2 et p2_1=0.5, alors p1_1=0 et donc D=-p1p2 donc 0.5=p1(1-p2)+p1p2p1=0.5 et 0.5=p2(1-p1)+p1p2p2=0.5 et donc D=-0.25 De la même façon, quand p1_1 et p2_2=0.5 on obtient D=0.25
Désequilibres de liaison maximums quand p1 et/ou p2≠0.5 Deux loci 1 et 2 Locus 1 Locus 2 Gamètes p1_1=p1p2+Dt p1_2=p1(1-p2)-Dt p2_1=(1-p1)p2-Dt p2_2=(1-p1)(1-p2)+Dt 11 12 22 11 12 22 D1 H1 R1 D2 H2 R2 1→p1 1→p2 Dmax alors P1_2=0 ou p2_1=0, P1_2 et P2_1 devant être ≥0 Dmin alors P1_1=0 ou p2_2=0, P1_1 et P2_2 devant être ≥0
Pour plus d’un locus: les désequilibres de liaison Deux loci 1 et 2 Locus 1 Locus 2 Gamètes p1_1=p1p2+Dt p1_2=p1(1-p2)-Dt p2_1=(1-p1)p2-Dt p2_2=(1-p1)(1-p2)+Dt 11 12 22 11 12 22 D1 H1 R1 D2 H2 R2 1→p1 1→p2 Si le taux de recombinaison est r et la reproduction panmictique
Pour plus d’un locus: les déséquilibres de liaison Deux loci 1 et 2 Locus 1 Locus 2 Gamètes p1_1=p1p2+Dt p1_2=p1(1-p2)-Dt p2_1=(1-p1)p2-Dt p2_2=(1-p1)(1-p2)+Dt 11 12 22 11 12 22 D1 H1 R1 D2 H2 R2 1→p1 1→p2 Si le taux de recombinaison est r et la reproduction panmictique N grand
Pour plus d’un locus: les désequilibres de liaison Quelles forces évolutives génèrent et/ou maintiennent du déséquilibre de liaison? Toutes: mutation, dérive, système de reproduction, sélection, migration et bien sûr le degré de liaison
Fin du premier cours
Altérations des proportions de Hardy Weinberg Déficits en hétérozygotes Taenia solium Nasonia vitripenis Endogamies Sousdominance Effet Wahlund Rh-Rh- Rh+Rh- Homogamie Causes techniques Allèles nuls Dominance des allèles courts Allelic dropout Stuttering
Autofécondation A 1/2 a A 1/2 AA 1/4 Aa a 1/2 aa AA Aa aa Dt Ht Rt s: autofécondation 1-s: panmixie Taille de population, N grand Taux de mutation u=0 Taux de migration m=0 A 1/2 a A 1/2 AA 1/4 Aa a 1/2 aa
Autofécondation AA Aa aa Dt Ht Rt
Autofécondation AA Aa aa Dt Ht Rt
A l’équilibre, Ht=Ht+1=Heq Autofécondation AA Aa aa Dt Ht Rt A l’équilibre, Ht=Ht+1=Heq
A l’équilibre, Ht=Ht+1=Heq Autofécondation AA Aa aa Dt Ht Rt A l’équilibre, Ht=Ht+1=Heq
A l’équilibre, Ht=Ht+1=Heq Autofécondation AA Aa aa Dt Ht Rt A l’équilibre, Ht=Ht+1=Heq
A l’équilibre, Ht=Ht+1=Heq Formule généralisée de Wright Autofécondation AA Aa aa Dt Ht Rt A l’équilibre, Ht=Ht+1=Heq Formule généralisée de Wright
Endogamies Tous les loci Pour les loci concernés 0.1 0.2 0.3 0.4 0.5 0.1 0.2 0.3 0.4 0.5 10 20 30 40 50 t H Autofécondation 100% ou homogamie codominante Croisements frère/soeur 100 % Homogamie 100% (p=0.5) Homogamie 100% (p=0.25) Homogamie 100% (p=0.75) Pour les loci concernés dominante
Effet Wahlund
Effet Wahlund
Effet Wahlund
Effet Wahlund F=0 si p1=p2
fNpt²+ 2pt(1-pt)(1-s)fN+ fN(1-pt)² Sousdominance Panmixie, grande population de taille N, pas de mutation ni de migration, fécondité de f (>1) 2 allèles, A et a de fréquence pt et 1-pt à la génération t AA Aa aa Fitness 1 1-s Zygotes fNpt² 2pt(1-pt)(1-s)fN fN(1-pt)² Régulation fNpt²+ 2pt(1-pt)(1-s)fN+ fN(1-pt)² Fréquences t+1 Fitness moyenne
2 allèles, A et a de fréquence pt et 1-pt à la génération t Sousdominance 2 allèles, A et a de fréquence pt et 1-pt à la génération t AA Aa aa Fitness 1 1-s Fréquences t+1
Sousdominance 2 allèles, A et a de fréquence pt et 1-pt à la génération t Equilibre quand les fréquences ne bougent plus i.e. quand Δp=pt+1- pt=0 =A2*(1-A2)*(2*A2-1)
Altérations des proportions de Hardy Weinberg Excès d'hétérozygotes Superdominance Hétérogamie Anémie falciforme et Plasmodium falciparum HLA Clonalité Candida albicans Trypanosoma brucei Biais de dispersion sexe spécifique Ixodes ricinus Hétérosis Schistosoma Bandes echo Loci dupliqués
fNpt²(1-s)+ 2pt(1-pt)fN+ fN(1-pt)²(1-s) Superdominance Panmixie, grande population de taille N, pas de mutation ni de migration, fécondité de f (>1) 2 allèles, A et a de fréquence pt et 1-pt à la génération t AA Aa aa Fitness 1-s 1 Zygotes fNpt²(1-s) 2pt(1-pt) fN fN(1-pt)²(1-s) Régulation fNpt²(1-s)+ 2pt(1-pt)fN+ fN(1-pt)²(1-s) Fréquences t+1
valeur sélective moyenne de la population Superdominance 2 allèles, A et a de fréquence pt et 1-pt à la génération t AA Aa aa Fitness 1-s 1 Fréquences t+1 valeur sélective moyenne de la population
2 allèles, A et a de fréquence pt et 1-pt à la génération t Superdominance 2 allèles, A et a de fréquence pt et 1-pt à la génération t s<1 =A2*(1-A2)*(1-2*A2)
Superdominance Fardeau génétique
Donc l’équilibre est atteint quand ABeq=ACeq=BCeq=1/3 Hétérogamie AB AC BC ABt ACt BCt Donc l’équilibre est atteint quand ABeq=ACeq=BCeq=1/3
Hétérogamie Allèle D? AB AC BC ABt ACt BCt
Clonalité Pas de mutation ni de migration, grande population, pas de sélection proportion c investie en reproduction clonale et 1-c en panmixie AA Aa aa Dt Ht Rt A l’équilibre Ht=Ht+1=Heq et donc: Convergence vers HW mais forts désequilibres de liaison attendus
Clonalité +Dérive +Mutation AA Aa aa Dt Ht Rt Aa Heq~1
F statistiques de Wright AA Aa aa Do Ho Ro H: probabilité de tirer deux allèles différents, dans un individu d’une sous-population (HI) dans deux individus de la même sous-population (HS)
Modèle en îles de Wright
F-statistiques de Wright cas général: plus de deux allèles, n quelconque H: probabilité de tirer deux allèles différents, dans un individu d’une sous-population (HI) dans deux individus de la même sous-population (HS) dans deux sous-populations différentes du total (HT)
F-statistiques de Wright cas général: plus de deux allèles (K>>2), n quelconque H: probabilité de tirer deux allèles différents, dans un individu d’une sous-population (HI) dans deux individus de la même sous-population (HS) dans deux sous-populations différentes du total (HT) Q=1-H: probabilité de tirer deux allèles identiques, dans un individu QI, dans deux individus de la même sous-population QS et dans deux sous-populations différentes QT HI: Hétérozygotie moyenne observée HS: Diversité génétique des sous-populations HT: Diversité génétique totale Nei
F-statistiques de Wright cas général: plus de deux allèles, n quelconque Chesser & Nei (1-FIT)=(1-FIS)(1-FST) Weir Rousset
Les F-Statistiques de Wright FIT FIS F IS l
Les F-Statistics de Wright FIT FIS Taille de sous-échantillons Ns=1 Estimations RAPPEL: Variance: s² = [1/n].Si[(xi-x)²] ; s² = [1/(n-1)].Si[(xi-x)²] Estimateurs f et θ de Weir & Cockerham F IS l
Estimateurs des F de Wright pour K allèles noté de A=1 à K Weir & Cockerham non biaisés variance d’estimation forte Robertson & Hill biaisés variance d’estimation faible (meilleure « statistique ») FIS FST FIT
F-statistiques pour plus de trois niveaux hiérarchiques >>0 ~0 ~0 ~0 FSA FAT Yang
Fin du deuxième cours
Inférences
Les F-Statistiques de Wright Inférences Autofécondation AA Aa aa Dt Ht Rt A l’équilibre, Ht=Ht+1=Heq Formule généralisée de Wright
Les F-Statistiques de Wright: Inférences Croisements frères-soeurs Apparentement φ Consanguinité F ♀ ♂ φt-2 Ft-2 φt-1 Ft-1=φt-2 Evolution de la consanguinité F: différents petits enfants possibles en fonction des gènes présents chez leurs deux grands parents. φt Ft=φt-1 Même grand-mère Même grand-parent Même grand-père Grands-parents différents
Les F-Statistiques de Wright: Inférences Croisements frères-soeurs Même grand-mère Même grand-parent Même grand-père Grands-parents différents P(même grand-parent)=Pmgp=1/2 P(pas même grand-parent)=Ppmgp=1/2 P(retrouver 2 fois le même gène d'un même grand parent)=P2mgp=4/8=1/2 P(prendre les deux gène différents d'un même grand-parent)=P2dmgp=1/2 P(les 2 gènes d'un grand-parent sont identiques par ascendance )=P2dId/mgp=Ft-2 P(gènes identiques/même grands-parents)=PId/mgp=Pmgp(P2mgp+P2dmgpP2dId/mgp)=1/2(1/2+1/2Ft-2) P(gènes identiques/pas même grands-parents)=PId/pmgp=Ppmgpφt-2=1/2Ft-1 Par conséquent Ft=1/2(1/2+1/2Ft-2)+1/2Ft-1
Les F-Statistiques de Wright: Inférences Croisements frères-soeurs Ft=1/2(1/2+1/2Ft-2)+1/2Ft-1 Taux de croisements frères–soeurs = b alors la perte en hétérozygotie à la génération t sera de: Ft=b[1/2(1/2+1/2Ft-2)+1/2Ft-1]+(1-b)0 Ft=(b/2)[1/2+1/2Ft-2+Ft-1]=(b/4)(1+Ft-2+2Ft-1) A l'équilibre Ft=Ft-1=Ft-2=FIS FIS=(b/4)(1+FIS+2FIS) et donc
Les F-Statistiques de Wright Inférences Modèle en îles de Wright, n grand, m et u petit, K grand: QT~0 panmixie locale: QI=QS
Les F-Statistiques de Wright Inférences Modèle en îles de Wright, n grand, m et u petit, K grand: QT~0 panmixie locale: QI=QS A l’équilibre migration/mutation/dérive
Les F-Statistiques de Wright Inférences Modèle en îles de Wright, n grand, m et u petit, K grand: QT~0 panmixie locale: QI=QS A l’équilibre migration/mutation/dérive
Les F-Statistiques de Wright Inférences Modèle en îles de Wright, n grand, m et u petit, K grand: QT~0 panmixie locale: QI=QS A l’équilibre migration/mutation/dérive On néglige les termes en m², u² et mu devant 1
Les F-Statistiques de Wright Inférences Modèle en îles de Wright, n grand, m et u petit, K grand: QT~0 panmixie locale: QI=QS A l’équilibre migration/mutation/dérive On néglige les termes en m², u² et mu devant 1
Les F-Statistiques de Wright Inférences Modèle en îles de Wright, n grand, m et u petit, K grand: QT~0 panmixie locale: QI=QS A l’équilibre migration/mutation/dérive
Les F-Statistiques de Wright Inférences Modèle en îles de Wright, n grand, m et u petit, K grand: QT~0 panmixie locale: QI=QS A l’équilibre migration/mutation/dérive On néglige les termes en m², u² et mu On néglige les termes en m et u devant 1
Les F-Statistiques de Wright Inférences Modèle en îles de Wright, n grand, m et u petit, K grand: QT~0 panmixie locale: QI=QS; FST=QS A l’équilibre migration/mutation/dérive si u<<m FST_max si m=0 FST_max ≈QS=1-HS FST’ =FST/FST_max
Les F-Statistiques de Wright Modèle en îles fini (n petit), avec homoplasie (K petit) et une proportion s d’autofécondation locale
Les F-Statistiques de Wright Autres modèles de populations Stepping stone (en pas Japonais) et Voisinage 1 D 3 D 2 D
Les F-Statistiques de Wright Autres modèles de populations Stepping stone (en pas Japonais) et Voisinage 2 D 1 D
Stepping stone (en pas Japonais) et Voisinage Rousset 2 D 1 D Pente b De: Densité efficace d’individus (/m ou /m²) σ: distance entre adultes reproducteurs et leurs parents
Estimations d’effectifs efficaces Différenciation génétiques entre échantillons séparés dans le temps Ne: Waples Dans l’espace et le temps Ne et m: Wang & Whitlock Déséquilibres de liaisons Ne: Bartley et al., Waples & Do Excès d’hétérozygotes (dioïques ou autoincompatibles) Ne: Balloux Déséquilibres inter et intra loci sur données spatiales Ne et m: Vitalis & Couvet
Procédures statistiques
Procédures statistiques: définitions On recherche avec quelle probabilité, appelée P-value, le hasard permet d'expliquer nos données si ces dernières suivent l'hypothèse nulle H0. Le test, défini a priori, peut être: -bilatéral: dans ce cas l'hypothèse alternative H1 est que les valeurs observées sont trop extrêmes pour être expliquées par le hasard; -unilatéral "plus grand": dans ce cas H1 est que les valeurs observées sont plus grandes qu'attendue par hasard sous H0; -unilatéral "moins grand": dans ce cas H1 est que les observations ont des valeurs plus petites qu'attendues sous H0. Par convention on a choisi arbitrairement la limite 0.05 pour la P-value seuil au dessous de laquelle un test est dit significatif. Mais, selon les circonstances ont peut choisir d'être plus ou moins sévère. La décision statistique ne dépend que du manipulateur. Erreur de première espèce, α: probabilité de se tromper en rejetant H0 (P-value); Erreur de seconde espèce, β: probabilité de se tromper en acceptant l'hypothèse nulle. Un test est puissant si on rejette facilement H0; Un test est robuste s'il ne rejette pas trop souvent H0.
Procédures statistiques Calculs d’intervalles de confiance (IC) des F-statistiques Bootstrap (e.g. sur les loci): on rééchantillonne aléatoirement k fois (e.g. 5000) avec remise. On peut donc tirer plusieurs fois le même item (e.g. locus) et on calcule F à chaque tirage.
Procédures statistiques Calculs d’intervalles de confiance (IC) des F-statistiques Jackknife (e.g. sur les sous-échantillons): on retire un item à la fois (e.g. un sous-échantillon) et on recalcule F sur ceux qui restent. On obtient autant de valeurs qu’il y a d’items dont on tire une moyenne et une variance pour F qui sert au calcul d’une erreur standard du F. Sous l’hypothèse de normalité on peut estimer un IC qui correspond à F±StdErr(F)tα,γ, où t se trouve dans une table du t, où α correspond au seuil désiré (0.05 pour un CI à 95%, 0.01 pour 99%) et γ au degré de liberté (i.e. nombre d’items-1)
Procédures statistiques: IC 95% du Jackknife Table du t n-1 t(α=0.05) 1 12.706 21 2.08 45 2.014 2 4.303 22 2.074 50 2.009 3 3.182 23 2.069 55 2.004 4 2.776 24 2.064 60 5 2.571 25 2.06 65 1.997 6 2.447 26 2.056 70 1.994 7 2.365 27 2.052 80 1.99 8 2.306 28 2.048 90 1.987 9 2.262 29 2.045 100 1.984 10 2.228 30 2.042 110 1.982 11 2.201 31 2.04 120 1.98 12 2.179 32 2.037 130 1.978 13 2.16 33 2.035 140 1.977 14 2.145 34 2.032 150 1.976 15 2.131 35 2.03 200 1.972 16 2.12 36 2.028 250 1.97 17 2.11 37 2.026 300 1.968 18 2.101 38 2.024 400 1.966 19 2.093 39 2.023 500 1.965 20 2.086 40 2.021 1000 1.962 FIS=0.2 10 loci StdErr(FIS)=0.01 l’IC 95% sera 0.2-2.2620.01 et 0.2+2.2620.01 soit 95% IC=[0.177, 0.223]
Procédures statistiques Tests de significativité par randomisation Tests de randomisations: Simuler H0 un très grand nombre de fois; la P-value du test = la proportion des valeurs simulées qui sont aussi extrêmes ou plus extrêmes que celle observée dans l’échantillon Il est important de bien appréhender ce qu’il y a derrière H0 et H1: que cherche-t-on à tester exactement? Nombre de randomisations: 10000 si permutations, au moin 1 000 000 si chaine de Markhov
Procédures statistiques Tests de significativité des F par randomisation Significativité du FIS = tester la panmixie locale Tester si FIS > 0 P-value P1 ou < 0 P-value P2 ou ≠ 0 P-value P3 FIS FIS ≠ 0 (bilatéral) P3=min(P1,P2)+[1-max(P1,P2)] Utilisation d’autres estimateurs (Robertson & Hill) comme statistique Tests exacts de Haldane (pas de test global sur les sous-échantillons et loci)
Procédures statistiques Tests de significativité des F par randomisation Tester si FST > 0 FST
Procédures statistiques Tester si la répartition des génotypes est aléatoire à l’aide de la statistique G H0: le G observé n’est pas plus grand que ceux générés par permutation aléatoire des individus entre sous-échantillons Statistique G: logarithme du rapport de maximum de vraisemblance des fréquences alléliques dans les différents sous-échantillons. Propriété additive du G permet de tester globalement sur les loci
Procédures statistiques Tester la significativité d’une corrélation entre deux matrices de distances tel que dans le cas d’un isolement par la distance Les cases sont auto-corrélées Test de Mantel: on permute les cases d’une des matrices et on recalcule la corrélation à chaque fois. La P-value=la proportion de corrélations randomisées aussi grandes ou plus grandes que l’observée Test assez conservateur
Procédures statistiques Déséquilibres de liaison Locus_ 2 11 12 13 14 22 23 24 33 34 44 n 11/11 11/12 11/13 11/14 … 12/11 12/12 12/13 12/14 13/11 13/12 13/13 13/14 14/11 14/12 14/13 14/14 15 15/11 15/12 15/13 15/14 etc… 25 35 45 55 Locus_ 1 Mesures multiLocus
Procédures statistiques Déséquilibres de liaison Les génotypes des loci (nous n’avons en général pas les haplotypes=la phase) sont réassociés un grand nombre de fois et une statistique mesurée à chaque fois. La P-value du test correspond à la proportion des valeurs randomisées supérieures ou égales à l’observée. Tests par paires de loci: Statistique utilisée: G permet un test sur l’ensemble des sous-populations mais par paire de loci=>autant de P-values que de paires de loci Tests multilocus: Statistique utilisée: rD par exemple permet un test sur l’ensemble des loci mais par sous-échantillon=>autant de P-values que de sous-échantillons Dans tous les cas il faudra tenir compte de cette répétition de tests
Procédures statistiques F-statistiques pour plus de trois niveaux hiérarchiques
Procédures statistiques Comparaison de groupes Champêtres Sylvestres S=FIS, FST, AIc, Ho, Hs etc… SObs=(SObs1-SObs2)²
Procédures statistiques Comparaison de catégories d’individus S=FIS, FST, AIc, Ho, Hs etc… Randomisation du statut en gardant le ratio local constant SObs=(SObs1-SObs2)²
Procédures statistiques Facteurs imbriqués et croisés Différenciation entre genres Différenciation géographique FST_2; P-value_2 FST_1; P-value_1 Procédure pour combiner ces tests multiples
Procédures pour combiner k tests P1, P2, P3, …Pk Quels tests sont significatifs? La série des k tests est-elle significative? Bonferroni sequentiel Pmink Pmin-1(k-1) etc.. Les P-values corrigées qui restent significatives désignent les tests qui les ont. Test hyper-conservateur à n’utiliser que sur les tests les plus puissants (gros échantillons les plus polymorphes) Tests non indépendants Test binomial exact Tests indépendants Procédure Z de Stouffer si k<4 Zi=LOI.NORMALE.INVERSE(Pi;0;1) P-value=LOI.NORMALE.STANDARD(Z) Au moins un test de la série est-il significatif? Procédure binomiale généralisée si k≥4 Procédure de Fisher
Analyses multivariées AFC ACP PC1 (48%inertia) P < 0.001 PC2 (21%inertia) P < 0.001 Mouette Guillemot Macareux Tests d’assignment Macareux – 95% Mouette – 82% Guillemot – 89% ACP des populations de tique
Exploration d’une structure cachée d’inférence de structure AFC Méthodes Bayésiennes d’inférence de structure de populations Structure BAPS Flock
Applications à deux cas concrets: La tique Ixodes ricinus en Europe du Nord Les mouches tsé-tsé en Afrique de l'Ouest
Génétique des populations d'Ixodes ricinus et borréliose de Lyme en Suisse B. burgdorferi B. valaisiana B. garinii B. afzelii B. Spielmanii
Absence de structuration et déficits en hétérozygotes Génétique des populations d'Ixodes ricinus et borréliose de Lyme en Suisse Allozymes α-GPD PGM Absence de structuration et déficits en hétérozygotes
Déficits en hétérozygotes pour les microsatellites 0.1 0.2 0.3 0.4 0.5 0.6 0.7 IR8 IR25 IR27 IR32 IR39 All f ( F is estimator) -1 -0.75 -0.5 -0.25 0.25 0.5 0.75 1 109 111 113 115 117 119 121 123 125 127 129 131 Allele size F is (partials) 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 111 113 115 117 119 121 123 125 127 129 131 Allele size F is pi's balanced pi's bell shaped pi's decreasing pi's increasing pi's randomised
Distribution sexe spécifique du polymorphisme Biais de dispersion sexe spécifique des tiques B. burgdorferi B. valaisiana B. garinii B. afzelii
Détection des Borrelia dans les tiques Pour Borrelia burgdorferi P =0.012 ss 0.08 0.07 B. burgdorferi 0.06 0.05 0.04 Prévalence of 0.03 0.02 F M Sex of the tick
Détection des borrélies dans les tiques Pour Borrelia afzelii Saines Infectées Saines Infectées
Détection d'un effet Wahlund Utlisation du logiciel BAPS Clusters: FIS = 0.151, P-value ≤ 0.001. raw data FIS = 0.379, P-value ≤ 0.001. Wilcoxon signed-rank test, P-value = 0.032 => baisse de ~60%.
Détection d'un effet Wahlund Chez I. ricinus Chez I. uriae
Structure géographique Dσ²=1/(4π0.00577)=13.78 Méthode des déséquilibres de liaison de Bartley: Ne=268 (données brutes), Ne=596 (un individu ou une femelle et un mâle par cluster BAPS) S~0.2 km² Densités efficaces: De~1300 tiques/km² (données brute), De~3000 tiques/km² (données BAPS) Distance de dispersion entre adultes reproducteurs et leurs parents: σ~100 m/génération (données brutes), σ~60 m/génération (données BAPS) Une génération ~ 3 années
Détection de croisements entre apparentés Clusters: FIS = 0.151, P-value ≤ 0.001. raw data FIS = 0.379, P-value ≤ 0.001. Wilcoxon signed-rank test, P-value = 0.032 => baisse de ~60%.
Détection de croisements entre apparentés Printemps 2006 Moyenne Jackknife Tests de Mantel entre matrice d'apparentement entre individus et statut apparié 1 ou non apparié 0 P-value bilatérale Apparentements maximum possibles
Adults: roe deer, wild boar Races d'hôtes chez I. ricinus? 2002 Larvae: birds Nymphs: birds 2006 Larvae: birds, rodents Nymphs: birds 2006 Larvae: rodents 2007 Larvae: birds, lizard Nymphs: birds, lizard 2007 Larvae: birds Nymphs: birds, roe dear Adults: roe deer, wild boar 2003 Larvae: birds Nymphs: birds 2002 Larvae: birds Nymphs: birds 2007 Larvae: birds Nymphs: birds, roe dear Adults: roe deer 2004 Larvae: lizard Nymphs: lizard
Importance des infrapopulations FInfrapopulations/SubTotal=0.03 P-value (generalized binomial)=0.005 HS~0.75 FInfrapopulations/SubTotal'=0.03/(1-HS)=0.13
Adults: roe deer, wild boar Différenciation entre espèces hôtes en controllant pour l'infra-population 2002 Larvae: birds Nymphs: birds 2006 Larvae: birds, rodents Nymphs: birds 2006 Larvae: rodents 2007 Larvae: birds, lizard Nymphs: birds, lizard 2007 Larvae: birds Nymphs: birds, roe dear Adults: roe deer, wild boar 2003 Larvae: birds Nymphs: birds 2002 Larvae: birds Nymphs: birds 2007 Larvae: birds Nymphs: birds, roe dear Adults: roe deer 2004 Larvae: lizard Nymphs: lizard
Adults: roe deer, wild boar Différenciation entre espèces hôtes en controllant pour l'infra-population 2006 Larvae: birds, rodents 2007 Larvae: birds, lizard Nymphs: birds, lizard 2007 Nymphs: birds, roe dear Adults: roe deer, wild boar 2007 Nymphs: birds, roe dear FB-R=0.003 P-value=0.022 FB-R'=0.017 FRD-WB=0.028 P-value=0.002 FRD-WB'=0.14 FB-RD=0.047 P-value=0.078 FB-RD'=0.12 FB-L=-0.002 P-value=0.977
Parmi les tiques infectées par au moins une borrélie Co-occurence des différentes espèces de borrélies Parmi les tiques infectées par au moins une borrélie Données totales Borrélies (I x J) R(IJ) P-value Bbss Bba 0.292 0.00008 Bbss Bbg 0.496 0.05311 Bbss Bbundet -0.069 1 Bba Bbg 0.109 0.09348 Bba Bbundet -0.017 0.91598 Bbg Bbundet -0.030 Borrélies R(IJ) P-value Bbss Bba -0.471 0.11049 Bbss Bbg 0.412 1 Bbss Bbundet -0.622 0.00304 Bba Bbg -0.212 0.67559 Bba Bbundet -0.632 0.0001 Bbg Bbundet -0.290
Encore environs 50 000 cas, avec sous-surveillance seulement 10-15% des 60 millions de personnes vivant dans les zones concernée. Forme chronique Forme aigüe Trypanosoma brucei gambiense type 1 Trypanosoma brucei rhodesiense
FAO: US$ 4.75 milliard/an 1500
♂ ♀ L4
Glossina palpalis gambiensis Gpg Glossina palpalis palpalis Gpp Glossina tachinoides Gt
Gpp à Bonon, Côte d'Ivoire FIS>0 Loos G. p. g. G. p. p. Effet Wahlund + ? Hétérogéneité génétique
Gpg le long du Mouhoun, Burkina-Faso FIS>0 Loos G. p. g. G. p. p. Effet Wahlund + Population genetics D~0.01-1 tsetse/m σ~153-1053 m Mark release recapture D~0.16-0.24 tsetse/m σ~1250-2390 m
Gpg en Mangrove de Guinée Loos G. p. g. G. p. p. Falessadé Ne~40 m~0.028 FIS>0 Gpg en Mangrove de Guinée Dubreka Ne~1000 m~0.005 Fotoba Ne~40 m~0.014 Goulot d'étranglement il y a 276 générations (bauxite, 47 ans) Ne~55-5520 Kassa North Ne~30 m~0.027 Kassa South Ne~8 m~0.11 +Effets Wahlund probables
Gpg dans les Nyayes, Sénégal FIS~0 si pb techniques exclus
Gpg dans les Nyayes, Sénégal Goulot d'étranglement il y a entre 3 et 115 générations 1980-2005=25 ans=175 générations FST=10Mouhoun/260 km FST=2Loos/Continent FST~palpalis/gambiensis Efficacité des mâles stériles?
Gt et Gpg entre différents bassins: Comoe, Mouhoun, Sissili et Niger FSite/Basin=0.026 (P-value=0.001) Gt FIS~0, sauf pb techniques Loos G. p. g. G. p. p. Gpg FTrap/Site=0.0117, P-value=0.033 FSite/Basin=0.0379, P-value=0.001 FIS>0, pb techniques+Wahlund?
Gt et Gpg entre différents bassins: Comoe, Mouhoun, Sissili et Niger De≈26 Gt/km² Gt ♀, m~0.001 ♂, m~0.1-0.15 σ~454 m Loos G. p. g. G. p. p. Isolement par la distance sans rôle particulier des bassins Gpg De≈21000-39000 Gpg/km² σ=12-16 m (40moins que Gt)
Gpg dans la forêt sacrée de Bama, Burkina-Faso Ne Balloux: 17 Bartley: 30
Perspectives Meilleurs marqueurs
Crédits/Collaborations/Publications De Meeûs T., McCoy K.D., Prugnolle F., Chevillon C., Durand P., Hurtrez-Boussès S. & Renaud F. 2007. Population genetics and molecular epidemiology or how to "débusquer la bête". Infection Genetics and Evolution 7: 308-332. De Meeûs T. & Goudet J. 2007. A step by step tutorial to use HierFstat to analyse populations hierarchically structured at multiple levels. Infection Genetics and Evolution 7: 731-735. De Meeûs T. & McCoy K. 2009. La génétique des populations comme outil en épidémiologie. In Introduction à l'Epidémiologie Intégrative des Maladies Infectieuses et Parasitaires (Guégan J.F. & Choisy M. Eds.), De Boek Université, Bruxelles, pp 277-310. Hedrick, P.W., 2005, Genetics of Populations, Third Edition. Jones and Bartlett Publishers, Sudbury, Massachusetts, 737 p
Collaborations/Publications De Meeûs T., Beati L., Delaye C., Aeschlimann A. and Renaud F. 2002. Sex biased genetic structure in the vector of Lyme disease, Ixodes ricinus. Evolution 56: 1802–1807. De Meeûs T., Lorimier Y. and Renaud F. 2004. Lyme borreliosis agents and the genetics and sex of their vector, Ixodes ricinus. Microbes and Infection 6: 299-304. De Meeûs T., Humair P.F., Delaye C., Grunau C. and Renaud F. 2004. Non-Mendelian transmission of alleles at microsatellite loci: an example in Ixodes ricinus, the vector of Lyme disease. International Journal for Parasitology 34: 943-950. Kempf F., De Meeûs T., Arnathau C., Degeilh B. and McCoy K.D. 2009. Assortative Pairing in Ixodes ricinus L. (Acari:Ixodidae), the European Vector of Lyme Borreliosis. Journal of Medical Entomology 46: 471-474. Kempf F., McCoy K.D. & De Meeus T. 2010. Wahlund effects and sex-biased dispersal in Ixodes ricinus, the European vector of Lyme borreliosis: new tools for old data. Infection Genetics and Evolution 10: 989-997. Kempf F.*, De Meeûs T*, Vaumourin E., Noel V., Taragel’ová V., Plantard O., Heylen D.J.A., Eyraud C., Chevillon C. and McCoy K.D. 2012. Host races in Ixodes ricinus, the European vector of Lyme borreliosis. Infection Genetics and Evolution In press.
Collaborations/Publications Bouyer, J., Ravel, S., Dujardin, J.P., De Meeûs, T., Vial, L., Thévenon, S., Guerrini, L., Sidibe, I., Solano, P., 2007. Population structuring of Glossina palpalis gambiensis (Diptera: Glossinidae) according to landscape fragmentation in the Mouhoun river, Burkina Faso. J. Med. Entomol. 44, 788-795. Bouyer, J., Balenghien, T., Ravel, S., Vial, L., Sidibé, I., Thévenon, S., Solano, P., De Meeûs, T., 2009. Population sizes and dispersal pattern of tsetse flies: rolling on the river? Mol. Ecol. 18, 2787-2797. Bouyer, J., Ravel, S., Guerrini, L., Dujardin, J.P., Sidibé, I., Vreysen, M.J.B., Solano, P., De Meeûs, T., 2010. Population structure of Glossina palpalis gambiensis (Diptera: Glossinidae) between river basins in Burkina-Faso: consequences for area-wide integrated pest management. Infect. Genet. Evol. 10. Camara, M., Caro-Riano, H., Ravel, S., Dujardin, J.P., Hervouet, J.P., De Meeûs, T., Kagbadouno, M.S., Bouyer, J., Solano, P., 2006. Genetic and morphometric evidence for population isolation of Glossina palpalis gambiensis (Diptera : Glossinidae) on the Loos islands, Guinea. J. Med. Entomol. 43, 853-860. Kone, N., De Meeûs, T., Bouyer, J., Ravel, S., Guerrini, L., N’Goran, E.K., Vial, L., 2010. Population structuring of the tsetse Glossina tachinoides resulting from landscape fragmentation in the Mouhoun River Basin, Burkina Faso. Med. Vet. Entomol. 24, 162-168. Ravel, S., De Meeûs, T., Dujardin, J.P., Zeze, D.G., Gooding, R.H., Dusfour, I., Sane, B., Cuny, G., Solano, P., 2007. The tsetse fly Glossina palpalis palpalis is composed of several genetically differentiated small populations in the sleeping sickness focus of Bonon, Côte d'Ivoire. Infect. Genet. Evol. 7, 116-125. Solano, P., Ravel, S., Bouyer, J., Camara, M., Kagbadouno, M.S., Dyer, N., Gardes, L., Herault, D., Donnelly, M.J., De Meeûs, T., 2009. The population structure of Glossina palpalis gambiensis from island and continental locations in coastal Guinea. PLoS Negl. Trop. Dis. 3, e392. Solano, P., Ravel, S., De Meeûs, T., 2010. How can tsetse population genetics contribute to African trypanosomiasis control? Trends Parasitol. 26, 255-263. Solano P., Kaba D., Ravel S., Dyer N.A., Sall B., Vreysen M.J.B., Seck M.T., Darbyshir H., Gardes L., Donnelly M.J., De Meeûs T. & Bouyer J. 2010. Population genetics as a tool to select tsetse control strategies: suppression or eradication of Glossina palpalis gambiensis in the Niayes of Senegal. PLoS Negl. Trop. Dis. 4, e69. Koné N., Bouyer J., Ravel S., Vreysen M.J.B., Domagni K.T., Causse S., Solano P., De Meeûs T. 2011. Contrasting population structures of two vectors of African trypanosomoses in Burkina Faso: consequences for control. PLoS Neglected Tropical Diseases 5 (6): e1217.
Merci