Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
1
des populations naturelles de vecteurs:
Cours de génétique des populations naturelles de vecteurs: théorie, empirisme et inférences Master International d'Entomologie Médicale et Vétérinaire Bobo-Dioulasso, Novembre 2011 Thierry de Meeûs UMR 177 IRD-CIRAD "INTERTRYP" WHO Collaborating Center for research on host/vector/parasite interactions for surveillance and control of Human African Trypanosomiasis Centre International de Recherche-Développement sur l’Elevage en zone Subhumide (CIRDES), N559, rue 5.31, 01 BP 454, Bobo-Dioulasso 01, Burkina-Faso.
2
Introduction
4
Méthodes directes Méthodes indirectes
5
Structure d'une Population Taille des Unités de Reproduction
Migration
6
Détection de la variation génétique
Marqueurs cytpolasmiques ♀ ♂
7
Détection de la variation génétique
Marqueurs nucléaires AA Aa aa Marqueurs dominants [A] [a] RAPD (Randomly Amplified Polymorphic DNA) ATGCAC TACGTG TCATGA AGTACT Amorces PCR aléatoires ATGATC TACTAG AATCTG TTAGTA Présence ou absence d'amplification=>marqueur dominant Maladies génétiques récessives
8
Détection de la variation génétique: marqueurs codominants
A1A1 A1A2 A2A2 Microsatellites Primer1 CTCTCTCT AGAGAGAG Primer2 mRNA Primer1 CTCTCTCTCT AGAGAGAGAG AUGCAGCCAUAGGCG Primer2 PCR Enzymes Phe-Pro-Leu-Ileu-Val + + - - Electrophorèse RFLP, MLST, SNP… Hypothèse importante pour les inférences=Neutralité
9
Bases théoriques
10
La population unité de base de l'écologie une notion démographique
Un groupe d'individus partagent les mêmes paramètres démographiques Population 1 Population 2 Population 3 Population 4 N1 N2 N3 N4 Multiplication et migration Régulation N1 N2 N3 N4 Taille constante des populations
11
Le modèle de Hardy-Weinberg
Une seule population Taille de la population N=∞ Reproduction sexuée panmictique Pas de mutation Pas de migration Pas de sélection Générations discrètes Hardy G.H. (GB) et Weinberg W. (D) (1908)
12
sous l'hypothèse panmictique
Proportions de Hardy-Weinberg Tableau des gamètes et des zygotes formés sous l'hypothèse panmictique p q pp pq qp qq ♀ + ♂ - f( ) = = p + f( ) = q=1-p f( ) = p² ; f( ) = 2pq ; f( ) = q²
13
ft(A)=pt, ft(a)=qt=1-pt
Equilibre de Hardy-Weinberg Aa Ht aa Rt AA Dt ft(A)=pt, ft(a)=qt=1-pt Panmixie (hermaphrodites) Taille de population N~∞ Migration m=0 Mutation u=0 Pas de sélection Générations discrètes En une génération
14
ft(A)=pt, ft(B)=qt , ft(C)=rt=1-pt-qt
Equilibre de Hardy-Weinberg avec trois allèles AA At AB Bt AC Ct BB Dt BC Et CC Jt ft(A)=pt, ft(B)=qt , ft(C)=rt=1-pt-qt En une génération
15
Equilibre de Hardy-Weinberg avec Dominance
AA Aa aa Rt Dt ft(A)=pt, ft(a)=qt=1-pt Si on fait l'hypothèse que Rt=qt² Hypothèse: la population vérifie des proportions panmictiques: hypothèse (très) forte
16
Equilibre de Hardy-Weinberg quand N petit: la dérive
Ft: probabilité de tirer deux allèles identiques par ascendance dans la population à la génération t ils étaient déjà identiques à la génération t ils deviennent identiques à la génération t+1 Diversité génétique
17
Equilibre de Hardy-Weinberg quand N petit: la dérive
Ft: probabilité de tirer deux allèles identiques par ascendance dans la population à la génération t
18
Equilibre de Hardy-Weinberg quand N petit: la dérive
Plecoptera Panmixie, Migration m=0, Mutation u=0, Pas de sélection
19
Effectif efficace Une population focale Pf Une population idéale Pi
Taille de la population Nc Reproduction sexuée panmictique Pas de mutation Pas de migration Pas de sélection Une population idéale Pi Taille de la population Ne Reproduction sexuée panmictique Pas de mutation Pas de migration Pas de sélection
20
Effectif efficace Population idéale (Pi) de taille Ne (effectif efficace): Idéale=panmictique, sans mutation ni migration ni sélection (mais de taille limitée Ne) Population focale (Pf) de taille Nc (census=recensement) Effectif efficace de consanguinité (inbreeding): Evolution de la consanguinité de Pf = Evolution de la consanguinité de Pi Effectif efficace de variance: Variance des fréquences alléliques identiques entre Pf et Pi d'une génération à l'autre Effectif efficace de valeur propre: Evolution de l'hétérozygotie identique entre Pf et Pi Effectif efficace de coalescence: Temps de coalescence identique entre Pf et Pi (coalescence=premier ancêtre commun entre deux gènes pris au hasard)
21
Temps moyen de coalescence =(11+12+23+34+15+16)/9≈4
Temps moyen de coalescence =(11+12+23+34+15+16)/9≈4
22
Effectif efficace Population idéale (Pi) de taille Ne (effectif efficace): Idéale=panmictique, sans mutation ni migration ni sélection Population focale (Pf) de taille Nc (census=recensement) Effectif efficace de consanguinité (inbreeding): Evolution de la consanguinité de Pf = Evolution de la consanguinité de Pi Effectif efficace de variance: Variance des fréquences alléliques identiques entre Pf et Pi d'une génération à l'autre Effectif efficace de valeur propre: Evolution de l'hétérozygotie identique entre Pf et Pi Effectif efficace de coalescence: Temps de coalescence identique entre Pf et Pi (coalescence=premier ancêtre commun entre deux gènes pris au hasard) En principes tous identiques mais pas toujours
23
Effectif efficace d'une population dioïque
Chez des monoïques, la probabilité de tirer deux fois le même allèle par hasard est τe=1/2N Quelle probabilité τd chez des dioïques, avec N=Nf+Nm et accouplements aléatoires (pangamie)? Si même grand mère Si même grand père
24
Effectif efficace d'une population dioïque
Chez des monoïques, la probabilité de tirer deux fois le même allèle par hasard est τe=1/2N Quelle probabilité τd chez des dioïques, avec N=Nf+Nm et accouplements aléatoires (pangamie)? Si même grand mère Si même grand père
25
Effectif efficace d'une population dioïque
Chez des monoïques, la probabilité de tirer deux fois le même allèle par hasard est τe=1/2N Quelle probabilité τd chez des dioïques, avec N=Nf+Nm et accouplements aléatoires (pangamie)? Si même grand mère Si même grand père
26
Effectif efficace d'une population dioïque
Chez des monoïques, la probabilité de tirer deux fois le même allèle par hasard est τe=1/2N Quelle probabilité τd chez des dioïques, avec N=Nf+Nm et accouplements aléatoires (pangamie)? On cherche Ne tel que τd=τe Si Nf=99 et Nm=1 alors Ne=3.96~4
27
Effectif efficace d'une population dioïque
Tailles de populations réduites Balloux Sex ratio équilibré
28
Pour plus d’un locus: les désequilibres de liaison
Deux loci 1 et 2 Locus 1 Locus 2 D1 H1 R1 D2 H2 R2 1→p1 1→p2 Gamètes ou haplotypes 1_1: p1_1=p1p2+Dt 1_2: p1_2=p1(1-p2)-Dt 2_1: p2_1=(1-p1)p2-Dt 2_2: p2_2=(1-p1)(1-p2)+Dt Dt=p1_1-p1p2 Au maximum D=[-0.25,+0.25] e.g. quand p1_2 et p2_1=0.5, ou quand p1_1 et p2_2=0.5
29
Désequilibres de liaison maximaux
Deux loci 1 et 2 Locus 1 Locus 2 D1 H1 R1 D2 H2 R2 1→p1 1→p2 Gamètes ou haplotypes 1_1: p1_1=p1p2+Dt 1_2: p1_2=p1(1-p2)-Dt 2_1: p2_1=(1-p1)p2-Dt 2_2: p2_2=(1-p1)(1-p2)+Dt Dt=p1_1-p1p2 Quand p1_2 et p2_1=0.5, alors p1_1=0 et donc D=-p1p2 donc 0.5=p1(1-p2)+p1p2p1=0.5 et 0.5=p2(1-p1)+p1p2p2=0.5 et donc D=-0.25 De la même façon, quand p1_1 et p2_2=0.5 on obtient D=0.25
30
Désequilibres de liaison maximums quand p1 et/ou p2≠0.5
Deux loci 1 et 2 Locus 1 Locus 2 Gamètes p1_1=p1p2+Dt p1_2=p1(1-p2)-Dt p2_1=(1-p1)p2-Dt p2_2=(1-p1)(1-p2)+Dt D1 H1 R1 D2 H2 R2 1→p1 1→p2 Dmax alors P1_2=0 ou p2_1=0, P1_2 et P2_1 devant être ≥0 Dmin alors P1_1=0 ou p2_2=0, P1_1 et P2_2 devant être ≥0
31
Pour plus d’un locus: les désequilibres de liaison
Deux loci 1 et 2 Locus 1 Locus 2 Gamètes p1_1=p1p2+Dt p1_2=p1(1-p2)-Dt p2_1=(1-p1)p2-Dt p2_2=(1-p1)(1-p2)+Dt D1 H1 R1 D2 H2 R2 1→p1 1→p2 Si le taux de recombinaison est r et la reproduction panmictique
32
Pour plus d’un locus: les déséquilibres de liaison
Deux loci 1 et 2 Locus 1 Locus 2 Gamètes p1_1=p1p2+Dt p1_2=p1(1-p2)-Dt p2_1=(1-p1)p2-Dt p2_2=(1-p1)(1-p2)+Dt D1 H1 R1 D2 H2 R2 1→p1 1→p2 Si le taux de recombinaison est r et la reproduction panmictique N grand
33
Pour plus d’un locus: les désequilibres de liaison
Quelles forces évolutives génèrent et/ou maintiennent du déséquilibre de liaison? Toutes: mutation, dérive, système de reproduction, sélection, migration et bien sûr le degré de liaison
34
Fin du premier cours
35
Altérations des proportions de Hardy Weinberg
Déficits en hétérozygotes Taenia solium Nasonia vitripenis Endogamies Sousdominance Effet Wahlund Rh-Rh- Rh+Rh- Homogamie Causes techniques Allèles nuls Dominance des allèles courts Allelic dropout Stuttering
36
Autofécondation A 1/2 a A 1/2 AA 1/4 Aa a 1/2 aa AA Aa aa Dt Ht Rt
s: autofécondation 1-s: panmixie Taille de population, N grand Taux de mutation u=0 Taux de migration m=0 A 1/2 a A 1/2 AA 1/4 Aa a 1/2 aa
37
Autofécondation AA Aa aa Dt Ht Rt
38
Autofécondation AA Aa aa Dt Ht Rt
39
A l’équilibre, Ht=Ht+1=Heq
Autofécondation AA Aa aa Dt Ht Rt A l’équilibre, Ht=Ht+1=Heq
40
A l’équilibre, Ht=Ht+1=Heq
Autofécondation AA Aa aa Dt Ht Rt A l’équilibre, Ht=Ht+1=Heq
41
A l’équilibre, Ht=Ht+1=Heq
Autofécondation AA Aa aa Dt Ht Rt A l’équilibre, Ht=Ht+1=Heq
42
A l’équilibre, Ht=Ht+1=Heq Formule généralisée de Wright
Autofécondation AA Aa aa Dt Ht Rt A l’équilibre, Ht=Ht+1=Heq Formule généralisée de Wright
43
Endogamies Tous les loci Pour les loci concernés 0.1 0.2 0.3 0.4 0.5
0.1 0.2 0.3 0.4 0.5 10 20 30 40 50 t H Autofécondation 100% ou homogamie codominante Croisements frère/soeur 100 % Homogamie 100% (p=0.5) Homogamie 100% (p=0.25) Homogamie 100% (p=0.75) Pour les loci concernés dominante
44
Effet Wahlund
45
Effet Wahlund
46
Effet Wahlund
47
Effet Wahlund F=0 si p1=p2
48
fNpt²+ 2pt(1-pt)(1-s)fN+ fN(1-pt)²
Sousdominance Panmixie, grande population de taille N, pas de mutation ni de migration, fécondité de f (>1) 2 allèles, A et a de fréquence pt et 1-pt à la génération t AA Aa aa Fitness 1 1-s Zygotes fNpt² 2pt(1-pt)(1-s)fN fN(1-pt)² Régulation fNpt²+ 2pt(1-pt)(1-s)fN+ fN(1-pt)² Fréquences t+1 Fitness moyenne
49
2 allèles, A et a de fréquence pt et 1-pt à la génération t
Sousdominance 2 allèles, A et a de fréquence pt et 1-pt à la génération t AA Aa aa Fitness 1 1-s Fréquences t+1
50
Sousdominance 2 allèles, A et a de fréquence pt et 1-pt à la génération t Equilibre quand les fréquences ne bougent plus i.e. quand Δp=pt+1- pt=0 =A2*(1-A2)*(2*A2-1)
51
Altérations des proportions de Hardy Weinberg
Excès d'hétérozygotes Superdominance Hétérogamie Anémie falciforme et Plasmodium falciparum HLA Clonalité Candida albicans Trypanosoma brucei Biais de dispersion sexe spécifique Ixodes ricinus Hétérosis Schistosoma Bandes echo Loci dupliqués
52
fNpt²(1-s)+ 2pt(1-pt)fN+ fN(1-pt)²(1-s)
Superdominance Panmixie, grande population de taille N, pas de mutation ni de migration, fécondité de f (>1) 2 allèles, A et a de fréquence pt et 1-pt à la génération t AA Aa aa Fitness 1-s 1 Zygotes fNpt²(1-s) 2pt(1-pt) fN fN(1-pt)²(1-s) Régulation fNpt²(1-s)+ 2pt(1-pt)fN+ fN(1-pt)²(1-s) Fréquences t+1
53
valeur sélective moyenne de la population
Superdominance 2 allèles, A et a de fréquence pt et 1-pt à la génération t AA Aa aa Fitness 1-s 1 Fréquences t+1 valeur sélective moyenne de la population
54
2 allèles, A et a de fréquence pt et 1-pt à la génération t
Superdominance 2 allèles, A et a de fréquence pt et 1-pt à la génération t s<1 =A2*(1-A2)*(1-2*A2)
55
Superdominance Fardeau génétique
56
Donc l’équilibre est atteint quand ABeq=ACeq=BCeq=1/3
Hétérogamie AB AC BC ABt ACt BCt Donc l’équilibre est atteint quand ABeq=ACeq=BCeq=1/3
57
Hétérogamie Allèle D? AB AC BC ABt ACt BCt
58
Clonalité Pas de mutation ni de migration, grande population, pas de sélection proportion c investie en reproduction clonale et 1-c en panmixie AA Aa aa Dt Ht Rt A l’équilibre Ht=Ht+1=Heq et donc: Convergence vers HW mais forts désequilibres de liaison attendus
59
Clonalité +Dérive +Mutation AA Aa aa Dt Ht Rt Aa Heq~1
60
F statistiques de Wright
AA Aa aa Do Ho Ro H: probabilité de tirer deux allèles différents, dans un individu d’une sous-population (HI) dans deux individus de la même sous-population (HS)
61
Modèle en îles de Wright
62
F-statistiques de Wright
cas général: plus de deux allèles, n quelconque H: probabilité de tirer deux allèles différents, dans un individu d’une sous-population (HI) dans deux individus de la même sous-population (HS) dans deux sous-populations différentes du total (HT)
63
F-statistiques de Wright
cas général: plus de deux allèles (K>>2), n quelconque H: probabilité de tirer deux allèles différents, dans un individu d’une sous-population (HI) dans deux individus de la même sous-population (HS) dans deux sous-populations différentes du total (HT) Q=1-H: probabilité de tirer deux allèles identiques, dans un individu QI, dans deux individus de la même sous-population QS et dans deux sous-populations différentes QT HI: Hétérozygotie moyenne observée HS: Diversité génétique des sous-populations HT: Diversité génétique totale Nei
64
F-statistiques de Wright
cas général: plus de deux allèles, n quelconque Chesser & Nei (1-FIT)=(1-FIS)(1-FST) Weir Rousset
65
Les F-Statistiques de Wright
FIT FIS F IS l
66
Les F-Statistics de Wright
FIT FIS Taille de sous-échantillons Ns=1 Estimations RAPPEL: Variance: s² = [1/n].Si[(xi-x)²] ; s² = [1/(n-1)].Si[(xi-x)²] Estimateurs f et θ de Weir & Cockerham F IS l
67
Estimateurs des F de Wright
pour K allèles noté de A=1 à K Weir & Cockerham non biaisés variance d’estimation forte Robertson & Hill biaisés variance d’estimation faible (meilleure « statistique ») FIS FST FIT
68
F-statistiques pour plus de trois niveaux hiérarchiques
>>0 ~0 ~0 ~0 FSA FAT Yang
69
Fin du deuxième cours
70
Inférences
71
Les F-Statistiques de Wright Inférences Autofécondation
AA Aa aa Dt Ht Rt A l’équilibre, Ht=Ht+1=Heq Formule généralisée de Wright
72
Les F-Statistiques de Wright: Inférences Croisements frères-soeurs
Apparentement φ Consanguinité F ♀ ♂ φt-2 Ft-2 φt-1 Ft-1=φt-2 Evolution de la consanguinité F: différents petits enfants possibles en fonction des gènes présents chez leurs deux grands parents. φt Ft=φt-1 Même grand-mère Même grand-parent Même grand-père Grands-parents différents
73
Les F-Statistiques de Wright: Inférences Croisements frères-soeurs
Même grand-mère Même grand-parent Même grand-père Grands-parents différents P(même grand-parent)=Pmgp=1/2 P(pas même grand-parent)=Ppmgp=1/2 P(retrouver 2 fois le même gène d'un même grand parent)=P2mgp=4/8=1/2 P(prendre les deux gène différents d'un même grand-parent)=P2dmgp=1/2 P(les 2 gènes d'un grand-parent sont identiques par ascendance )=P2dId/mgp=Ft-2 P(gènes identiques/même grands-parents)=PId/mgp=Pmgp(P2mgp+P2dmgpP2dId/mgp)=1/2(1/2+1/2Ft-2) P(gènes identiques/pas même grands-parents)=PId/pmgp=Ppmgpφt-2=1/2Ft-1 Par conséquent Ft=1/2(1/2+1/2Ft-2)+1/2Ft-1
74
Les F-Statistiques de Wright: Inférences Croisements frères-soeurs
Ft=1/2(1/2+1/2Ft-2)+1/2Ft-1 Taux de croisements frères–soeurs = b alors la perte en hétérozygotie à la génération t sera de: Ft=b[1/2(1/2+1/2Ft-2)+1/2Ft-1]+(1-b)0 Ft=(b/2)[1/2+1/2Ft-2+Ft-1]=(b/4)(1+Ft-2+2Ft-1) A l'équilibre Ft=Ft-1=Ft-2=FIS FIS=(b/4)(1+FIS+2FIS) et donc
75
Les F-Statistiques de Wright Inférences
Modèle en îles de Wright, n grand, m et u petit, K grand: QT~0 panmixie locale: QI=QS
76
Les F-Statistiques de Wright Inférences
Modèle en îles de Wright, n grand, m et u petit, K grand: QT~0 panmixie locale: QI=QS A l’équilibre migration/mutation/dérive
77
Les F-Statistiques de Wright Inférences
Modèle en îles de Wright, n grand, m et u petit, K grand: QT~0 panmixie locale: QI=QS A l’équilibre migration/mutation/dérive
78
Les F-Statistiques de Wright Inférences
Modèle en îles de Wright, n grand, m et u petit, K grand: QT~0 panmixie locale: QI=QS A l’équilibre migration/mutation/dérive On néglige les termes en m², u² et mu devant 1
79
Les F-Statistiques de Wright Inférences
Modèle en îles de Wright, n grand, m et u petit, K grand: QT~0 panmixie locale: QI=QS A l’équilibre migration/mutation/dérive On néglige les termes en m², u² et mu devant 1
80
Les F-Statistiques de Wright Inférences
Modèle en îles de Wright, n grand, m et u petit, K grand: QT~0 panmixie locale: QI=QS A l’équilibre migration/mutation/dérive
81
Les F-Statistiques de Wright Inférences
Modèle en îles de Wright, n grand, m et u petit, K grand: QT~0 panmixie locale: QI=QS A l’équilibre migration/mutation/dérive On néglige les termes en m², u² et mu On néglige les termes en m et u devant 1
82
Les F-Statistiques de Wright Inférences
Modèle en îles de Wright, n grand, m et u petit, K grand: QT~0 panmixie locale: QI=QS; FST=QS A l’équilibre migration/mutation/dérive si u<<m FST_max si m=0 FST_max ≈QS=1-HS FST’ =FST/FST_max
83
Les F-Statistiques de Wright
Modèle en îles fini (n petit), avec homoplasie (K petit) et une proportion s d’autofécondation locale
84
Les F-Statistiques de Wright Autres modèles de populations
Stepping stone (en pas Japonais) et Voisinage 1 D 3 D 2 D
85
Les F-Statistiques de Wright Autres modèles de populations
Stepping stone (en pas Japonais) et Voisinage 2 D 1 D
86
Stepping stone (en pas Japonais) et Voisinage
Rousset 2 D 1 D Pente b De: Densité efficace d’individus (/m ou /m²) σ: distance entre adultes reproducteurs et leurs parents
87
Estimations d’effectifs efficaces
Différenciation génétiques entre échantillons séparés dans le temps Ne: Waples Dans l’espace et le temps Ne et m: Wang & Whitlock Déséquilibres de liaisons Ne: Bartley et al., Waples & Do Excès d’hétérozygotes (dioïques ou autoincompatibles) Ne: Balloux Déséquilibres inter et intra loci sur données spatiales Ne et m: Vitalis & Couvet
88
Procédures statistiques
89
Procédures statistiques: définitions
On recherche avec quelle probabilité, appelée P-value, le hasard permet d'expliquer nos données si ces dernières suivent l'hypothèse nulle H0. Le test, défini a priori, peut être: -bilatéral: dans ce cas l'hypothèse alternative H1 est que les valeurs observées sont trop extrêmes pour être expliquées par le hasard; -unilatéral "plus grand": dans ce cas H1 est que les valeurs observées sont plus grandes qu'attendue par hasard sous H0; -unilatéral "moins grand": dans ce cas H1 est que les observations ont des valeurs plus petites qu'attendues sous H0. Par convention on a choisi arbitrairement la limite 0.05 pour la P-value seuil au dessous de laquelle un test est dit significatif. Mais, selon les circonstances ont peut choisir d'être plus ou moins sévère. La décision statistique ne dépend que du manipulateur. Erreur de première espèce, α: probabilité de se tromper en rejetant H0 (P-value); Erreur de seconde espèce, β: probabilité de se tromper en acceptant l'hypothèse nulle. Un test est puissant si on rejette facilement H0; Un test est robuste s'il ne rejette pas trop souvent H0.
90
Procédures statistiques
Calculs d’intervalles de confiance (IC) des F-statistiques Bootstrap (e.g. sur les loci): on rééchantillonne aléatoirement k fois (e.g. 5000) avec remise. On peut donc tirer plusieurs fois le même item (e.g. locus) et on calcule F à chaque tirage.
91
Procédures statistiques
Calculs d’intervalles de confiance (IC) des F-statistiques Jackknife (e.g. sur les sous-échantillons): on retire un item à la fois (e.g. un sous-échantillon) et on recalcule F sur ceux qui restent. On obtient autant de valeurs qu’il y a d’items dont on tire une moyenne et une variance pour F qui sert au calcul d’une erreur standard du F. Sous l’hypothèse de normalité on peut estimer un IC qui correspond à F±StdErr(F)tα,γ, où t se trouve dans une table du t, où α correspond au seuil désiré (0.05 pour un CI à 95%, 0.01 pour 99%) et γ au degré de liberté (i.e. nombre d’items-1)
92
Procédures statistiques: IC 95% du Jackknife
Table du t n-1 t(α=0.05) 1 12.706 21 2.08 45 2.014 2 4.303 22 2.074 50 2.009 3 3.182 23 2.069 55 2.004 4 2.776 24 2.064 60 5 2.571 25 2.06 65 1.997 6 2.447 26 2.056 70 1.994 7 2.365 27 2.052 80 1.99 8 2.306 28 2.048 90 1.987 9 2.262 29 2.045 100 1.984 10 2.228 30 2.042 110 1.982 11 2.201 31 2.04 120 1.98 12 2.179 32 2.037 130 1.978 13 2.16 33 2.035 140 1.977 14 2.145 34 2.032 150 1.976 15 2.131 35 2.03 200 1.972 16 2.12 36 2.028 250 1.97 17 2.11 37 2.026 300 1.968 18 2.101 38 2.024 400 1.966 19 2.093 39 2.023 500 1.965 20 2.086 40 2.021 1000 1.962 FIS=0.2 10 loci StdErr(FIS)=0.01 l’IC 95% sera 0.01 et 0.01 soit 95% IC=[0.177, 0.223]
93
Procédures statistiques
Tests de significativité par randomisation Tests de randomisations: Simuler H0 un très grand nombre de fois; la P-value du test = la proportion des valeurs simulées qui sont aussi extrêmes ou plus extrêmes que celle observée dans l’échantillon Il est important de bien appréhender ce qu’il y a derrière H0 et H1: que cherche-t-on à tester exactement? Nombre de randomisations: si permutations, au moin si chaine de Markhov
94
Procédures statistiques
Tests de significativité des F par randomisation Significativité du FIS = tester la panmixie locale Tester si FIS > 0 P-value P1 ou < 0 P-value P2 ou ≠ 0 P-value P3 FIS FIS ≠ 0 (bilatéral) P3=min(P1,P2)+[1-max(P1,P2)] Utilisation d’autres estimateurs (Robertson & Hill) comme statistique Tests exacts de Haldane (pas de test global sur les sous-échantillons et loci)
95
Procédures statistiques
Tests de significativité des F par randomisation Tester si FST > 0 FST
96
Procédures statistiques
Tester si la répartition des génotypes est aléatoire à l’aide de la statistique G H0: le G observé n’est pas plus grand que ceux générés par permutation aléatoire des individus entre sous-échantillons Statistique G: logarithme du rapport de maximum de vraisemblance des fréquences alléliques dans les différents sous-échantillons. Propriété additive du G permet de tester globalement sur les loci
97
Procédures statistiques
Tester la significativité d’une corrélation entre deux matrices de distances tel que dans le cas d’un isolement par la distance Les cases sont auto-corrélées Test de Mantel: on permute les cases d’une des matrices et on recalcule la corrélation à chaque fois. La P-value=la proportion de corrélations randomisées aussi grandes ou plus grandes que l’observée Test assez conservateur
98
Procédures statistiques Déséquilibres de liaison
Locus_ 2 11 12 13 14 22 23 24 33 34 44 n 11/11 11/12 11/13 11/14 … 12/11 12/12 12/13 12/14 13/11 13/12 13/13 13/14 14/11 14/12 14/13 14/14 15 15/11 15/12 15/13 15/14 etc… 25 35 45 55 Locus_ 1 Mesures multiLocus
99
Procédures statistiques
Déséquilibres de liaison Les génotypes des loci (nous n’avons en général pas les haplotypes=la phase) sont réassociés un grand nombre de fois et une statistique mesurée à chaque fois. La P-value du test correspond à la proportion des valeurs randomisées supérieures ou égales à l’observée. Tests par paires de loci: Statistique utilisée: G permet un test sur l’ensemble des sous-populations mais par paire de loci=>autant de P-values que de paires de loci Tests multilocus: Statistique utilisée: rD par exemple permet un test sur l’ensemble des loci mais par sous-échantillon=>autant de P-values que de sous-échantillons Dans tous les cas il faudra tenir compte de cette répétition de tests
100
Procédures statistiques
F-statistiques pour plus de trois niveaux hiérarchiques
101
Procédures statistiques Comparaison de groupes
Champêtres Sylvestres S=FIS, FST, AIc, Ho, Hs etc… SObs=(SObs1-SObs2)²
102
Procédures statistiques
Comparaison de catégories d’individus S=FIS, FST, AIc, Ho, Hs etc… Randomisation du statut en gardant le ratio local constant SObs=(SObs1-SObs2)²
103
Procédures statistiques
Facteurs imbriqués et croisés Différenciation entre genres Différenciation géographique FST_2; P-value_2 FST_1; P-value_1 Procédure pour combiner ces tests multiples
104
Procédures pour combiner k tests
P1, P2, P3, …Pk Quels tests sont significatifs? La série des k tests est-elle significative? Bonferroni sequentiel Pmink Pmin-1(k-1) etc.. Les P-values corrigées qui restent significatives désignent les tests qui les ont. Test hyper-conservateur à n’utiliser que sur les tests les plus puissants (gros échantillons les plus polymorphes) Tests non indépendants Test binomial exact Tests indépendants Procédure Z de Stouffer si k<4 Zi=LOI.NORMALE.INVERSE(Pi;0;1) P-value=LOI.NORMALE.STANDARD(Z) Au moins un test de la série est-il significatif? Procédure binomiale généralisée si k≥4 Procédure de Fisher
105
Analyses multivariées
AFC ACP PC1 (48%inertia) P < 0.001 PC2 (21%inertia) P < 0.001 Mouette Guillemot Macareux Tests d’assignment Macareux – 95% Mouette – 82% Guillemot – 89% ACP des populations de tique
106
Exploration d’une structure cachée d’inférence de structure
AFC Méthodes Bayésiennes d’inférence de structure de populations Structure BAPS Flock
107
Applications à deux cas concrets:
La tique Ixodes ricinus en Europe du Nord Les mouches tsé-tsé en Afrique de l'Ouest
108
Génétique des populations d'Ixodes ricinus et borréliose de Lyme en Suisse
B. burgdorferi B. valaisiana B. garinii B. afzelii B. Spielmanii
109
Absence de structuration et déficits en hétérozygotes
Génétique des populations d'Ixodes ricinus et borréliose de Lyme en Suisse Allozymes α-GPD PGM Absence de structuration et déficits en hétérozygotes
110
Déficits en hétérozygotes pour les microsatellites
0.1 0.2 0.3 0.4 0.5 0.6 0.7 IR8 IR25 IR27 IR32 IR39 All f ( F is estimator) -1 -0.75 -0.5 -0.25 0.25 0.5 0.75 1 109 111 113 115 117 119 121 123 125 127 129 131 Allele size F is (partials) 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 111 113 115 117 119 121 123 125 127 129 131 Allele size F is pi's balanced pi's bell shaped pi's decreasing pi's increasing pi's randomised
111
Distribution sexe spécifique du polymorphisme
Biais de dispersion sexe spécifique des tiques B. burgdorferi B. valaisiana B. garinii B. afzelii
112
Détection des Borrelia dans les tiques
Pour Borrelia burgdorferi P =0.012 ss 0.08 0.07 B. burgdorferi 0.06 0.05 0.04 Prévalence of 0.03 0.02 F M Sex of the tick
113
Détection des borrélies dans les tiques
Pour Borrelia afzelii Saines Infectées Saines Infectées
114
Détection d'un effet Wahlund
Utlisation du logiciel BAPS Clusters: FIS = 0.151, P-value ≤ raw data FIS = 0.379, P-value ≤ Wilcoxon signed-rank test, P-value = 0.032 => baisse de ~60%.
115
Détection d'un effet Wahlund
Chez I. ricinus Chez I. uriae
116
Structure géographique
Dσ²=1/(4π )=13.78 Méthode des déséquilibres de liaison de Bartley: Ne=268 (données brutes), Ne=596 (un individu ou une femelle et un mâle par cluster BAPS) S~0.2 km² Densités efficaces: De~1300 tiques/km² (données brute), De~3000 tiques/km² (données BAPS) Distance de dispersion entre adultes reproducteurs et leurs parents: σ~100 m/génération (données brutes), σ~60 m/génération (données BAPS) Une génération ~ 3 années
117
Détection de croisements entre apparentés
Clusters: FIS = 0.151, P-value ≤ raw data FIS = 0.379, P-value ≤ Wilcoxon signed-rank test, P-value = 0.032 => baisse de ~60%.
118
Détection de croisements entre apparentés
Printemps 2006 Moyenne Jackknife Tests de Mantel entre matrice d'apparentement entre individus et statut apparié 1 ou non apparié 0 P-value bilatérale Apparentements maximum possibles
119
Adults: roe deer, wild boar
Races d'hôtes chez I. ricinus? 2002 Larvae: birds Nymphs: birds 2006 Larvae: birds, rodents Nymphs: birds 2006 Larvae: rodents 2007 Larvae: birds, lizard Nymphs: birds, lizard 2007 Larvae: birds Nymphs: birds, roe dear Adults: roe deer, wild boar 2003 Larvae: birds Nymphs: birds 2002 Larvae: birds Nymphs: birds 2007 Larvae: birds Nymphs: birds, roe dear Adults: roe deer 2004 Larvae: lizard Nymphs: lizard
120
Importance des infrapopulations
FInfrapopulations/SubTotal=0.03 P-value (generalized binomial)=0.005 HS~0.75 FInfrapopulations/SubTotal'=0.03/(1-HS)=0.13
121
Adults: roe deer, wild boar
Différenciation entre espèces hôtes en controllant pour l'infra-population 2002 Larvae: birds Nymphs: birds 2006 Larvae: birds, rodents Nymphs: birds 2006 Larvae: rodents 2007 Larvae: birds, lizard Nymphs: birds, lizard 2007 Larvae: birds Nymphs: birds, roe dear Adults: roe deer, wild boar 2003 Larvae: birds Nymphs: birds 2002 Larvae: birds Nymphs: birds 2007 Larvae: birds Nymphs: birds, roe dear Adults: roe deer 2004 Larvae: lizard Nymphs: lizard
122
Adults: roe deer, wild boar
Différenciation entre espèces hôtes en controllant pour l'infra-population 2006 Larvae: birds, rodents 2007 Larvae: birds, lizard Nymphs: birds, lizard 2007 Nymphs: birds, roe dear Adults: roe deer, wild boar 2007 Nymphs: birds, roe dear FB-R=0.003 P-value=0.022 FB-R'=0.017 FRD-WB=0.028 P-value=0.002 FRD-WB'=0.14 FB-RD=0.047 P-value=0.078 FB-RD'=0.12 FB-L=-0.002 P-value=0.977
123
Parmi les tiques infectées par au moins une borrélie
Co-occurence des différentes espèces de borrélies Parmi les tiques infectées par au moins une borrélie Données totales Borrélies (I x J) R(IJ) P-value Bbss Bba 0.292 Bbss Bbg 0.496 Bbss Bbundet -0.069 1 Bba Bbg 0.109 Bba Bbundet -0.017 Bbg Bbundet -0.030 Borrélies R(IJ) P-value Bbss Bba -0.471 Bbss Bbg 0.412 1 Bbss Bbundet -0.622 Bba Bbg -0.212 Bba Bbundet -0.632 0.0001 Bbg Bbundet -0.290
124
Encore environs cas, avec sous-surveillance seulement 10-15% des 60 millions de personnes vivant dans les zones concernée. Forme chronique Forme aigüe Trypanosoma brucei gambiense type 1 Trypanosoma brucei rhodesiense
126
FAO: US$ 4.75 milliard/an 1500
127
♂ ♀ L4
128
Glossina palpalis gambiensis Gpg
Glossina palpalis palpalis Gpp Glossina tachinoides Gt
129
Gpp à Bonon, Côte d'Ivoire
FIS>0 Loos G. p. g. G. p. p. Effet Wahlund + ? Hétérogéneité génétique
130
Gpg le long du Mouhoun, Burkina-Faso
FIS>0 Loos G. p. g. G. p. p. Effet Wahlund + Population genetics D~ tsetse/m σ~ m Mark release recapture D~ tsetse/m σ~ m
131
Gpg en Mangrove de Guinée
Loos G. p. g. G. p. p. Falessadé Ne~40 m~0.028 FIS>0 Gpg en Mangrove de Guinée Dubreka Ne~1000 m~0.005 Fotoba Ne~40 m~0.014 Goulot d'étranglement il y a 276 générations (bauxite, 47 ans) Ne~ Kassa North Ne~30 m~0.027 Kassa South Ne~8 m~0.11 +Effets Wahlund probables
132
Gpg dans les Nyayes, Sénégal
FIS~0 si pb techniques exclus
133
Gpg dans les Nyayes, Sénégal
Goulot d'étranglement il y a entre 3 et 115 générations =25 ans=175 générations FST=10Mouhoun/260 km FST=2Loos/Continent FST~palpalis/gambiensis Efficacité des mâles stériles?
134
Gt et Gpg entre différents bassins: Comoe, Mouhoun, Sissili et Niger
FSite/Basin=0.026 (P-value=0.001) Gt FIS~0, sauf pb techniques Loos G. p. g. G. p. p. Gpg FTrap/Site=0.0117, P-value=0.033 FSite/Basin=0.0379, P-value=0.001 FIS>0, pb techniques+Wahlund?
135
Gt et Gpg entre différents bassins: Comoe, Mouhoun, Sissili et Niger
De≈26 Gt/km² Gt ♀, m~0.001 ♂, m~ σ~454 m Loos G. p. g. G. p. p. Isolement par la distance sans rôle particulier des bassins Gpg De≈ Gpg/km² σ=12-16 m (40moins que Gt)
136
Gpg dans la forêt sacrée de Bama, Burkina-Faso
Ne Balloux: 17 Bartley: 30
137
Perspectives Meilleurs marqueurs
138
Crédits/Collaborations/Publications
De Meeûs T., McCoy K.D., Prugnolle F., Chevillon C., Durand P., Hurtrez-Boussès S. & Renaud F Population genetics and molecular epidemiology or how to "débusquer la bête". Infection Genetics and Evolution 7: De Meeûs T. & Goudet J A step by step tutorial to use HierFstat to analyse populations hierarchically structured at multiple levels. Infection Genetics and Evolution 7: De Meeûs T. & McCoy K La génétique des populations comme outil en épidémiologie. In Introduction à l'Epidémiologie Intégrative des Maladies Infectieuses et Parasitaires (Guégan J.F. & Choisy M. Eds.), De Boek Université, Bruxelles, pp Hedrick, P.W., 2005, Genetics of Populations, Third Edition. Jones and Bartlett Publishers, Sudbury, Massachusetts, 737 p
139
Collaborations/Publications
De Meeûs T., Beati L., Delaye C., Aeschlimann A. and Renaud F Sex biased genetic structure in the vector of Lyme disease, Ixodes ricinus. Evolution 56: 1802–1807. De Meeûs T., Lorimier Y. and Renaud F Lyme borreliosis agents and the genetics and sex of their vector, Ixodes ricinus. Microbes and Infection 6: De Meeûs T., Humair P.F., Delaye C., Grunau C. and Renaud F Non-Mendelian transmission of alleles at microsatellite loci: an example in Ixodes ricinus, the vector of Lyme disease. International Journal for Parasitology 34: Kempf F., De Meeûs T., Arnathau C., Degeilh B. and McCoy K.D Assortative Pairing in Ixodes ricinus L. (Acari:Ixodidae), the European Vector of Lyme Borreliosis. Journal of Medical Entomology 46: Kempf F., McCoy K.D. & De Meeus T Wahlund effects and sex-biased dispersal in Ixodes ricinus, the European vector of Lyme borreliosis: new tools for old data. Infection Genetics and Evolution 10: Kempf F.*, De Meeûs T*, Vaumourin E., Noel V., Taragel’ová V., Plantard O., Heylen D.J.A., Eyraud C., Chevillon C. and McCoy K.D Host races in Ixodes ricinus, the European vector of Lyme borreliosis. Infection Genetics and Evolution In press.
140
Collaborations/Publications
Bouyer, J., Ravel, S., Dujardin, J.P., De Meeûs, T., Vial, L., Thévenon, S., Guerrini, L., Sidibe, I., Solano, P., Population structuring of Glossina palpalis gambiensis (Diptera: Glossinidae) according to landscape fragmentation in the Mouhoun river, Burkina Faso. J. Med. Entomol. 44, Bouyer, J., Balenghien, T., Ravel, S., Vial, L., Sidibé, I., Thévenon, S., Solano, P., De Meeûs, T., Population sizes and dispersal pattern of tsetse flies: rolling on the river? Mol. Ecol. 18, Bouyer, J., Ravel, S., Guerrini, L., Dujardin, J.P., Sidibé, I., Vreysen, M.J.B., Solano, P., De Meeûs, T., Population structure of Glossina palpalis gambiensis (Diptera: Glossinidae) between river basins in Burkina-Faso: consequences for area-wide integrated pest management. Infect. Genet. Evol. 10. Camara, M., Caro-Riano, H., Ravel, S., Dujardin, J.P., Hervouet, J.P., De Meeûs, T., Kagbadouno, M.S., Bouyer, J., Solano, P., Genetic and morphometric evidence for population isolation of Glossina palpalis gambiensis (Diptera : Glossinidae) on the Loos islands, Guinea. J. Med. Entomol. 43, Kone, N., De Meeûs, T., Bouyer, J., Ravel, S., Guerrini, L., N’Goran, E.K., Vial, L., Population structuring of the tsetse Glossina tachinoides resulting from landscape fragmentation in the Mouhoun River Basin, Burkina Faso. Med. Vet. Entomol. 24, Ravel, S., De Meeûs, T., Dujardin, J.P., Zeze, D.G., Gooding, R.H., Dusfour, I., Sane, B., Cuny, G., Solano, P., The tsetse fly Glossina palpalis palpalis is composed of several genetically differentiated small populations in the sleeping sickness focus of Bonon, Côte d'Ivoire. Infect. Genet. Evol. 7, Solano, P., Ravel, S., Bouyer, J., Camara, M., Kagbadouno, M.S., Dyer, N., Gardes, L., Herault, D., Donnelly, M.J., De Meeûs, T., The population structure of Glossina palpalis gambiensis from island and continental locations in coastal Guinea. PLoS Negl. Trop. Dis. 3, e392. Solano, P., Ravel, S., De Meeûs, T., How can tsetse population genetics contribute to African trypanosomiasis control? Trends Parasitol. 26, Solano P., Kaba D., Ravel S., Dyer N.A., Sall B., Vreysen M.J.B., Seck M.T., Darbyshir H., Gardes L., Donnelly M.J., De Meeûs T. & Bouyer J Population genetics as a tool to select tsetse control strategies: suppression or eradication of Glossina palpalis gambiensis in the Niayes of Senegal. PLoS Negl. Trop. Dis. 4, e69. Koné N., Bouyer J., Ravel S., Vreysen M.J.B., Domagni K.T., Causse S., Solano P., De Meeûs T Contrasting population structures of two vectors of African trypanosomoses in Burkina Faso: consequences for control. PLoS Neglected Tropical Diseases 5 (6): e1217.
141
Merci
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.