des populations naturelles de vecteurs:

Slides:



Advertisements
Présentations similaires
Introduction à l’analyse
Advertisements

France Journées de l’Afef – 1er octobre 2010
Recherche de motifs par méthodes exploratoires: Comparaisons de performances et statistiques sur le score.
Introduction : Matériel & méthodes :
Localisation fine de QTL par déséquilibre de liaison Simon BOITARD Durée : octobre 2003-septembre 2006 Laboratoire : BIA (biométrie et intelligence artificielle)
Génétique Médicale L3 Hérédité mendélienne
Inférence statistique
Tests de comparaison de pourcentages
Matrices.
POLYMORPHISME GENETIQUE
Cours 4.
Atelier de génétique des populations empirique
Simuler une population à échantillonner et évaluer les meilleures stratégies pour faire évoluer et compléter un dispositif existant afin de gagner en précision.
Travail de génétique G9 :
BIO1130 LAB 4 MICROÉVOLUTION.
Génétique adaptative des pathogènes
QTLmap et les données ayant une distribution non gaussienne
Compléments sur la sélection naturelle et sur la variation
Application des algorithmes génétiques
Analyse génétique des asques
Laboratoire de recherches et de coordination sur les Trypanosomoses,
Genotypic data: concepts and meanings
Travail paraclinique Gén-Hyg-Expl
La coévolution Définition
Effects of different mating designs on inbreeding, genetic variance and response to selection when applying individual selection in fish breeding programs.
Responsables P. Maury & R. Babilé
O. Distl, R. Herrmann, J Utz, K. Doll, E. Rosenberger
7.FORMATION 7d. Point sur la rentrée 2012/2013 des CFA conventionnés avec le CCCA-BTP.
Description génétique de deux lignées de lapins sélectionnés
L’utilisation des informations du pedigree pour gérer la variabilité génétique d’une population en danger : L’élevage du mouton Xalda en Asturies en est.
NOTION DE METAPOPULATION
1.Un rang de données multicolores 2. Deux permutations des n premiers entiers 3. b permutations des k premiers entiers 4. Choix de n points dans [0,1]
Recombination and the Nature of Bacterial Speciation
Matthieu Foll 28 aout 2008 Journées MAS
The conservation role of captive African wild dogs (Lycaon pictus)
Etude de la variation génétique du cheval polonais Bilgoraj
CHAPITRE 19 - La génétique des populations
La variation due aux mutations
Les modèles linéaires (Generalized Linear Models, GLM)
Corrélation Principe fondamental d’une analyse de corrélation
LA LOI DE HARDY-WEINBERG ET LA MICROÉVOLUTION
Dispersion de gènes et structures génétiques spatiales
Le phénotype est déterminé par le génotype.
1 La détection de gènes impliqués dans les maladies multifactorielles Marie-Pierre Etienne ENGREF Laboratoire GRESE Statistique et Génome.
Travaux pratiques Hygiène-Génétique- Biostatistique:
Nouveautés en matière de statistiques au SPP IS. Introduction SIG: système dinformation géographique Suivi des activations Clustering Statistiques internationales.
« Geographical genetics » Epperson 2003
Génétique et Evolution des Maladies Infectieuses (GEMI)
Campus International de Baillarguet,
Thierry de Meeûs Centre International de Recherche-Développement sur lElevage en zone Subhumide (CIRDES), N559, rue 5.31, 01 BP 454, Bobo-Dioulasso 01,
Cours 2.
La syndactylie chez la Holstein allemande
1 - Programme de Seconde (juin 2009) Statistique et probabilités
On cherche des renseignements sur p.
LA LOI DE HARDY-WEINBERG ET LA MICROÉVOLUTION
"POLYMORPHISME" Plusieurs Formes
Méthode d’estimation de la parenté en population naturelle (revue bibliographique) Frédéric Austerlitz 20 juin 2003.
Thème 1 LA TERRE DANS L’UNIVERS, LA VIE ET L’EVOLUTION DU VIVANT
Caswell 2001 Sinauer Associates
Loi de Hardy-Weinberg Base de la Génétique des Populations
Génétique des populations La loi de Hardy-Weinberg
Les Recombinaisons et leurs conséquences sur la descendance
Travail de génétique 2°Doc Doppagne M.L. Evrard L. Peduzzi F. Schoenars P.
La diversité génétique et les tests d’assignation sur 7 races bovines françaises basés sur l’analyse d’ADN microsatellite.
LA LOI DE HARDY-WEINBERG ET LA MICROÉVOLUTION
La génétique et la biométrie
MODULE FTH 2007 Diversité génétique
Stabilité et Variabilité des génomes et Evolution
Génétique des populations La loi de Hardy-Weinberg
Matrices.
Transcription de la présentation:

des populations naturelles de vecteurs: Cours de génétique des populations naturelles de vecteurs: théorie, empirisme et inférences Master International d'Entomologie Médicale et Vétérinaire Bobo-Dioulasso, Novembre 2011 Thierry de Meeûs UMR 177 IRD-CIRAD "INTERTRYP" WHO Collaborating Center for research on host/vector/parasite interactions for surveillance and control of Human African Trypanosomiasis Centre International de Recherche-Développement sur l’Elevage en zone Subhumide (CIRDES), N559, rue 5.31, 01 BP 454, Bobo-Dioulasso 01, Burkina-Faso. E-mail: thierry.demeeus@ird.fr http://gemi.mpl.ird.fr/SiteSGASS/SiteTDM/EnseignMeeus.html

Introduction

Méthodes directes Méthodes indirectes

Structure d'une Population Taille des Unités de Reproduction Migration

Détection de la variation génétique Marqueurs cytpolasmiques ♀ ♂

Détection de la variation génétique Marqueurs nucléaires AA Aa aa Marqueurs dominants [A] [a] RAPD (Randomly Amplified Polymorphic DNA) ATGCAC TACGTG TCATGA AGTACT Amorces PCR aléatoires ATGATC TACTAG AATCTG TTAGTA Présence ou absence d'amplification=>marqueur dominant Maladies génétiques récessives

Détection de la variation génétique: marqueurs codominants A1A1 A1A2 A2A2 Microsatellites Primer1 CTCTCTCT AGAGAGAG Primer2 mRNA Primer1 CTCTCTCTCT AGAGAGAGAG AUGCAGCCAUAGGCG Primer2 PCR Enzymes Phe-Pro-Leu-Ileu-Val + + - - Electrophorèse RFLP, MLST, SNP… Hypothèse importante pour les inférences=Neutralité

Bases théoriques

La population unité de base de l'écologie une notion démographique Un groupe d'individus partagent les mêmes paramètres démographiques Population 1 Population 2 Population 3 Population 4 N1 N2 N3 N4 Multiplication et migration Régulation N1 N2 N3 N4 Taille constante des populations

Le modèle de Hardy-Weinberg Une seule population Taille de la population N=∞ Reproduction sexuée panmictique Pas de mutation Pas de migration Pas de sélection Générations discrètes Hardy G.H. (GB) et Weinberg W. (D) (1908)

sous l'hypothèse panmictique Proportions de Hardy-Weinberg Tableau des gamètes et des zygotes formés sous l'hypothèse panmictique p q pp pq qp qq ♀ + ♂ - f( ) = = p + f( ) = q=1-p f( ) = p² ; f( ) = 2pq ; f( ) = q²

ft(A)=pt, ft(a)=qt=1-pt Equilibre de Hardy-Weinberg Aa Ht aa Rt AA Dt ft(A)=pt, ft(a)=qt=1-pt Panmixie (hermaphrodites) Taille de population N~∞ Migration m=0 Mutation u=0 Pas de sélection Générations discrètes En une génération

ft(A)=pt, ft(B)=qt , ft(C)=rt=1-pt-qt Equilibre de Hardy-Weinberg avec trois allèles AA At AB Bt AC Ct BB Dt BC Et CC Jt ft(A)=pt, ft(B)=qt , ft(C)=rt=1-pt-qt En une génération

Equilibre de Hardy-Weinberg avec Dominance AA Aa aa Rt Dt ft(A)=pt, ft(a)=qt=1-pt Si on fait l'hypothèse que Rt=qt² Hypothèse: la population vérifie des proportions panmictiques: hypothèse (très) forte

Equilibre de Hardy-Weinberg quand N petit: la dérive Ft: probabilité de tirer deux allèles identiques par ascendance dans la population à la génération t ils étaient déjà identiques à la génération t ils deviennent identiques à la génération t+1 Diversité génétique

Equilibre de Hardy-Weinberg quand N petit: la dérive Ft: probabilité de tirer deux allèles identiques par ascendance dans la population à la génération t

Equilibre de Hardy-Weinberg quand N petit: la dérive Plecoptera Panmixie, Migration m=0, Mutation u=0, Pas de sélection

Effectif efficace Une population focale Pf Une population idéale Pi Taille de la population Nc Reproduction sexuée panmictique Pas de mutation Pas de migration Pas de sélection Une population idéale Pi Taille de la population Ne Reproduction sexuée panmictique Pas de mutation Pas de migration Pas de sélection

Effectif efficace Population idéale (Pi) de taille Ne (effectif efficace): Idéale=panmictique, sans mutation ni migration ni sélection (mais de taille limitée Ne) Population focale (Pf) de taille Nc (census=recensement) Effectif efficace de consanguinité (inbreeding): Evolution de la consanguinité de Pf = Evolution de la consanguinité de Pi Effectif efficace de variance: Variance des fréquences alléliques identiques entre Pf et Pi d'une génération à l'autre Effectif efficace de valeur propre: Evolution de l'hétérozygotie identique entre Pf et Pi Effectif efficace de coalescence: Temps de coalescence identique entre Pf et Pi (coalescence=premier ancêtre commun entre deux gènes pris au hasard)

Temps moyen de coalescence =(11+12+23+34+15+16)/9≈4 Temps moyen de coalescence =(11+12+23+34+15+16)/9≈4

Effectif efficace Population idéale (Pi) de taille Ne (effectif efficace): Idéale=panmictique, sans mutation ni migration ni sélection Population focale (Pf) de taille Nc (census=recensement) Effectif efficace de consanguinité (inbreeding): Evolution de la consanguinité de Pf = Evolution de la consanguinité de Pi Effectif efficace de variance: Variance des fréquences alléliques identiques entre Pf et Pi d'une génération à l'autre Effectif efficace de valeur propre: Evolution de l'hétérozygotie identique entre Pf et Pi Effectif efficace de coalescence: Temps de coalescence identique entre Pf et Pi (coalescence=premier ancêtre commun entre deux gènes pris au hasard) En principes tous identiques mais pas toujours

Effectif efficace d'une population dioïque Chez des monoïques, la probabilité de tirer deux fois le même allèle par hasard est τe=1/2N Quelle probabilité τd chez des dioïques, avec N=Nf+Nm et accouplements aléatoires (pangamie)? Si même grand mère Si même grand père

Effectif efficace d'une population dioïque Chez des monoïques, la probabilité de tirer deux fois le même allèle par hasard est τe=1/2N Quelle probabilité τd chez des dioïques, avec N=Nf+Nm et accouplements aléatoires (pangamie)? Si même grand mère Si même grand père

Effectif efficace d'une population dioïque Chez des monoïques, la probabilité de tirer deux fois le même allèle par hasard est τe=1/2N Quelle probabilité τd chez des dioïques, avec N=Nf+Nm et accouplements aléatoires (pangamie)? Si même grand mère Si même grand père

Effectif efficace d'une population dioïque Chez des monoïques, la probabilité de tirer deux fois le même allèle par hasard est τe=1/2N Quelle probabilité τd chez des dioïques, avec N=Nf+Nm et accouplements aléatoires (pangamie)? On cherche Ne tel que τd=τe Si Nf=99 et Nm=1 alors Ne=3.96~4

Effectif efficace d'une population dioïque Tailles de populations réduites Balloux Sex ratio équilibré

Pour plus d’un locus: les désequilibres de liaison Deux loci 1 et 2 Locus 1 Locus 2 11 12 22 11 12 22 D1 H1 R1 D2 H2 R2 1→p1 1→p2 Gamètes ou haplotypes 1_1: p1_1=p1p2+Dt 1_2: p1_2=p1(1-p2)-Dt 2_1: p2_1=(1-p1)p2-Dt 2_2: p2_2=(1-p1)(1-p2)+Dt Dt=p1_1-p1p2 Au maximum D=[-0.25,+0.25] e.g. quand p1_2 et p2_1=0.5, ou quand p1_1 et p2_2=0.5

Désequilibres de liaison maximaux Deux loci 1 et 2 Locus 1 Locus 2 11 12 22 11 12 22 D1 H1 R1 D2 H2 R2 1→p1 1→p2 Gamètes ou haplotypes 1_1: p1_1=p1p2+Dt 1_2: p1_2=p1(1-p2)-Dt 2_1: p2_1=(1-p1)p2-Dt 2_2: p2_2=(1-p1)(1-p2)+Dt Dt=p1_1-p1p2 Quand p1_2 et p2_1=0.5, alors p1_1=0 et donc D=-p1p2 donc 0.5=p1(1-p2)+p1p2p1=0.5 et 0.5=p2(1-p1)+p1p2p2=0.5 et donc D=-0.25 De la même façon, quand p1_1 et p2_2=0.5 on obtient D=0.25

Désequilibres de liaison maximums quand p1 et/ou p2≠0.5 Deux loci 1 et 2 Locus 1 Locus 2 Gamètes p1_1=p1p2+Dt p1_2=p1(1-p2)-Dt p2_1=(1-p1)p2-Dt p2_2=(1-p1)(1-p2)+Dt 11 12 22 11 12 22 D1 H1 R1 D2 H2 R2 1→p1 1→p2 Dmax alors P1_2=0 ou p2_1=0, P1_2 et P2_1 devant être ≥0 Dmin alors P1_1=0 ou p2_2=0, P1_1 et P2_2 devant être ≥0

Pour plus d’un locus: les désequilibres de liaison Deux loci 1 et 2 Locus 1 Locus 2 Gamètes p1_1=p1p2+Dt p1_2=p1(1-p2)-Dt p2_1=(1-p1)p2-Dt p2_2=(1-p1)(1-p2)+Dt 11 12 22 11 12 22 D1 H1 R1 D2 H2 R2 1→p1 1→p2 Si le taux de recombinaison est r et la reproduction panmictique

Pour plus d’un locus: les déséquilibres de liaison Deux loci 1 et 2 Locus 1 Locus 2 Gamètes p1_1=p1p2+Dt p1_2=p1(1-p2)-Dt p2_1=(1-p1)p2-Dt p2_2=(1-p1)(1-p2)+Dt 11 12 22 11 12 22 D1 H1 R1 D2 H2 R2 1→p1 1→p2 Si le taux de recombinaison est r et la reproduction panmictique N grand

Pour plus d’un locus: les désequilibres de liaison Quelles forces évolutives génèrent et/ou maintiennent du déséquilibre de liaison? Toutes: mutation, dérive, système de reproduction, sélection, migration et bien sûr le degré de liaison

Fin du premier cours

Altérations des proportions de Hardy Weinberg Déficits en hétérozygotes Taenia solium Nasonia vitripenis Endogamies Sousdominance Effet Wahlund Rh-Rh- Rh+Rh- Homogamie Causes techniques Allèles nuls Dominance des allèles courts Allelic dropout Stuttering

Autofécondation A 1/2 a A 1/2 AA 1/4 Aa a 1/2 aa AA Aa aa Dt Ht Rt s: autofécondation 1-s: panmixie Taille de population, N grand Taux de mutation u=0 Taux de migration m=0 A 1/2 a A 1/2 AA 1/4 Aa a 1/2 aa

Autofécondation AA Aa aa Dt Ht Rt

Autofécondation AA Aa aa Dt Ht Rt

A l’équilibre, Ht=Ht+1=Heq Autofécondation AA Aa aa Dt Ht Rt A l’équilibre, Ht=Ht+1=Heq

A l’équilibre, Ht=Ht+1=Heq Autofécondation AA Aa aa Dt Ht Rt A l’équilibre, Ht=Ht+1=Heq

A l’équilibre, Ht=Ht+1=Heq Autofécondation AA Aa aa Dt Ht Rt A l’équilibre, Ht=Ht+1=Heq

A l’équilibre, Ht=Ht+1=Heq Formule généralisée de Wright Autofécondation AA Aa aa Dt Ht Rt A l’équilibre, Ht=Ht+1=Heq Formule généralisée de Wright

Endogamies Tous les loci Pour les loci concernés 0.1 0.2 0.3 0.4 0.5 0.1 0.2 0.3 0.4 0.5 10 20 30 40 50 t H Autofécondation 100% ou homogamie codominante Croisements frère/soeur 100 % Homogamie 100% (p=0.5) Homogamie 100% (p=0.25) Homogamie 100% (p=0.75) Pour les loci concernés dominante

Effet Wahlund

Effet Wahlund

Effet Wahlund

Effet Wahlund F=0 si p1=p2

fNpt²+ 2pt(1-pt)(1-s)fN+ fN(1-pt)² Sousdominance Panmixie, grande population de taille N, pas de mutation ni de migration, fécondité de f (>1) 2 allèles, A et a de fréquence pt et 1-pt à la génération t AA Aa aa Fitness 1 1-s Zygotes fNpt² 2pt(1-pt)(1-s)fN fN(1-pt)² Régulation fNpt²+ 2pt(1-pt)(1-s)fN+ fN(1-pt)² Fréquences t+1 Fitness moyenne

2 allèles, A et a de fréquence pt et 1-pt à la génération t Sousdominance 2 allèles, A et a de fréquence pt et 1-pt à la génération t AA Aa aa Fitness 1 1-s Fréquences t+1

Sousdominance 2 allèles, A et a de fréquence pt et 1-pt à la génération t Equilibre quand les fréquences ne bougent plus i.e. quand Δp=pt+1- pt=0 =A2*(1-A2)*(2*A2-1)

Altérations des proportions de Hardy Weinberg Excès d'hétérozygotes Superdominance Hétérogamie Anémie falciforme et Plasmodium falciparum HLA Clonalité Candida albicans Trypanosoma brucei Biais de dispersion sexe spécifique Ixodes ricinus Hétérosis Schistosoma Bandes echo Loci dupliqués

fNpt²(1-s)+ 2pt(1-pt)fN+ fN(1-pt)²(1-s) Superdominance Panmixie, grande population de taille N, pas de mutation ni de migration, fécondité de f (>1) 2 allèles, A et a de fréquence pt et 1-pt à la génération t AA Aa aa Fitness 1-s 1 Zygotes fNpt²(1-s) 2pt(1-pt) fN fN(1-pt)²(1-s) Régulation fNpt²(1-s)+ 2pt(1-pt)fN+ fN(1-pt)²(1-s) Fréquences t+1

valeur sélective moyenne de la population Superdominance 2 allèles, A et a de fréquence pt et 1-pt à la génération t AA Aa aa Fitness 1-s 1 Fréquences t+1 valeur sélective moyenne de la population

2 allèles, A et a de fréquence pt et 1-pt à la génération t Superdominance 2 allèles, A et a de fréquence pt et 1-pt à la génération t s<1 =A2*(1-A2)*(1-2*A2)

Superdominance Fardeau génétique

Donc l’équilibre est atteint quand ABeq=ACeq=BCeq=1/3 Hétérogamie AB AC BC ABt ACt BCt Donc l’équilibre est atteint quand ABeq=ACeq=BCeq=1/3

Hétérogamie Allèle D? AB AC BC ABt ACt BCt

Clonalité Pas de mutation ni de migration, grande population, pas de sélection proportion c investie en reproduction clonale et 1-c en panmixie AA Aa aa Dt Ht Rt A l’équilibre Ht=Ht+1=Heq et donc: Convergence vers HW mais forts désequilibres de liaison attendus

Clonalité +Dérive +Mutation AA Aa aa Dt Ht Rt Aa Heq~1

F statistiques de Wright AA Aa aa Do Ho Ro H: probabilité de tirer deux allèles différents, dans un individu d’une sous-population (HI) dans deux individus de la même sous-population (HS)

Modèle en îles de Wright

F-statistiques de Wright cas général: plus de deux allèles, n quelconque H: probabilité de tirer deux allèles différents, dans un individu d’une sous-population (HI) dans deux individus de la même sous-population (HS) dans deux sous-populations différentes du total (HT)

F-statistiques de Wright cas général: plus de deux allèles (K>>2), n quelconque H: probabilité de tirer deux allèles différents, dans un individu d’une sous-population (HI) dans deux individus de la même sous-population (HS) dans deux sous-populations différentes du total (HT) Q=1-H: probabilité de tirer deux allèles identiques, dans un individu QI, dans deux individus de la même sous-population QS et dans deux sous-populations différentes QT HI: Hétérozygotie moyenne observée HS: Diversité génétique des sous-populations HT: Diversité génétique totale Nei

F-statistiques de Wright cas général: plus de deux allèles, n quelconque Chesser & Nei (1-FIT)=(1-FIS)(1-FST) Weir Rousset

Les F-Statistiques de Wright FIT FIS F IS l

Les F-Statistics de Wright FIT FIS Taille de sous-échantillons Ns=1 Estimations RAPPEL: Variance: s² = [1/n].Si[(xi-x)²] ; s² = [1/(n-1)].Si[(xi-x)²] Estimateurs f et θ de Weir & Cockerham F IS l

Estimateurs des F de Wright pour K allèles noté de A=1 à K Weir & Cockerham non biaisés variance d’estimation forte Robertson & Hill biaisés variance d’estimation faible (meilleure « statistique ») FIS FST FIT

F-statistiques pour plus de trois niveaux hiérarchiques >>0 ~0 ~0 ~0 FSA FAT Yang

Fin du deuxième cours

Inférences

Les F-Statistiques de Wright Inférences Autofécondation AA Aa aa Dt Ht Rt A l’équilibre, Ht=Ht+1=Heq Formule généralisée de Wright

Les F-Statistiques de Wright: Inférences Croisements frères-soeurs Apparentement φ Consanguinité F ♀ ♂ φt-2 Ft-2 φt-1 Ft-1=φt-2 Evolution de la consanguinité F: différents petits enfants possibles en fonction des gènes présents chez leurs deux grands parents. φt Ft=φt-1 Même grand-mère Même grand-parent Même grand-père Grands-parents différents

Les F-Statistiques de Wright: Inférences Croisements frères-soeurs Même grand-mère Même grand-parent Même grand-père Grands-parents différents P(même grand-parent)=Pmgp=1/2 P(pas même grand-parent)=Ppmgp=1/2 P(retrouver 2 fois le même gène d'un même grand parent)=P2mgp=4/8=1/2 P(prendre les deux gène différents d'un même grand-parent)=P2dmgp=1/2 P(les 2 gènes d'un grand-parent sont identiques par ascendance )=P2dId/mgp=Ft-2 P(gènes identiques/même grands-parents)=PId/mgp=Pmgp(P2mgp+P2dmgpP2dId/mgp)=1/2(1/2+1/2Ft-2) P(gènes identiques/pas même grands-parents)=PId/pmgp=Ppmgpφt-2=1/2Ft-1 Par conséquent Ft=1/2(1/2+1/2Ft-2)+1/2Ft-1

Les F-Statistiques de Wright: Inférences Croisements frères-soeurs Ft=1/2(1/2+1/2Ft-2)+1/2Ft-1 Taux de croisements frères–soeurs = b alors la perte en hétérozygotie à la génération t sera de: Ft=b[1/2(1/2+1/2Ft-2)+1/2Ft-1]+(1-b)0 Ft=(b/2)[1/2+1/2Ft-2+Ft-1]=(b/4)(1+Ft-2+2Ft-1) A l'équilibre Ft=Ft-1=Ft-2=FIS FIS=(b/4)(1+FIS+2FIS) et donc

Les F-Statistiques de Wright Inférences Modèle en îles de Wright, n grand, m et u petit, K grand: QT~0 panmixie locale: QI=QS

Les F-Statistiques de Wright Inférences Modèle en îles de Wright, n grand, m et u petit, K grand: QT~0 panmixie locale: QI=QS A l’équilibre migration/mutation/dérive

Les F-Statistiques de Wright Inférences Modèle en îles de Wright, n grand, m et u petit, K grand: QT~0 panmixie locale: QI=QS A l’équilibre migration/mutation/dérive

Les F-Statistiques de Wright Inférences Modèle en îles de Wright, n grand, m et u petit, K grand: QT~0 panmixie locale: QI=QS A l’équilibre migration/mutation/dérive On néglige les termes en m², u² et mu devant 1

Les F-Statistiques de Wright Inférences Modèle en îles de Wright, n grand, m et u petit, K grand: QT~0 panmixie locale: QI=QS A l’équilibre migration/mutation/dérive On néglige les termes en m², u² et mu devant 1

Les F-Statistiques de Wright Inférences Modèle en îles de Wright, n grand, m et u petit, K grand: QT~0 panmixie locale: QI=QS A l’équilibre migration/mutation/dérive

Les F-Statistiques de Wright Inférences Modèle en îles de Wright, n grand, m et u petit, K grand: QT~0 panmixie locale: QI=QS A l’équilibre migration/mutation/dérive On néglige les termes en m², u² et mu On néglige les termes en m et u devant 1

Les F-Statistiques de Wright Inférences Modèle en îles de Wright, n grand, m et u petit, K grand: QT~0 panmixie locale: QI=QS; FST=QS A l’équilibre migration/mutation/dérive si u<<m FST_max si m=0 FST_max ≈QS=1-HS FST’ =FST/FST_max

Les F-Statistiques de Wright Modèle en îles fini (n petit), avec homoplasie (K petit) et une proportion s d’autofécondation locale

Les F-Statistiques de Wright Autres modèles de populations Stepping stone (en pas Japonais) et Voisinage 1 D 3 D 2 D

Les F-Statistiques de Wright Autres modèles de populations Stepping stone (en pas Japonais) et Voisinage 2 D 1 D

Stepping stone (en pas Japonais) et Voisinage Rousset 2 D 1 D Pente b De: Densité efficace d’individus (/m ou /m²) σ: distance entre adultes reproducteurs et leurs parents

Estimations d’effectifs efficaces Différenciation génétiques entre échantillons séparés dans le temps Ne: Waples Dans l’espace et le temps Ne et m: Wang & Whitlock Déséquilibres de liaisons Ne: Bartley et al., Waples & Do Excès d’hétérozygotes (dioïques ou autoincompatibles) Ne: Balloux Déséquilibres inter et intra loci sur données spatiales Ne et m: Vitalis & Couvet

Procédures statistiques

Procédures statistiques: définitions On recherche avec quelle probabilité, appelée P-value, le hasard permet d'expliquer nos données si ces dernières suivent l'hypothèse nulle H0. Le test, défini a priori, peut être: -bilatéral: dans ce cas l'hypothèse alternative H1 est que les valeurs observées sont trop extrêmes pour être expliquées par le hasard; -unilatéral "plus grand": dans ce cas H1 est que les valeurs observées sont plus grandes qu'attendue par hasard sous H0; -unilatéral "moins grand": dans ce cas H1 est que les observations ont des valeurs plus petites qu'attendues sous H0. Par convention on a choisi arbitrairement la limite 0.05 pour la P-value seuil au dessous de laquelle un test est dit significatif. Mais, selon les circonstances ont peut choisir d'être plus ou moins sévère. La décision statistique ne dépend que du manipulateur. Erreur de première espèce, α: probabilité de se tromper en rejetant H0 (P-value); Erreur de seconde espèce, β: probabilité de se tromper en acceptant l'hypothèse nulle. Un test est puissant si on rejette facilement H0; Un test est robuste s'il ne rejette pas trop souvent H0.

Procédures statistiques Calculs d’intervalles de confiance (IC) des F-statistiques Bootstrap (e.g. sur les loci): on rééchantillonne aléatoirement k fois (e.g. 5000) avec remise. On peut donc tirer plusieurs fois le même item (e.g. locus) et on calcule F à chaque tirage.

Procédures statistiques Calculs d’intervalles de confiance (IC) des F-statistiques Jackknife (e.g. sur les sous-échantillons): on retire un item à la fois (e.g. un sous-échantillon) et on recalcule F sur ceux qui restent. On obtient autant de valeurs qu’il y a d’items dont on tire une moyenne et une variance pour F qui sert au calcul d’une erreur standard du F. Sous l’hypothèse de normalité on peut estimer un IC qui correspond à F±StdErr(F)tα,γ, où t se trouve dans une table du t, où α correspond au seuil désiré (0.05 pour un CI à 95%, 0.01 pour 99%) et γ au degré de liberté (i.e. nombre d’items-1)

Procédures statistiques: IC 95% du Jackknife Table du t n-1 t(α=0.05) 1 12.706 21 2.08 45 2.014 2 4.303 22 2.074 50 2.009 3 3.182 23 2.069 55 2.004 4 2.776 24 2.064 60 5 2.571 25 2.06 65 1.997 6 2.447 26 2.056 70 1.994 7 2.365 27 2.052 80 1.99 8 2.306 28 2.048 90 1.987 9 2.262 29 2.045 100 1.984 10 2.228 30 2.042 110 1.982 11 2.201 31 2.04 120 1.98 12 2.179 32 2.037 130 1.978 13 2.16 33 2.035 140 1.977 14 2.145 34 2.032 150 1.976 15 2.131 35 2.03 200 1.972 16 2.12 36 2.028 250 1.97 17 2.11 37 2.026 300 1.968 18 2.101 38 2.024 400 1.966 19 2.093 39 2.023 500 1.965 20 2.086 40 2.021 1000 1.962 FIS=0.2 10 loci StdErr(FIS)=0.01 l’IC 95% sera 0.2-2.2620.01 et 0.2+2.2620.01 soit 95% IC=[0.177, 0.223]

Procédures statistiques Tests de significativité par randomisation Tests de randomisations: Simuler H0 un très grand nombre de fois; la P-value du test = la proportion des valeurs simulées qui sont aussi extrêmes ou plus extrêmes que celle observée dans l’échantillon Il est important de bien appréhender ce qu’il y a derrière H0 et H1: que cherche-t-on à tester exactement? Nombre de randomisations: 10000 si permutations, au moin 1 000 000 si chaine de Markhov

Procédures statistiques Tests de significativité des F par randomisation Significativité du FIS = tester la panmixie locale Tester si FIS > 0 P-value P1 ou < 0 P-value P2 ou ≠ 0 P-value P3 FIS FIS ≠ 0 (bilatéral) P3=min(P1,P2)+[1-max(P1,P2)] Utilisation d’autres estimateurs (Robertson & Hill) comme statistique Tests exacts de Haldane (pas de test global sur les sous-échantillons et loci)

Procédures statistiques Tests de significativité des F par randomisation Tester si FST > 0 FST

Procédures statistiques Tester si la répartition des génotypes est aléatoire à l’aide de la statistique G H0: le G observé n’est pas plus grand que ceux générés par permutation aléatoire des individus entre sous-échantillons Statistique G: logarithme du rapport de maximum de vraisemblance des fréquences alléliques dans les différents sous-échantillons. Propriété additive du G permet de tester globalement sur les loci

Procédures statistiques Tester la significativité d’une corrélation entre deux matrices de distances tel que dans le cas d’un isolement par la distance Les cases sont auto-corrélées Test de Mantel: on permute les cases d’une des matrices et on recalcule la corrélation à chaque fois. La P-value=la proportion de corrélations randomisées aussi grandes ou plus grandes que l’observée Test assez conservateur

Procédures statistiques Déséquilibres de liaison Locus_ 2 11 12 13 14 22 23 24 33 34 44 n 11/11 11/12 11/13 11/14 … 12/11 12/12 12/13 12/14 13/11 13/12 13/13 13/14 14/11 14/12 14/13 14/14 15 15/11 15/12 15/13 15/14 etc… 25 35 45 55 Locus_ 1 Mesures multiLocus

Procédures statistiques Déséquilibres de liaison Les génotypes des loci (nous n’avons en général pas les haplotypes=la phase) sont réassociés un grand nombre de fois et une statistique mesurée à chaque fois. La P-value du test correspond à la proportion des valeurs randomisées supérieures ou égales à l’observée. Tests par paires de loci: Statistique utilisée: G permet un test sur l’ensemble des sous-populations mais par paire de loci=>autant de P-values que de paires de loci Tests multilocus: Statistique utilisée: rD par exemple permet un test sur l’ensemble des loci mais par sous-échantillon=>autant de P-values que de sous-échantillons Dans tous les cas il faudra tenir compte de cette répétition de tests

Procédures statistiques F-statistiques pour plus de trois niveaux hiérarchiques

Procédures statistiques Comparaison de groupes Champêtres Sylvestres S=FIS, FST, AIc, Ho, Hs etc… SObs=(SObs1-SObs2)²

Procédures statistiques Comparaison de catégories d’individus S=FIS, FST, AIc, Ho, Hs etc… Randomisation du statut en gardant le ratio local constant SObs=(SObs1-SObs2)²

Procédures statistiques Facteurs imbriqués et croisés Différenciation entre genres Différenciation géographique FST_2; P-value_2 FST_1; P-value_1 Procédure pour combiner ces tests multiples

Procédures pour combiner k tests P1, P2, P3, …Pk Quels tests sont significatifs? La série des k tests est-elle significative? Bonferroni sequentiel Pmink Pmin-1(k-1) etc.. Les P-values corrigées qui restent significatives désignent les tests qui les ont. Test hyper-conservateur à n’utiliser que sur les tests les plus puissants (gros échantillons les plus polymorphes) Tests non indépendants Test binomial exact Tests indépendants Procédure Z de Stouffer si k<4 Zi=LOI.NORMALE.INVERSE(Pi;0;1) P-value=LOI.NORMALE.STANDARD(Z) Au moins un test de la série est-il significatif? Procédure binomiale généralisée si k≥4 Procédure de Fisher

Analyses multivariées AFC ACP PC1 (48%inertia) P < 0.001 PC2 (21%inertia) P < 0.001 Mouette Guillemot Macareux Tests d’assignment Macareux – 95% Mouette – 82% Guillemot – 89% ACP des populations de tique

Exploration d’une structure cachée d’inférence de structure AFC Méthodes Bayésiennes d’inférence de structure de populations Structure BAPS Flock

Applications à deux cas concrets: La tique Ixodes ricinus en Europe du Nord Les mouches tsé-tsé en Afrique de l'Ouest

Génétique des populations d'Ixodes ricinus et borréliose de Lyme en Suisse B. burgdorferi B. valaisiana B. garinii B. afzelii B. Spielmanii

Absence de structuration et déficits en hétérozygotes Génétique des populations d'Ixodes ricinus et borréliose de Lyme en Suisse Allozymes α-GPD PGM Absence de structuration et déficits en hétérozygotes

Déficits en hétérozygotes pour les microsatellites 0.1 0.2 0.3 0.4 0.5 0.6 0.7 IR8 IR25 IR27 IR32 IR39 All f ( F is estimator) -1 -0.75 -0.5 -0.25 0.25 0.5 0.75 1 109 111 113 115 117 119 121 123 125 127 129 131 Allele size F is (partials) 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 111 113 115 117 119 121 123 125 127 129 131 Allele size F is pi's balanced pi's bell shaped pi's decreasing pi's increasing pi's randomised

 Distribution sexe spécifique du polymorphisme Biais de dispersion sexe spécifique des tiques  B. burgdorferi B. valaisiana B. garinii B. afzelii

Détection des Borrelia dans les tiques Pour Borrelia burgdorferi P =0.012 ss 0.08 0.07 B. burgdorferi 0.06 0.05 0.04 Prévalence of 0.03 0.02 F M Sex of the tick

Détection des borrélies dans les tiques Pour Borrelia afzelii Saines Infectées Saines Infectées 

Détection d'un effet Wahlund Utlisation du logiciel BAPS Clusters: FIS = 0.151, P-value ≤ 0.001. raw data FIS = 0.379, P-value ≤ 0.001. Wilcoxon signed-rank test, P-value = 0.032 => baisse de ~60%.

Détection d'un effet Wahlund Chez I. ricinus Chez I. uriae

Structure géographique Dσ²=1/(4π0.00577)=13.78 Méthode des déséquilibres de liaison de Bartley: Ne=268 (données brutes), Ne=596 (un individu ou une femelle et un mâle par cluster BAPS) S~0.2 km² Densités efficaces: De~1300 tiques/km² (données brute), De~3000 tiques/km² (données BAPS) Distance de dispersion entre adultes reproducteurs et leurs parents: σ~100 m/génération (données brutes), σ~60 m/génération (données BAPS) Une génération ~ 3 années

Détection de croisements entre apparentés Clusters: FIS = 0.151, P-value ≤ 0.001. raw data FIS = 0.379, P-value ≤ 0.001. Wilcoxon signed-rank test, P-value = 0.032 => baisse de ~60%.

Détection de croisements entre apparentés Printemps 2006 Moyenne Jackknife Tests de Mantel entre matrice d'apparentement entre individus et statut apparié 1 ou non apparié 0 P-value bilatérale Apparentements maximum possibles

Adults: roe deer, wild boar Races d'hôtes chez I. ricinus? 2002 Larvae: birds Nymphs: birds 2006 Larvae: birds, rodents Nymphs: birds 2006 Larvae: rodents 2007 Larvae: birds, lizard Nymphs: birds, lizard 2007 Larvae: birds Nymphs: birds, roe dear Adults: roe deer, wild boar 2003 Larvae: birds Nymphs: birds 2002 Larvae: birds Nymphs: birds 2007 Larvae: birds Nymphs: birds, roe dear Adults: roe deer 2004 Larvae: lizard Nymphs: lizard

Importance des infrapopulations FInfrapopulations/SubTotal=0.03 P-value (generalized binomial)=0.005 HS~0.75 FInfrapopulations/SubTotal'=0.03/(1-HS)=0.13

Adults: roe deer, wild boar Différenciation entre espèces hôtes en controllant pour l'infra-population 2002 Larvae: birds Nymphs: birds 2006 Larvae: birds, rodents Nymphs: birds 2006 Larvae: rodents 2007 Larvae: birds, lizard Nymphs: birds, lizard 2007 Larvae: birds Nymphs: birds, roe dear Adults: roe deer, wild boar 2003 Larvae: birds Nymphs: birds 2002 Larvae: birds Nymphs: birds 2007 Larvae: birds Nymphs: birds, roe dear Adults: roe deer 2004 Larvae: lizard Nymphs: lizard

Adults: roe deer, wild boar Différenciation entre espèces hôtes en controllant pour l'infra-population 2006 Larvae: birds, rodents 2007 Larvae: birds, lizard Nymphs: birds, lizard 2007 Nymphs: birds, roe dear Adults: roe deer, wild boar 2007 Nymphs: birds, roe dear FB-R=0.003 P-value=0.022 FB-R'=0.017 FRD-WB=0.028 P-value=0.002 FRD-WB'=0.14 FB-RD=0.047 P-value=0.078 FB-RD'=0.12 FB-L=-0.002 P-value=0.977

Parmi les tiques infectées par au moins une borrélie Co-occurence des différentes espèces de borrélies Parmi les tiques infectées par au moins une borrélie Données totales Borrélies (I x J) R(IJ) P-value Bbss  Bba 0.292 0.00008 Bbss  Bbg 0.496 0.05311 Bbss  Bbundet -0.069 1 Bba  Bbg 0.109 0.09348 Bba  Bbundet -0.017 0.91598 Bbg  Bbundet -0.030 Borrélies R(IJ) P-value Bbss  Bba -0.471 0.11049 Bbss  Bbg 0.412 1 Bbss  Bbundet -0.622 0.00304 Bba  Bbg -0.212 0.67559 Bba  Bbundet -0.632 0.0001 Bbg  Bbundet -0.290

Encore environs 50 000 cas, avec sous-surveillance seulement 10-15% des 60 millions de personnes vivant dans les zones concernée. Forme chronique Forme aigüe Trypanosoma brucei gambiense type 1 Trypanosoma brucei rhodesiense

FAO: US$ 4.75 milliard/an 1500

♂ ♀ L4

Glossina palpalis gambiensis Gpg Glossina palpalis palpalis Gpp Glossina tachinoides Gt

Gpp à Bonon, Côte d'Ivoire FIS>0 Loos G. p. g. G. p. p. Effet Wahlund + ? Hétérogéneité génétique

Gpg le long du Mouhoun, Burkina-Faso FIS>0 Loos G. p. g. G. p. p. Effet Wahlund + Population genetics D~0.01-1 tsetse/m σ~153-1053 m Mark release recapture D~0.16-0.24 tsetse/m σ~1250-2390 m

Gpg en Mangrove de Guinée Loos G. p. g. G. p. p. Falessadé Ne~40 m~0.028 FIS>0 Gpg en Mangrove de Guinée Dubreka Ne~1000 m~0.005 Fotoba Ne~40 m~0.014 Goulot d'étranglement il y a 276 générations (bauxite, 47 ans) Ne~55-5520 Kassa North Ne~30 m~0.027 Kassa South Ne~8 m~0.11 +Effets Wahlund probables

Gpg dans les Nyayes, Sénégal FIS~0 si pb techniques exclus

Gpg dans les Nyayes, Sénégal Goulot d'étranglement il y a entre 3 et 115 générations 1980-2005=25 ans=175 générations FST=10Mouhoun/260 km FST=2Loos/Continent FST~palpalis/gambiensis Efficacité des mâles stériles?

Gt et Gpg entre différents bassins: Comoe, Mouhoun, Sissili et Niger FSite/Basin=0.026 (P-value=0.001) Gt FIS~0, sauf pb techniques Loos G. p. g. G. p. p. Gpg FTrap/Site=0.0117, P-value=0.033 FSite/Basin=0.0379, P-value=0.001 FIS>0, pb techniques+Wahlund?

Gt et Gpg entre différents bassins: Comoe, Mouhoun, Sissili et Niger De≈26 Gt/km² Gt ♀, m~0.001 ♂, m~0.1-0.15 σ~454 m Loos G. p. g. G. p. p. Isolement par la distance sans rôle particulier des bassins Gpg De≈21000-39000 Gpg/km² σ=12-16 m (40moins que Gt)

Gpg dans la forêt sacrée de Bama, Burkina-Faso Ne Balloux: 17 Bartley: 30

Perspectives Meilleurs marqueurs

Crédits/Collaborations/Publications De Meeûs T., McCoy K.D., Prugnolle F., Chevillon C., Durand P., Hurtrez-Boussès S. & Renaud F. 2007. Population genetics and molecular epidemiology or how to "débusquer la bête". Infection Genetics and Evolution 7: 308-332. De Meeûs T. & Goudet J. 2007. A step by step tutorial to use HierFstat to analyse populations hierarchically structured at multiple levels. Infection Genetics and Evolution 7: 731-735. De Meeûs T. & McCoy K. 2009. La génétique des populations comme outil en épidémiologie. In Introduction à l'Epidémiologie Intégrative des Maladies Infectieuses et Parasitaires (Guégan J.F. & Choisy M. Eds.), De Boek Université, Bruxelles, pp 277-310. Hedrick, P.W., 2005, Genetics of Populations, Third Edition. Jones and Bartlett Publishers, Sudbury, Massachusetts, 737 p

Collaborations/Publications De Meeûs T., Beati L., Delaye C., Aeschlimann A. and Renaud F. 2002. Sex biased genetic structure in the vector of Lyme disease, Ixodes ricinus. Evolution 56: 1802–1807. De Meeûs T., Lorimier Y. and Renaud F. 2004. Lyme borreliosis agents and the genetics and sex of their vector, Ixodes ricinus. Microbes and Infection 6: 299-304. De Meeûs T., Humair P.F., Delaye C., Grunau C. and Renaud F. 2004. Non-Mendelian transmission of alleles at microsatellite loci: an example in Ixodes ricinus, the vector of Lyme disease. International Journal for Parasitology 34: 943-950. Kempf F., De Meeûs T., Arnathau C., Degeilh B. and McCoy K.D. 2009. Assortative Pairing in Ixodes ricinus L. (Acari:Ixodidae), the European Vector of Lyme Borreliosis. Journal of Medical Entomology 46: 471-474. Kempf F., McCoy K.D. & De Meeus T. 2010. Wahlund effects and sex-biased dispersal in Ixodes ricinus, the European vector of Lyme borreliosis: new tools for old data. Infection Genetics and Evolution 10: 989-997. Kempf F.*, De Meeûs T*, Vaumourin E., Noel V., Taragel’ová V., Plantard O., Heylen D.J.A., Eyraud C., Chevillon C. and McCoy K.D. 2012. Host races in Ixodes ricinus, the European vector of Lyme borreliosis. Infection Genetics and Evolution In press.

Collaborations/Publications Bouyer, J., Ravel, S., Dujardin, J.P., De Meeûs, T., Vial, L., Thévenon, S., Guerrini, L., Sidibe, I., Solano, P., 2007. Population structuring of Glossina palpalis gambiensis (Diptera: Glossinidae) according to landscape fragmentation in the Mouhoun river, Burkina Faso. J. Med. Entomol. 44, 788-795. Bouyer, J., Balenghien, T., Ravel, S., Vial, L., Sidibé, I., Thévenon, S., Solano, P., De Meeûs, T., 2009. Population sizes and dispersal pattern of tsetse flies: rolling on the river? Mol. Ecol. 18, 2787-2797. Bouyer, J., Ravel, S., Guerrini, L., Dujardin, J.P., Sidibé, I., Vreysen, M.J.B., Solano, P., De Meeûs, T., 2010. Population structure of Glossina palpalis gambiensis (Diptera: Glossinidae) between river basins in Burkina-Faso: consequences for area-wide integrated pest management. Infect. Genet. Evol. 10. Camara, M., Caro-Riano, H., Ravel, S., Dujardin, J.P., Hervouet, J.P., De Meeûs, T., Kagbadouno, M.S., Bouyer, J., Solano, P., 2006. Genetic and morphometric evidence for population isolation of Glossina palpalis gambiensis (Diptera : Glossinidae) on the Loos islands, Guinea. J. Med. Entomol. 43, 853-860. Kone, N., De Meeûs, T., Bouyer, J., Ravel, S., Guerrini, L., N’Goran, E.K., Vial, L., 2010. Population structuring of the tsetse Glossina tachinoides resulting from landscape fragmentation in the Mouhoun River Basin, Burkina Faso. Med. Vet. Entomol. 24, 162-168. Ravel, S., De Meeûs, T., Dujardin, J.P., Zeze, D.G., Gooding, R.H., Dusfour, I., Sane, B., Cuny, G., Solano, P., 2007. The tsetse fly Glossina palpalis palpalis is composed of several genetically differentiated small populations in the sleeping sickness focus of Bonon, Côte d'Ivoire. Infect. Genet. Evol. 7, 116-125. Solano, P., Ravel, S., Bouyer, J., Camara, M., Kagbadouno, M.S., Dyer, N., Gardes, L., Herault, D., Donnelly, M.J., De Meeûs, T., 2009. The population structure of Glossina palpalis gambiensis from island and continental locations in coastal Guinea. PLoS Negl. Trop. Dis. 3, e392. Solano, P., Ravel, S., De Meeûs, T., 2010. How can tsetse population genetics contribute to African trypanosomiasis control? Trends Parasitol. 26, 255-263. Solano P., Kaba D., Ravel S., Dyer N.A., Sall B., Vreysen M.J.B., Seck M.T., Darbyshir H., Gardes L., Donnelly M.J., De Meeûs T. & Bouyer J. 2010. Population genetics as a tool to select tsetse control strategies: suppression or eradication of Glossina palpalis gambiensis in the Niayes of Senegal. PLoS Negl. Trop. Dis. 4, e69. Koné N., Bouyer J., Ravel S., Vreysen M.J.B., Domagni K.T., Causse S., Solano P., De Meeûs T. 2011. Contrasting population structures of two vectors of African trypanosomoses in Burkina Faso: consequences for control. PLoS Neglected Tropical Diseases 5 (6): e1217.

Merci