La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Cours 4. III. Altérations des proportions de Hardy Weinberg suite.

Présentations similaires


Présentation au sujet: "Cours 4. III. Altérations des proportions de Hardy Weinberg suite."— Transcription de la présentation:

1 Cours 4

2 III. Altérations des proportions de Hardy Weinberg suite

3 Schistosoma Candida albicans III. Altérations des proportions de Hardy Weinberg 2. Excès d'hétérozygotes MHC ou HLA Ixodes ricinus Anémie falciforme et Plasmodium falciparum Superdominance Hétérogamie Clonalité Sexes séparés et petites populations Biais de dispersion sexe spécifique Hétérosis Trypanosoma brucei Bandes echo Loci dupliqués

4 Superdominance AAAaaa Fitness1-s1 ZygotesfNp t ²(1-s)2p t (1-p t ) fNfN(1-p t )²(1-s) RégulationfNp t ²(1-s)+ 2p t (1-p t )fN+ fN(1-p t )²(1-s) Fréquences t+1 Panmixie, grande population de taille N, pas de mutation ni de migration, fécondité de f (>1) 2 allèles, A et a de fréquence p t et 1-p t à la génération t

5 Superdominance AAAaaa Fitness1-s1 Fréquences t+1 2 allèles, A et a de fréquence p t et 1-p t à la génération t

6 Superdominance 2 allèles, A et a de fréquence p t et 1-p t à la génération t Equilibre quand Δp=p t+1 - p t =0 s1

7 Superdominance 2 allèles, A et a de fréquence p t et 1-p t à la génération t p eq =0, A éliminé p eq =1, A fixé p eq =1/2, équilibre polymorphe stable

8 Superdominance 2 allèles, A et a de fréquence p t et 1-p t à la génération t s<1 =A2*(1-A2)*(1-2*A2)

9 Superdominance Fardeau génétique

10 Hétérogamie ABAC BC AB t AC t BC t Donc léquilibre est atteint quand AB eq =AC eq =BC eq =1/3

11 Hétérogamie ABACBC AB t AC t BC t Allèle D?

12 Clonalité Pas de mutation ni de migration, grande population, pas de sélection proportion c investie en reproduction clonale et 1-c en panmixie AA Aa aa D t H t R t A léquilibre H t =H t+1 =H eq et donc: Convergence vers HW mais forts désequilibres de liaison attendus

13 Clonalité +Dérive +Mutation AA Aa aa D t H t R t Aa H eq ~1

14 IV. F statistiques de Wright

15 1. Modèle en îles de Wright

16 AA Aa aa D o H o R o H: probabilité de tirer deux allèles différents, dans un individu dune sous-population (H I ) dans deux individus de la même sous-population (H S ), dans deux individus de sous-populations différentes (H T ) 2. A l'intérieur des individus par rapport à leur sous-population: F IS Chesser & Nei

17 H: probabilité de tirer deux allèles différents, dans un individu dune sous-population (H I ) dans deux individus de la même sous-population (H S ), dans deux individus de sous-populations différentes (H T ) Wright, pour un modèle en îles avec deux allèles Les F de Wright sont aussi des rapports de variance 3. A l'intérieur des sous-populations par rapport à la population totale: F ST Chesser & Nei

18 H: probabilité de tirer deux allèles différents, dans un individu dune sous-population (H I ) dans deux individus de la même sous-population (H S ), dans deux individus de sous-populations différentes (H T ) 4. A l'intérieur des individus par rapport à la population totale: F IT Chesser & Nei

19 (1-F IT )=(1-F IS )(1-F ST ) F IS : Déficit en hétérozygote du à la non-panmixie dans les sous-populations F ST : Déficit en hétérozygotes du à la non-panmixie entre sous-population F IT : Déficit global en hétérozygotes résultant des deux précédents F IS =-1 (un seul type d'hétérozygotes) F IS =0 (panmixie locale) F IS =1 (que des homozygotes) F IS excès d'hétérozygotes (par ex. clonalité) F IS >0 => excès d'homozygotes (par ex. autofécondation) F ST =0 => pas de variation entre sous-populations (par ex. migration libre) F ST >0 => différenciation entre sous populations F ST =1 => chaque sous-population fixée pour l'un ou l'autre des allèles présents (absence de migration) F IT excès d'hétérozygotes (par ex. clonalité) F IT =0 => panmixie globale ou clonalité + effet Wahlund F IT >0 => excès d'homozygotes (par ex. autofécondation et/ou Wahlund)) 5. Définitions selon les hétérozygoties

20 F IS : Consanguinité des individus relative à la consanguinité des sous-populations F ST : Consanguinité des populations relative à la consanguinité totale F IT : Consanguinité des individus relative à la consanguinité totale (1-F IT )=(1-F IS )(1-F ST ) Q=1-H: probabilité de tirer deux allèles identiques, dans un individu Q I, dans deux individus de la même sous-population Q S et dans deux sous-populations différentes Q T WeirRousset 6. Définitions selon les consanguinités Formulations plus conforme au sens initial de ces indices

21 F IS l F IS F ST F IT 7. Récapitulation

22 F IS : Consanguinité des individus relative à la consanguinité des sous-populations F ST : Consanguinité des populations relative à la consanguinité totale F IT : Consanguinité des individus relative à la consanguinité totale F IS =-1 (un seul type d'hétérozygotes) F IS =0 (panmixie locale) F IS =1 (que des homozygotes) F IS déficit d'homozygotes (par ex. clonalité) F IS >0 => excès d'homozygotes (par ex. autofécondation) F ST =0 => pas de variation entre sous-populations (par ex. migration libre) F ST >0 => différentiation entre sous populations F ST =1 => chaque sous-population fixée pour l'un ou l'autre des allèles présents (absence de migration) F IT déficit d'homozygotes (par ex. clonalité) F IT =0 => panmixie globale ou clonalité + effet Wahlund F IT >0 => excès d'homozygotes (par ex. autofécondation et/ou Wahlund) 7. Récapitulation

23 Jour 3 Cours 5

24 V. Inférences

25 1. Autofécondation AA Aa aa D t H t R t A léquilibre, H t =H t+1 =H eq Formule généralisée de Wright

26 2. Dispersion en modèle en îles de Wright avec beaucoup d'îles et beaucoup d'allèles Modèle en îles de Wright, n grand, m et u petit, K grand: Q T ~0 panmixie locale: Q I =Q S

27 Modèle en îles de Wright, n grand, m et u petit, K grand: Q T ~0 panmixie locale: Q I =Q S A léquilibre migration/mutation/dérive Evolution de Q S, probabilité de tirer deux fois le même allèle dans une sous-population, entre les générations t et t+1 Les deux allèles sont autochtones et non-mutants et identiques Parce qu'ils l'étaient déjà en t ou Parce qu'ils le sont devenus en t+1

28 Modèle en îles de Wright, n grand, m et u petit, K grand: Q T ~0 panmixie locale: Q I =Q S A léquilibre migration/mutation/dérive N>0

29 Modèle en îles de Wright, n grand, m et u petit, K grand: Q T ~0 panmixie locale: Q I =Q S A léquilibre migration/mutation/dérive On néglige les termes en m et u devant 1 ainsi que les termes en mu devant m

30 Inférence de la migration Modèle en îles de Wright, n grand, m et u petit, K grand: Q T ~0 panmixie locale: Q I =Q S ; F ST =Q S A léquilibre migration/mutation/dérive si u<

31 3. Dispersion en modèle en îles fini (n petit), avec homoplasie (K petit) et autofécondation locale (s) Impact de l'homoplasie Microsatellites

32 4. Dispersion dans d'autres modèles de populations, Stepping stone (en pas Japonais) et Voisinage 1 D 2 D 3 D

33 Les F-Statistiques de Wright Autres modèles de populations Stepping stone (en pas Japonais) et Voisinage Rousset 1 D 2 D QSQS QSQS QSQS QSQS QSQS QSQS QSQS QSQS QSQS QTQT QTQT

34 1 D Stepping stone (en pas Japonais) et Voisinage Rousset Pente b D e : Densité efficace dindividus (/m ou /m²) σ: distance entre adultes reproducteurs et leurs parents Voisinage=1/b

35 2 D Stepping stone (en pas Japonais) et Voisinage Pente b D e : Densité efficace dindividus (/m ou /m²) σ: distance entre adultes reproducteurs et leurs parents Voisinage=1/b Rousset

36 5. Estimations deffectifs efficaces Différenciation génétiques entre échantillons séparés dans le temps N e : Waples Dans lespace et le temps N e et m: Wang & Whitlock Déséquilibres de liaisons N e : Bartley et al., Waples & Do Excès dhétérozygotes (dioïques ou autoincompatibles) N e : Balloux Déséquilibres inter et intra loci sur données spatiales N e et m: Vitalis & Couvet Et bien d'autres…

37 6. Estimateurs non biaisés des F-Statistiques de Wright F IS l F IS F ST Estimations RAPPEL: Variance: ² = [1/n]. i [(x i -x)²] ; s² = [1/(n-1)]. i [(x i -x)²] Estimateurs f et θ de Weir & Cockerham F IT Taille de sous-échantillons N s =1

38 pour K allèles noté de A=1 à K Estimateurs des F de Wright F IS F ST F IT Weir & Cockerham non biaisés variance destimation forte Robertson & Hill biaisés variance destimation faible (meilleure « statistique »)

39 7. F-statistiques pour plus de trois niveaux hiérarchiques ~0 >>0 Yang

40 8. F-statistiques chez les clones Que des hétérozygotes => Q I =0 Si n grand et m petit Q T ~0 Si n=2 et m petit Si m~0

41 Génétique des populations des diploïdes clonaux ou partiellement clonaux F is 0 Loci C=[ ], Nm pas petit F is 0 Loci C=1, Nm petit F ST ~0.5 F is 0 Loci C=[ ], Nm petit F st >>0.5 F is 0 Loci C=1, Nm pas petit F st <<0.5 Phylloxera Candida albicans Trypanosoma brucei gambiense

42 VI. Procédures statistiques

43 On recherche avec quelle probabilité, appelée P-value, le hasard permet d'expliquer nos données si ces dernières suivent l'hypothèse nulle H 0. Le test, défini a priori, peut être: -bilatéral: dans ce cas l'hypothèse alternative H 1 est que les valeurs observées sont trop extrêmes pour être expliquées par le hasard; -unilatéral "plus grand": dans ce cas H 1 est que les valeurs observées sont plus grandes qu'attendue par hasard sous H 0 ; -unilatéral "moins grand": dans ce cas H 1 est que les observations ont des valeurs plus petites qu'attendues sous H 0. Par convention on a choisi arbitrairement la limite 0.05 pour la P-value seuil au dessous de laquelle un test est dit significatif. Mais, selon les circonstances ont peut choisir d'être plus ou moins sévère. La décision statistique ne dépend que du manipulateur. Erreur de première espèce, α: probabilité de se tromper en rejetant H 0 (P-value); Erreur de seconde espèce, β: probabilité de se tromper en acceptant l'hypothèse nulle. Un test est puissant si on rejette facilement H 0 ; Un test est robuste s'il ne rejette pas trop souvent H Définitions

44 2. Calculs dintervalles de confiance (IC) des F-statistiques Bootstrap (e.g. sur les loci): on rééchantillonne aléatoirement k fois (e.g. 5000) avec remise. On peut donc tirer plusieurs fois le même item (e.g. locus) et on calcule F à chaque tirage.

45 2. Calculs dintervalles de confiance (IC) des F-statistiques Jackknife (e.g. sur les sous-échantillons): on retire un item à la fois (e.g. un sous-échantillon) et on recalcule F sur ceux qui restent. On obtient autant de valeurs quil y a ditems dont on tire une moyenne et une variance pour F qui sert au calcul dune erreur standard du F. Sous lhypothèse de normalité on peut estimer un IC qui correspond à F±StdErr(F) t α,γ, où t se trouve dans une table du t ou peut être calculé sous Excel, où α correspond au seuil désiré (0.05 pour un CI à 95%, 0.01 pour 99%) et γ au degré de liberté (i.e. nombre ditems-1)

46 n-1t(α=0.05)n-1t(α=0.05)n-1t(α=0.05) Table du t F IS = loci StdErr(F IS )=0.01 lIC 95% sera et soit 95% IC=[0.177, 0.223] Procédures statistiques: IC 95% du Jackknife

47 3. Tests de significativité par randomisation Tests de randomisations: Simuler H 0 un très grand nombre de fois; la P-value du test = la proportion des valeurs simulées qui sont aussi extrêmes ou plus extrêmes que celle observée dans léchantillon Il est important de bien appréhender ce quil y a derrière H 0 et H 1 : que cherche-t-on à tester exactement? Nombre de randomisations: si permutations, au moins si chaine de Markhov

48 Procédures statistiques Tests de significativité des F par randomisation F is Utilisation dautres estimateurs (Robertson & Hill) comme statistique Tests exacts de Haldane (pas de test global sur les sous-échantillons et loci) Tester si F IS > 0 P-value P 1 ou < 0 P-value P 2 ou 0 P-value P 3 F IS 0 (bilatéral) P 3 =min(P 1,P 2 )+[1-max(P 1,P 2 )] Significativité du F IS = tester la panmixie locale

49 Procédures statistiques Tests de significativité des F par randomisation F ST Tester si F ST > 0

50 Statistique G: logarithme du rapport de maximum de vraisemblance des fréquences alléliques dans les différents sous-échantillons. Propriété additive du G permet de tester globalement sur les loci Procédures statistiques Tester si la répartition des allèles est aléatoire à laide de la statistique G H 0 : le G observé nest pas plus grand que ceux générés par randomisation des individus entre sous-échantillons

51 Procédures statistiques Tester la significativité dune corrélation entre deux matrices de distances tel que dans le cas dun isolement par la distance Les cases sont auto-corrélées Test de Mantel: on permute les cases dune des matrices et on recalcule la corrélation à chaque fois. La P-value=la proportion de corrélations randomisées aussi grandes ou plus grandes que lobservée Test assez conservateur

52 Locus_ 2 Locus_ 1 Mesures multiLocus Procédures statistiques Déséquilibres de liaison

53 Procédures statistiques Déséquilibres de liaison Les génotypes des loci (nous navons en général pas les haplotypes=la phase) sont réassociés un grand nombre de fois et une statistique mesurée à chaque fois. La P-value du test correspond à la proportion des valeurs randomisées supérieures ou égales à lobservée. Tests par paires de loci: Statistique utilisée: G permet un test sur lensemble des sous-populations mais par paire de loci=>autant de P-values que de paires de loci Tests multilocus: Statistique utilisée: r D par exemple permet un test sur lensemble des loci mais par sous-échantillon=>autant de P-values que de sous-échantillons Dans tous les cas il faudra tenir compte de cette répétition de tests

54 Procédures statistiques F-statistiques pour plus de trois niveaux hiérarchiques

55 Procédures statistiques Comparaison de groupes S=F IS, F ST, AI c, H o, H s etc… S Obs =(S Obs1 -S Obs2 )² Sylvestres Champêtres

56 Comparaison de catégories dindividus S Obs =(S Obs1 -S Obs2 )² Randomisation du statut en gardant le ratio local constant Procédures statistiques S=F IS, F ST, AI c, H o, H s etc…

57 4. Facteurs imbriqués et croisés Différenciation entre genres Différenciation géographique F ST_1 ; P-value_1 F ST_2 ; P-value_2 Combiner les k P-values d'une série de k tests

58 5. Procédures pour combiner k tests Quels tests sont significatifs? La série des k tests est-elle significative? P 1, P 2, P 3, …P k Bonferroni sequentiel P min k P min-1 (k-1) etc.. Les P-values corrigées qui restent significatives désignent les tests qui les ont. Test hyper-conservateur à nutiliser que sur les tests les plus puissants (gros échantillons les plus polymorphes) Procédure de Fisher k<4 Procédure Z de Stouffer Z i =loi.normale.standard.inverse(P i ) P-value=loi.normale.standard(Z) Les tests ne sont pas indépendants Au moins un test de la série est-il significatif? Les test sont indépendants k4 Procédure binomiale généralisée Test binomial

59 6. Analyses multivariées AFC ACP PC1 (48%inertia) P < PC2 (21%inertia) P < Mouette Guillemot Macareux Tests dassignment Macareux – 95% Mouette – 82% Guillemot – 89% ACP des populations de tique

60 7. Exploration dune structure cachée AFC Méthodes Bayésiennes dinférence de structure de populations Structure BAPS Flock


Télécharger ppt "Cours 4. III. Altérations des proportions de Hardy Weinberg suite."

Présentations similaires


Annonces Google