La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

1 La détection de gènes impliqués dans les maladies multifactorielles Marie-Pierre Etienne ENGREF Laboratoire GRESE Statistique et Génome.

Présentations similaires


Présentation au sujet: "1 La détection de gènes impliqués dans les maladies multifactorielles Marie-Pierre Etienne ENGREF Laboratoire GRESE Statistique et Génome."— Transcription de la présentation:

1 1 La détection de gènes impliqués dans les maladies multifactorielles Marie-Pierre Etienne ENGREF Laboratoire GRESE Statistique et Génome

2 2 Maladies Multifactorielles plusieurs facteurs plusieurs gènes Psoriasis, sclérose en plaques, polyarthrite rhumatoïde Réduire le nombre de gènes à tester L étude familiale Un échantillon de couples de germains malades Un individu est un couple de germains Détecter les zones de fort partage génétique entre deux germains Une approche exploratoire

3 3 Trois notions clé Les recombinaisons : la méïose Les marqueurs génétiques : allèles La valeur IBD (Identical By Descent)

4 4 Trois notions clé Les lois de Mendel 1/4 Les recombinaisons : la méïose

5 5 Trois notions clé Les recombinaisons Les recombinaisons : la méïose

6 6

7 7 Trois notions clé Les recombinaisons Les recombinaisons : la méïose

8 8 Trois notions clé Deux gènes occupant le même locus sur une paire de chromosomes mais qui présentent de légères différences sont appelés allèles Un marqueur est une séquence d'ADN repérable spécifiquement. En cartographie génétique, le marqueur est utilisé pour baliser le génome. On sait facilement les séquencer et les positionner physiquement sur le génome (ex : micro-satellites, SNP) Les marqueurs génétiques : allèles

9 9 Trois notions clé La distance séparant deux marqueurs peut s exprimer - en nombre de bases - en Morgan (M) Une distance de 1cM = la probabilité qu il y ait recombinaison entre les deux marqueurs est 0.01 Dans notre étude les marqueurs sont régulièrement espacées de p Morgans (sur les données p=0.04) Les marqueurs génétiques : allèles

10 10 Trois notions clé La valeur IBD (Identical By Descent)

11 11 Le modèle mathématique Selon les lois de Mendel et si l on suppose que les recombinaisons sont indépendantes On peut modéliser la succession des valeurs IBD le long d un chromosome par une chaîne de Markov homogène Pour un individu : X 1 X 2 X 3 …… X n est une chaîne de Markov homogène de matrice de transition et de mesure stationnaire

12 12 Le modèle mathématique Selon les lois de Mendel Avec p = distance entre 2 marqueurs, q=1-p

13 13 Transition de 2 vers …. A(2,.)

14 14 Le modèle mathématique Selon les lois de Mendel, sur un chromosome Pour nos N individus

15 15 But de lapproche exploratoire Détecter de zones fortement IBD2 Pourquoi ? Les deux germains sont malades: les gènes impliqués se situent probablement dans une zone fortement IBD2, en tout cas pas dans une zone IBD0.

16 16 Détecter de zones fortement IBD2 1001000110122122221101101 0101110000122221221001111 1111011110122122222100111 2221000110112222221101101 0021001110122122222111100

17 17 Détecter de zones fortement IBD2 1001000110122122221101101 0101110000122221221001111 1111011110122122222100111 2221000110112222221101101 0021001110122122222111100

18 18 Le score local, cest quoi ? L approche score local En clair, on cherche parmi tous les sous segments, celui qui a le score maximal Si Zi est le score élémentaire à la position i, on définit H0 : « l échantillon suit les lois de Mendel » H1 : « le reste du monde » On va tester :

19 19 L approche score local Y (j) i =f(X (j) i ) Exemple IBD0=-3 IBD1=-1 IBD2=4 Zi est appelé le score élémentaire

20 20 Détecter de zones fortement IBD2 -3-3 -344 4444 -3 -3 -3 4444 44 -3 -3 -344 44444 -3 4 -3 -3 444444 -3 4 -3 -344 44444 1-5-13-11 -7 -15-515205 1520 5-7-13-7-5

21 21 Le processus Sn Marche aléatoire -80 -60 -40 -20 0 20 40 60 13579111315171921 score

22 22 S j -min {i<j} S i 0 20 40 60 80 100 120 140 13579111315171921

23 23 Une approche exacte (Mercier 2003) Si Xi est une chaîne de Markov sur un espace E, on peut déterminer P(Hn>a) à partir dune seconde chaîne de Markov définie sur lespace E x {0, …, a}. Ici : pour avoir une chaîne de Markov, on doit considérer (Zi, Y (1) i, …, Y (N) i ) despace détats E={f(0)N … f(2)N} x {f(0), f(1), f(2)} N #E=C N 3 N La significativité pour Mendel

24 24 Une approche asymptotique, si la mesure stationnaire des Y i est centrée La significativité pour Mendel Avec

25 25 La significativité pour Mendel Et alors, qu est-ce qu on fait maintenant ? On simule !!!

26 26 L approche score local H0 : « l échantillon suit les lois de Mendel » H1 : « le reste du monde »

27 27 L approche score local Les limites On a fixé des scores arbitraires pour les valeurs IBD de façon à mettre en évidence la région HLA du chromosome 6 On ne peut trouver que des régions dont la structure est similaire à celle de HLA

28 28 L approche bayésienne Deux modèles M0 et M1 1001000110121122221101101 0101110000122221221001111 1111011110122122222100111 2221000110112222221101101 0021001110122122222111100 M0 le modèle de Mendel

29 29 L approche bayésienne Deux modèles M0 et M1 1001000110121122221101101 0101110000122221221001111 1111011110122122222100111 2221000110112222221101101 0021001110122122222111100

30 30 L approche bayésienne Deux modèles M0 et M1 1001000110121122221101101 0101110000122221221001111 1111011110122122222100111 2221000110112222221101101 0021001110122122222111100

31 31 L approche bayésienne Deux modèles M0 et M1 1001000110121122221101101 0101110000122221221001111 1111011110122122222100111 2221000110112222221101101 0021001110122122222111100

32 32 L approche bayésienne construction du modèle

33 33 L approche bayésienne construction du modèle

34 34 L approche bayésienne construction du modèle

35 35 X i (j) L approche bayésienne construction du modèle j

36 36 L approche bayésienne [ a priori [ a priori B( a priori U({1,..., n

37 37 L approche bayésienne Principe de lalgorithme de Gibbs : on veut simuler la loi de [ 1 2 X 1.On tire dans [ 1 ] et selon 2.On tire selon [ 1 | 2 (0), X] 3.On tire selon [ | 1 (1), X] 4.On recommence en 2. Quand on a atteint la convergence pour la chaîne de Markov ainsi définie, on obtient un échantillon de la loi voulue

38 38 L approche bayésienne Les résultats Région HLA K6

39 39 L approche bayésienne Les résultats K14 Rien à voir

40 40 L approche bayésienne Les résultats K4 à exploiter


Télécharger ppt "1 La détection de gènes impliqués dans les maladies multifactorielles Marie-Pierre Etienne ENGREF Laboratoire GRESE Statistique et Génome."

Présentations similaires


Annonces Google