1 La détection de gènes impliqués dans les maladies multifactorielles Marie-Pierre Etienne ENGREF Laboratoire GRESE Statistique et Génome
2 Maladies Multifactorielles plusieurs facteurs plusieurs gènes Psoriasis, sclérose en plaques, polyarthrite rhumatoïde Réduire le nombre de gènes à tester L étude familiale Un échantillon de couples de germains malades Un individu est un couple de germains Détecter les zones de fort partage génétique entre deux germains Une approche exploratoire
3 Trois notions clé Les recombinaisons : la méïose Les marqueurs génétiques : allèles La valeur IBD (Identical By Descent)
4 Trois notions clé Les lois de Mendel 1/4 Les recombinaisons : la méïose
5 Trois notions clé Les recombinaisons Les recombinaisons : la méïose
6
7 Trois notions clé Les recombinaisons Les recombinaisons : la méïose
8 Trois notions clé Deux gènes occupant le même locus sur une paire de chromosomes mais qui présentent de légères différences sont appelés allèles Un marqueur est une séquence d'ADN repérable spécifiquement. En cartographie génétique, le marqueur est utilisé pour baliser le génome. On sait facilement les séquencer et les positionner physiquement sur le génome (ex : micro-satellites, SNP) Les marqueurs génétiques : allèles
9 Trois notions clé La distance séparant deux marqueurs peut s exprimer - en nombre de bases - en Morgan (M) Une distance de 1cM = la probabilité qu il y ait recombinaison entre les deux marqueurs est 0.01 Dans notre étude les marqueurs sont régulièrement espacées de p Morgans (sur les données p=0.04) Les marqueurs génétiques : allèles
10 Trois notions clé La valeur IBD (Identical By Descent)
11 Le modèle mathématique Selon les lois de Mendel et si l on suppose que les recombinaisons sont indépendantes On peut modéliser la succession des valeurs IBD le long d un chromosome par une chaîne de Markov homogène Pour un individu : X 1 X 2 X 3 …… X n est une chaîne de Markov homogène de matrice de transition et de mesure stationnaire
12 Le modèle mathématique Selon les lois de Mendel Avec p = distance entre 2 marqueurs, q=1-p
13 Transition de 2 vers …. A(2,.)
14 Le modèle mathématique Selon les lois de Mendel, sur un chromosome Pour nos N individus
15 But de lapproche exploratoire Détecter de zones fortement IBD2 Pourquoi ? Les deux germains sont malades: les gènes impliqués se situent probablement dans une zone fortement IBD2, en tout cas pas dans une zone IBD0.
16 Détecter de zones fortement IBD
17 Détecter de zones fortement IBD
18 Le score local, cest quoi ? L approche score local En clair, on cherche parmi tous les sous segments, celui qui a le score maximal Si Zi est le score élémentaire à la position i, on définit H0 : « l échantillon suit les lois de Mendel » H1 : « le reste du monde » On va tester :
19 L approche score local Y (j) i =f(X (j) i ) Exemple IBD0=-3 IBD1=-1 IBD2=4 Zi est appelé le score élémentaire
20 Détecter de zones fortement IBD
21 Le processus Sn Marche aléatoire score
22 S j -min {i<j} S i
23 Une approche exacte (Mercier 2003) Si Xi est une chaîne de Markov sur un espace E, on peut déterminer P(Hn>a) à partir dune seconde chaîne de Markov définie sur lespace E x {0, …, a}. Ici : pour avoir une chaîne de Markov, on doit considérer (Zi, Y (1) i, …, Y (N) i ) despace détats E={f(0)N … f(2)N} x {f(0), f(1), f(2)} N #E=C N 3 N La significativité pour Mendel
24 Une approche asymptotique, si la mesure stationnaire des Y i est centrée La significativité pour Mendel Avec
25 La significativité pour Mendel Et alors, qu est-ce qu on fait maintenant ? On simule !!!
26 L approche score local H0 : « l échantillon suit les lois de Mendel » H1 : « le reste du monde »
27 L approche score local Les limites On a fixé des scores arbitraires pour les valeurs IBD de façon à mettre en évidence la région HLA du chromosome 6 On ne peut trouver que des régions dont la structure est similaire à celle de HLA
28 L approche bayésienne Deux modèles M0 et M M0 le modèle de Mendel
29 L approche bayésienne Deux modèles M0 et M
30 L approche bayésienne Deux modèles M0 et M
31 L approche bayésienne Deux modèles M0 et M
32 L approche bayésienne construction du modèle
33 L approche bayésienne construction du modèle
34 L approche bayésienne construction du modèle
35 X i (j) L approche bayésienne construction du modèle j
36 L approche bayésienne [ a priori [ a priori B( a priori U({1,..., n
37 L approche bayésienne Principe de lalgorithme de Gibbs : on veut simuler la loi de [ 1 2 X 1.On tire dans [ 1 ] et selon 2.On tire selon [ 1 | 2 (0), X] 3.On tire selon [ | 1 (1), X] 4.On recommence en 2. Quand on a atteint la convergence pour la chaîne de Markov ainsi définie, on obtient un échantillon de la loi voulue
38 L approche bayésienne Les résultats Région HLA K6
39 L approche bayésienne Les résultats K14 Rien à voir
40 L approche bayésienne Les résultats K4 à exploiter