Télécharger la présentation
1
Familles de gènes Nadia El-Mabrouk
2
Les gènes Parties codantes de l’ADN Unités de base de l’héridité.
Une fois les gènes identifiés, ils doivent être annotés pour leur fonction.
3
Familles de gènes Des gènes « apparentés » peuvent être regroupés en clusters, ou éparpillés dans un ou dans plusieurs chromosomes. Par exemple les gènes Globin:
4
Genomic structure of the β-globin gene cluster in therian mammals.
Opazo J C et al. PNAS 2008;105:
5
Duplication de gènes Ohno, 1970, « Evolution by gene duplication »:
La duplication de gènes (créant des paralogues) est l’évènement évolutif principal entraînant l’émergence de nouvelles fonctions. L’une des deux copies échappe à la pression de sélection et est libre d’évoluer.
6
Duplication de gènes Cause la plus courante: Recombinaisons inégales au cours de la méiose. En général du à la présence de répétitions. Donne lieu à des duplications en tandem.
7
Évolution des gènes S a a a b b a c a 1 2 3 4 1 2 3 4 2a 2b 1c 1a 3b
8
Évolution des gènes S 1 2 3 4 1c 1a 2a 2b 3b 4b 1 2 3 4
9
Évolution des gènes S 1 2 3 4 1c 1a 2a 2b 3b 4b
10
Homologie, orthologie, paralogie
Homologues: Gènes ayant un ancêtre commun. Orthologues: Leur plus récent ancêtre commun a subit une spéciation. Paralogues: Leur plus récent ancêtre commun a subit une duplication Xénologues: Gènes ayant été transmis par transfert horizontal.
11
Évolution des gènes 1 2 3 4 S 1c 1a 2a 2b 3b 4b orthologues
12
Évolution des gènes 1 2 3 4 S 1c 1a 2a 2b 3b 4b paralogues
13
Évolution des gènes 1 2 3 4 S 1c 1a 2a 2b 3b 4b paralogues
14
Arbre de gènes Pour inférer orthologues/paralogues:
Regrouper les gènes par famille. Inférer un arbre de gènes. Le « réconcilier » avec l’arbre des espèces pour identifier les duplications et les spéciations.
15
Familles de gènes Les gènes sont généralement regroupés par similarité de séquences. Hypothèse sous-jacentes: Des gènes « similaires » sont originaires d’une même copie ancestrale, i.e. sont homologues. Une variété d’outils de regroupements des gènes en familles: COG, InParanoid, OrthoMCL, Proteinortho.
16
Méthode d’homologie de séquence
Méthodes des « best BLAST hits »: Regroupe les copies le plus « similaires » en fonction des scores de BLAST. BBH « Bi-directional best Blast Hit »: Meilleur score de similarité dans « les deux sens »
17
La base de données COG COG: Clusters of Orthologous Groups of Genes Classifie les protéines des génomes complètement séquencés en se basant sur le concept d’orthologie. Idée générale: un « bidirectional best hit » n’est considéré que s’il est « confirmé » par une troisième séquence. Les membres d’un COG doivent appartenir à au moins 3 espèces. Cette validation avec une 3ème séquence a pour but d’éviter les erreurs causées par la perte de gènes: choix d’un paralogue plutôt qu’un orthologue. a b c
18
Arbre de gènes Pour inférer orthologues/paralogues:
Regrouper les gènes par famille; Inférer un arbre de gènes Le « réconcilier » avec l’arbre des espèces pour identifier les duplications et les spéciations.
19
Arbres de gènes Méthodes phylogénétiques diverses et variées
PHYLIP, NJ, PAUP, PhyML, MrBayes, RAxML… Banques de données d’arbres de gènes divers et variés: Ensembl Compara, PHOG, MetaPHOrs, PhylomeDB, PANTHER.
20
EXEMPLE – Arbre d’Ensembl
Hedgehog proteins (Sonic, Indian, Desert)
21
Arbre de gènes Pour inférer orthologues/paralogues:
Regrouper les gènes par famille; Inférer un arbre de gènes Le « réconcilier » avec l’arbre des espèces pour identifier les duplications et les spéciations.
22
Réconciliation Arbre de gènes G pour une famille
{g1, g2, g3, g4, g5} provenant des génomes {a,b,c,d} a b c d S G g1:a g2:b g3:b g4:c g5:d
23
Réconciliation On ne garde que le nom du génome de provenance a b c d
S G a b b c d
24
Réconciliation Expliquer la différence entre G et S par des événements de spéciation, duplication et pertes. a b c d S G a b b c d
25
Réconciliation Spéciation. a b c d S G Speciation a b b c d
26
Réconciliation Duplication deux copies dans le génome b a b c d S G a
27
Réconciliation Duplication deux copies dans le génome b
une duplication doit avoir eu lieu a b c d S G Duplication a b b c d
28
Réconciliation Duplication deux copies dans le génome b
une duplication doit avoir eu lieu à l’un des deux ancêtres a b c d S G Duplication a b b c d
29
Réconciliation Perte Duplication avant la spéciation a-b: a aurait dû avoir deux copies aussi Une copie a dû être perdue dans a a b c d S G Perte a b b c d
30
Réconciliation G a b b c d a b b c d
31
Réconciliation Critère de parcimonie: Minimiser duplications+pertes (mutation cost) G S g e f a b c d a1 b1 b2 c1 d1 Arbre réconcilié g e f e e a1 b1 a2 b2 c1 d1
32
LCA Mapping LCA Mapping (Bonizzoni et al., 2003)
Chaque nœud de G est associé au LCA de ses feuilles dans S. S g G e f a b c d a b b c d
33
LCA Mapping LCA Mapping (Bonizzoni et al., 2003)
Chaque nœud de G est associé au LCA de ses feuilles dans S. g S g G e f e f e a b c d a b b c d
34
LCA Mapping LCA Mapping (Bonizzoni et al., 2003)
Chaque nœud de G est associé au LCA de ses feuilles dans S. Un nœud de G une duplication ssi il a la même étiquette que l’un (ou les deux) de ses fils. g S g Duplication G e f e f e a b c d a b b c d
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.