Familles de gènes Nadia El-Mabrouk.

Slides:



Advertisements
Présentations similaires
ADN.
Advertisements

Cladogramme.
Apprentissage supervisé à partir de séquences
Méthode de recherche de gènes orthologues
Évaluation de la qualité d'une clusterisation
PARTIE 1 : Temps, Évolution et Génétique
La génétique bactérienne cours 5
DE ZÉRO à PAUP : Délimitation du groupe d'intérêt ("ingroup")
Pons Nicolas, Jean-Michel Batto, S.Dusko Ehrlich, Pierre Renault
Phylogénie et distances génétique
Prédiction de sites dinteraction des protéines par analyse darbres phylogénétiques Stéfan Engelen Génomique Analytique, INSERM U511 Université Pierre et.
Colloque Traitement et Analyse de séquences : compte-rendu
Etablissement de Phylogénie
Laurent Labarre AGC - UMR Génoscope
Les bases de données biologiques au LBBE
Recherche heuristique de similitudes dans les séquences dADN École Jeunes Chercheurs en Algorithmique et Calcul Formel Laurent Noé
DIVERSIFICATION GENETIQUE ET DIVERSIFICATION DES ETRES VIVANTS
UNIVERSITÉ DE LA MÉDITERRANÉE CENTRE D’OCÉANOLOGIE DE MARSEILLE
La recherche de parenté chez les vertébrés
Détection de co-évolution de gènes Master 2 : Informatique à Finalité Professionnelle et Recherche Unifiée (IFPRU) Parcours Ingénierie de lIntelligence.
(c) McGraw Hill Ryerson 2007
Chapitre 4.
Gestion de Fichiers Arbres B.
Caricature IDF Dis, M'sieur le Moniteur de Biologie marine c'est quoi t'est-ce donc la classification phylogénétique ? Non ! Claude Duboc Professeur de.
TP 5 Du génome au protéome
La phylogénie Définition :
METHODE GLOBALE de construction d’un arbre phylogénétique
Diversification du Vivant
UBLO Comparaison de génomes bactériens : questions méthodologiques autour de la définition du squelette et des boucles
The origin and evolution of synapses
CHAPITRE 19 - La génétique des populations
Mimivirus relatives in the Sargasso sea
Prédiction d’interactions protéine-protéine
Rappels- introduction Le vivant =
Introduction à la Bio-Informatique
Etienne Danchin & Amandine Campan Présentation interne, pôle Santé des Plantes, Sophia - Antipolis Mercredi 21 avril 2010 Grille PACA ProActive : retour.
Arbre du vivant : 3 Hypothèses
Inférence de phylogénies
Test -révision thèmeIA chap2-chap3
Introduction à la taxinomie
Introduction à la Phylogénie
Introduction Matériels et méthodes Résultats
Formation Bio-informatique IRD
Recherche exacte de motifs
Photorécepteurs et évolution
Analyses phylogénétiques
Notes 1B Les outils de la classification
Les subtélomères des chromosomes des hémiascomycètes Nantes, octobre 2006 Cécile Fairhead Génétique Moléculaire des Levures Institut Pasteur, Paris.
Identification of a Novel Circulating Recombinant
Olivier Leclair, Université Laval Un algorithme de fouille dans une représentation des données par objets: une application médicale SIMON, Arnaud.
Alignement de séquences biologiques
IDENTIFICATION ET CLASSIFICATION
TP 3 : Familles multigeniques
Reconstitution partielle du génome codant d'un puceron (Acyrthosiphon pisum, Hémiptères) - Evolution d'une famille fortement multigénique (protéases) Claude.
Structures de données avancées : Variantes des B arbres
Introduction à la Bio-Informatique
La famille est un système ouvert :
Introduction à la Phylogénie
Génétique et évolution La variabilité interespèces Outils pour la construction “à haut débit“ d’arbres phylogénétiques Réflexion sur les espèces situées.
L’établissement des relations phylogénétiques
On s‘intéressera à 3 gènes paralogues humains : HTR2A, HTR2B et HTR2C du récepteur de la sérotonine humaine (Swissprot : 5HT2A_HUMAN, 5HT2B_HUMAN, 5HT2C_HUMAN).
La phylogenèse Définition :
Evaluation Exercice 1 Choisissez LES bonnes réponses.
Les banques de séquences nucléiques
Thème 5.4 La cladistique Idée Essentielle: l’ascendance de groupes d’espèces peut être déduite en comparant leurs séquences de bases ou d’acides aminés.
Classification évolutive Travaux pratiques et cas de la lignée verte Cours du 10/03/2016 Présentation: Hugo FONTES Conception : Hugo FONTES et Pierre CELLIER.
BIO-INFORMATIQUE Analyse de séquences nucléotidiques - séance n°1 Illustration:
Innovations génétiques: Implication de la duplication de gènes.
Calcul Intensif en Génomique Comparative Laurent Duret Laboratoire de Biométrie et Biologie Evolutive.
Analyse de séquences nucléotidiques séance n°2 Bio-Informatique.
Transcription de la présentation:

Familles de gènes Nadia El-Mabrouk

Les gènes Parties codantes de l’ADN Unités de base de l’héridité. Une fois les gènes identifiés, ils doivent être annotés pour leur fonction.

Familles de gènes Des gènes « apparentés » peuvent être regroupés en clusters, ou éparpillés dans un ou dans plusieurs chromosomes. Par exemple les gènes Globin:

Genomic structure of the β-globin gene cluster in therian mammals. Opazo J C et al. PNAS 2008;105:12950-12955

Duplication de gènes Ohno, 1970, « Evolution by gene duplication »: La duplication de gènes (créant des paralogues) est l’évènement évolutif principal entraînant l’émergence de nouvelles fonctions. L’une des deux copies échappe à la pression de sélection et est libre d’évoluer.

Duplication de gènes Cause la plus courante: Recombinaisons inégales au cours de la méiose. En général du à la présence de répétitions. Donne lieu à des duplications en tandem.

Évolution des gènes S a a a b b a c a 1 2 3 4 1 2 3 4 2a 2b 1c 1a 3b

Évolution des gènes S 1 2 3 4 1c 1a 2a 2b 3b 4b 1 2 3 4

Évolution des gènes S 1 2 3 4 1c 1a 2a 2b 3b 4b

Homologie, orthologie, paralogie Homologues: Gènes ayant un ancêtre commun. Orthologues: Leur plus récent ancêtre commun a subit une spéciation. Paralogues: Leur plus récent ancêtre commun a subit une duplication Xénologues: Gènes ayant été transmis par transfert horizontal.

Évolution des gènes 1 2 3 4 S 1c 1a 2a 2b 3b 4b orthologues

Évolution des gènes 1 2 3 4 S 1c 1a 2a 2b 3b 4b paralogues

Évolution des gènes 1 2 3 4 S 1c 1a 2a 2b 3b 4b paralogues

Arbre de gènes Pour inférer orthologues/paralogues: Regrouper les gènes par famille. Inférer un arbre de gènes. Le « réconcilier » avec l’arbre des espèces pour identifier les duplications et les spéciations.

Familles de gènes Les gènes sont généralement regroupés par similarité de séquences. Hypothèse sous-jacentes: Des gènes « similaires » sont originaires d’une même copie ancestrale, i.e. sont homologues. Une variété d’outils de regroupements des gènes en familles: COG, InParanoid, OrthoMCL, Proteinortho.

Méthode d’homologie de séquence Méthodes des « best BLAST hits »: Regroupe les copies le plus « similaires » en fonction des scores de BLAST. BBH « Bi-directional best Blast Hit »: Meilleur score de similarité dans « les deux sens »

La base de données COG COG: Clusters of Orthologous Groups of Genes Classifie les protéines des génomes complètement séquencés en se basant sur le concept d’orthologie. Idée générale: un « bidirectional best hit » n’est considéré que s’il est « confirmé » par une troisième séquence. Les membres d’un COG doivent appartenir à au moins 3 espèces. Cette validation avec une 3ème séquence a pour but d’éviter les erreurs causées par la perte de gènes: choix d’un paralogue plutôt qu’un orthologue. a b c

Arbre de gènes Pour inférer orthologues/paralogues: Regrouper les gènes par famille; Inférer un arbre de gènes Le « réconcilier » avec l’arbre des espèces pour identifier les duplications et les spéciations.

Arbres de gènes Méthodes phylogénétiques diverses et variées PHYLIP, NJ, PAUP, PhyML, MrBayes, RAxML… Banques de données d’arbres de gènes divers et variés: Ensembl Compara, PHOG, MetaPHOrs, PhylomeDB, PANTHER.

EXEMPLE – Arbre d’Ensembl Hedgehog proteins (Sonic, Indian, Desert)

Arbre de gènes Pour inférer orthologues/paralogues: Regrouper les gènes par famille; Inférer un arbre de gènes Le « réconcilier » avec l’arbre des espèces pour identifier les duplications et les spéciations.

Réconciliation Arbre de gènes G pour une famille {g1, g2, g3, g4, g5} provenant des génomes {a,b,c,d} a b c d S G g1:a g2:b g3:b g4:c g5:d

Réconciliation On ne garde que le nom du génome de provenance a b c d S G a b b c d

Réconciliation Expliquer la différence entre G et S par des événements de spéciation, duplication et pertes. a b c d S G a b b c d

Réconciliation Spéciation. a b c d S G Speciation a b b c d

Réconciliation Duplication deux copies dans le génome b a b c d S G a

Réconciliation Duplication deux copies dans le génome b une duplication doit avoir eu lieu a b c d S G Duplication a b b c d

Réconciliation Duplication deux copies dans le génome b une duplication doit avoir eu lieu à l’un des deux ancêtres a b c d S G Duplication a b b c d

Réconciliation Perte Duplication avant la spéciation a-b: a aurait dû avoir deux copies aussi Une copie a dû être perdue dans a a b c d S G Perte a b b c d

Réconciliation G a b b c d a b b c d

Réconciliation Critère de parcimonie: Minimiser duplications+pertes (mutation cost) G S g e f a b c d a1 b1 b2 c1 d1 Arbre réconcilié g e f e e a1 b1 a2 b2 c1 d1

LCA Mapping LCA Mapping (Bonizzoni et al., 2003) Chaque nœud de G est associé au LCA de ses feuilles dans S. S g G e f a b c d a b b c d

LCA Mapping LCA Mapping (Bonizzoni et al., 2003) Chaque nœud de G est associé au LCA de ses feuilles dans S. g S g G e f e f e a b c d a b b c d

LCA Mapping LCA Mapping (Bonizzoni et al., 2003) Chaque nœud de G est associé au LCA de ses feuilles dans S. Un nœud de G une duplication ssi il a la même étiquette que l’un (ou les deux) de ses fils. g S g Duplication G e f e f e a b c d a b b c d