Alix Boc Université du Québec à Montréal

Slides:



Advertisements
Présentations similaires
DESS Bioinformatique, Université Blaise Pascal, Clermont-Ferrand, Février 2004 Reconstruction phylogénétique D'après Huson et al. Édouard Barat David Salgado.
Advertisements

Treuil IRD Abdelwahed FSSM-Marrakech
Cours 3-a Méthode des éléments finis 1D
Recherche de motifs par méthodes exploratoires: Comparaisons de performances et statistiques sur le score.
DE ZÉRO à PAUP : Délimitation du groupe d'intérêt ("ingroup")
Phylogénie et distances génétique
OBJECTIFS FouDanGA : Fouille de données pour lannotation de génomes dactinomycètes CONTEXTE Laccumulation des séquences.
Bloc1 : Théorie des graphes et problèmes d’ordonnancement
Colloque Traitement et Analyse de séquences : compte-rendu
Master Génie Biologique et Informatique, première année
Le remplacement moléculaire
Séminaire thématique Systèmes d’Information & Décision
1 ARCHITECTURE DACCÈS la méthode générale modèle de données définitions module daccès / modules métiers construction des modèles les modules daccès, les.
Structures collectives en Java
pour lancer la discussion
Les méthodes en java Une méthode est un regroupement d’instructions ayant pour but de faire un traitement bien précis. Une méthode pour être utilisée.
Boudouma Nedjma et Hoarau Ludovic
Détection de co-évolution de gènes Master 2 : Informatique à Finalité Professionnelle et Recherche Unifiée (IFPRU) Parcours Ingénierie de lIntelligence.
La phylogénomique sans alignement de séquences
UBLO Comparaison de génomes bactériens : questions méthodologiques autour de la définition du squelette et des boucles
Mémoires associatives
1.
Gestion de Fichiers GF-10: Traitement Co-Sequentiel: Appariment et Fusion de Plusieures Listes (Base sur les sections de Folk, Zoellick & Riccardi,
Approches non intrusives des éléments finis stochastiques
1 Modèles de particules Reeves, W. T., "Particle Systems - A technique for Modeling a Class of Fuzzy Objects," SIGGRAPH 83, Reeves, W. T., and.
Modèle neuromimètique de l’apprentissage par renforcement Les aspects temporels (réponse retardée) peuvent être facilement intégrés au niveau cortical.
Evaluation des incertitudes dans le recalage non rigide de formes Application à la segmentation avec ensemble apprentissage Maxime TARON Nikos PARAGIOS.
Energy optimization in a manufacturing plant Journée GOThA Ordonnancement avec contraintes d’énergie et/ou de ressources périssables LAAS-CNRS Toulouse.
Bases de Données Temporelles
1 Alain Casali Christian Ernst Extraction de Règles de Corrélation Décisionnelles 29 Janvier 2009.
Classification naturelle = phylogénie
Introduction à la Phylogénie
Complexité des Problèmes Combinatoires Module IAD/RP/RO/Complexité Philippe Chrétienne.
Requêtes homme-agent sur le fonctionnement Etudiantes: Anne DARME & Céline GIRARD Encadrant: Nicolas SABOURET Rapporteur: Vincent CORRUBLE Responsable:
Ranking the web frontier Nadav Eiron, Kevin S. McCurley, John A. Tomlin IBM Almaden Research Center Bah Thierno Madiou.
Formation Bio-informatique IRD
Rédaction des références bibliographiques
Analyses phylogénétiques
Familles de gènes Nadia El-Mabrouk.
1 JEUX DE TESTS la méthode générale modèle de données critères fonctionnels d’extractions jeux de données jeux de données avant tests sélection exécution.
1 Étudiants: Professeur: Salamin Nicolas Assistante: Maryam Zaheri.
L'approximation de jointure de documents XML Jean-Francois Lapalme Hugo Plante Leila Saddi INF7115 – 26 avril 2004.
Module « Epidémiologie »
1 INFOR 101 Chapitre 4 Marianne Morris. 2 Révision de chapitre 3 Algorithmes Sequential Search Selection Sort Binary Search Ordre de magnitude  (n) Mesurer.
Décomposition de graphes pour la reconstruction de réseaux phylogénétiques V. Berry (MAB) et C. Paul (VAG, HdR) Candidat AMN : Philippe Gambette (LIAFA)
1 Méthode de “Fast Marching” générique pour “Shape From Shading” E. Prados & S. Soatto RFIA 2006 janvier 2006, Tours.
Alignement de séquences biologiques
1 Programmation en C++ Marianne Morris. 2 Intro générale à la programmation On a déjà étudié le langage assembleur Langage de bas niveau Meilleur que.
Trajectory Tree [1] Patrick Cinq-Mars. © Name – Month YEAR2 / TOTAL PAGES TTree: Tree-Based State Generalization with Temporally Abstract Actions William.
INTERNET Le langage HTML
Reconnaissance de visage par vidéo
Inférence phylogénétique
Arbre = réseau connexe non cyclique
Verification approchée Michel de Rougemont, University Paris II et LRI.
21/02/2003DEA DISIC 1 Grid Computing Programming the grid: Distributed Software Components, P2P and Grid Web Services for Scientific Applications Tarak.
Bin Hiver 2005 Intégration biosciences/informatique Sylvie Hamel Département d’informatique et de recherche opérationnelle André-Aisenstadt: 3161.
Exploration immersive de données génomiques textuelles et factuelles
Ajouts et retraits dans un arbre de connexion Nicolas Thibault et Christian Laforest, Équipe OPAL Laboratoire IBISC (regroupement LaMI et LSC), Évry 8.
Détection des transferts horizontaux de gènes : modèles et algorithmes appliqués à l’évolution des espèces et des langues Alix Boc Université du Québec.
ANNEE UNIVERSITAIRE :2010/2011
Classification naturelle = phylogénie
Vers l’exploitation de grandes masses de données Encadré par : Mme L.Lamarini Présenté par: Rhaz Yassine Smiri Safae Un article de: Raphaeil Féraud,Maroc.
EXTRACTION D’ÉLÉMENTS CURVILIGNES GUIDÉE PAR DES MÉCANISMES ATTENTIONNELS POUR DES IMAGES DE TÉLÉDÉTECTION : APPROCHE PAR FUSION DE DONNÉES EXTRACTION.
A propos du “Minimal Controllability Problem” C. Commault Département Automatique Gipsa-Lab Grenoble –FRANCE 1 Séminaire GIPSA-Lab 22 octobre 2015.
Clique Percolation Method (CPM)
Algorithmes Branch & Bound Module IAD/RP/RO Master d ’informatique Paris 6 Philippe Chrétienne.
Applications des méthodes phylogénétiques en linguistique. Matthieu Willems 22 mars 2016.
Des statistiques descriptives et multi- variées aux statistiques de deuxième génération Séance 2.
Nadia Tahiri BIF7002 – Hiver 2017
Valérie Hay Université du Québec à Montréal 15 Janvier 2019 BIF7002
Transcription de la présentation:

La détection des transferts latéraux de gènes : les méthodes et leur application en biolinguistique Alix Boc Université du Québec à Montréal Bif7002 – Séminaire de Bioinformatique Well, this presentation is on the classification of IE languages using a phylogenetic network approach. We want to show that we can extract and show more information with this approach. This works has been done with the collaboration of the linguist Anna-Maria Di Scullio and under the supervision of Vladimir Makarenkov from the University of Quebec in Montreal BIF7002 – Séminaire de Bioinformatique Alix Boc

BIF7002 – Séminaire de Bioinformatique 2 Alix Boc Sommaire Détection des transferts latéraux de gènes Description Méthode Exemple Application à la Biolinguistique Références BIF7002 – Séminaire de Bioinformatique 2 Alix Boc

Inf7212 - Introduction aux systèmes informatiques Les arbres phylogénétiques Bif7002 - Séminaire Bioinformatique 3 Alix Boc

Inf7212 - Introduction aux systèmes informatiques L’arbre phylogénétique espèces Inf7212 - Introduction aux systèmes informatiques branches ancêtres virtuels racine Bif7002 - Séminaire Bioinformatique 4 Alix Boc

Définitions : reconstruction d’un arbre phylogénétique Alignement de séquences AAATGATCTGCGTCAATATTATAA GCCTGATCCTCACTACTGTCATCTTAA ATAGGGCCCGTATTTACCCTATAG AACTGGTCCACCCTTATACTAAAAGACGCCTCACTAGGAAGCTAA AACTGATCTGCTTCAATAATTTAA ClustalW (Higgins et ali., 1994)) DiAlign (Morgenstern, 1999) …. Distance Maximum de parcimonie Maximum de vraisemblance Approche Bayesienne AAATGATCTGCGTCAATATTA---------------------TAA GCCTGATCCTCACTA------------------CTGTCATCTTAA ATA---------------------GGGCCCGTATTTACCCTATAG AACTGGTCCACCCTTATACTAAAAGACGCCTCACTAGGAAGCTAA AACTGATCTGCTTCAATAATT---------------------TAA Projet de thèse 5 Alix Boc

Définitions : reconstruction d’un arbre phylogénétique Application d’un modèle d’évolution (méthodes de distances) 4 2 Uncorrected Distances Jukes Cantor Tajima Nei Kimura 2 parameters Tamura Jin-Nei Gamma …. Application d’une méthode de reconstruction (méthodes de distances) Neighbor Joining ADDTREE Unweighted Neighbor Joining Circular order reconstruction Weighted Least-squares BioNJ …. Projet de thèse 6 Alix Boc

Les modèles en réseau Bif7002 - Séminaire de Bioinformatique 7 Alix Boc

Définition : Les modèles en réseau Certains mécanismes d’évolution ne peuvent être représentés que par des modèles en réseau. 1 2 3 4 5 Le transfert horizontal de gènes (Hallett et Lagergren, 2001, Boc et Makarenkov, 2003) L’hybridation (Huson, 1998, Bryant et Moulton, 2004) L’homoplasie et la convergence de gènes (Legendre et Makarenkov, 2002) La duplication et la perte de gènes (Delwiche et Palmer, 1996) BIF7002 – Séminaire de Bioinformatique 8 Alix Boc

Définition : Le transfert horizontal de gène BIF7002 – Séminaire de Bioinformatique 9 Alix Boc

Quelques méthodes pour la detection de transferts horizontaux de gène Hein (1990) and Hein et al. (1995, 1996) Haseler and Churchill (1993) Page (1994); Page and Charleston (1998) Charleston (1998) Hallet and Lagergren (2001) Mirkin, Fenner, Galperin and Koonin (2003) V’yugin, Gelfand and Lyubetsky (2003) Boc and Makarenkov (2003); Makarenkov et al. (2006) C. Than, D. Ruths, and L. Nakhleh (2008) BIF7002 – Séminaire de Bioinformatique 10 Alix Boc

BIF7002 – Séminaire de Bioinformatique 11 Alix Boc Notre modèle Makarenkov et al. (2006) BIF7002 – Séminaire de Bioinformatique 11 Alix Boc

Détection des transferts complets Arbre d’espèces Arbre de gène (rbcL) Données : arbres phylogénétiques d’espèces et de gène sur le même ensemble d’espèces. Trouver : nombre minimal de déplacements de sous-arbres dans l’arbre d’espèces permettant de le transformer en l’arbre de gène (=> scénario de réconciliation). Contraintes : incorporer des règles biologiques et maintenir la complexité algorithmique polynomiale (le problème STP a été montré NP-complet par Hein et al., 1996). BIF7002 – Séminaire de Bioinformatique 12 Alix Boc

Exemples de règles biologiques Les transferts sur la même lignée sont interdits. Les transferts croisés sont interdits. BIF7002 – Séminaire de Bioinformatique 13 Alix Boc

Règles biologiques : contrainte temporelle Le transfert entre les branches (z,w) et (x,y) de l’arbre d’espèces T sera permis si et seulement si le sous-arbre regroupant les deux sous-arbres affectés et enraciné par la branche (z,b) dans T1 est présent dans l’arbre de gène. BIF7002 – Séminaire de Bioinformatique 14 Alix Boc

Critères d’optimisation La distance topologique de Robinson et Foulds (1981) entre deux arbres phylogénétiques est égale au nombre d’opérations élémentaires de fusion et de séparation de noeuds pour transformer un arbre en un autre. Ex : la distance de Robinson et Foulds entre les arbres T et T1 est égale à 2. Robinson et Foulds Moindres carrés (Least-squares) d(i,j) - distance entre i et j dans l’arbre d’espèces. (i,j) - distance entre i et j dans l’arbre de gène. Cette distance mesure la différence topologique entre deux tables de bipartition décrivant deux arbres et elle peut être définit comme suit  : où d(a,b) est la distance de Hamming entre les vecteurs de bipartition a et b ex: bd(T,T’)= ((2 + 1 + 2) + (2 + 1 + 1))/2 = 4.5. Distance de bipartition BIF7002 – Séminaire de Bioinformatique 15 Alix Boc

Transfert partiel versus transfert complet BIF7002 – Séminaire de Bioinformatique 16 Alix Boc

BIF7002 – Séminaire de Bioinformatique 17 Alix Boc Algorithme BIF7002 – Séminaire de Bioinformatique 17 Alix Boc

BIF7002 – Séminaire de Bioinformatique 18 Alix Boc Algorithme Begin Reconstruction of the species tree T and the gene tree T1 Reestimate the length of each branch in T While Optimization criterion > 0 loop Test all possible HGTs Compute the value of the optimization criterion Add the best HGT End Loop End BIF7002 – Séminaire de Bioinformatique 18 Alix Boc

BIF7002 – Séminaire de Bioinformatique 19 Alix Boc Algorithme : exemple L’exemple ci-dessous montre comment l’arbre d’espèces T et transformé en l’arbre de gène T1. 1 2 3 Scénario trouvé : 1 - transfert de A vers D 2 - transfert de E vers B 3 - transfert de C vers F À chaque transfert est associé la nouvelle valeur des moindres carrés, nouvelle distance de Robinson et Foulds et la nouvelle distance de bipartition. BIF7002 – Séminaire de Bioinformatique 19 Alix Boc

Résultat de HGT-Detection dans la version Web de T-Rex BIF7002 – Séminaire de Bioinformatique 20 Alix Boc

Validation Déterminer le pourcentage d’apparition de chaque THG pour plusieurs réplicats de l’arbre de gène. Les réplicats sont générés à partir des séquences. Le premier arbre de gène est la référence. … … arbre d’espèces Chaque transfert est pondéré par le nombre d’apparitions. n-1 réplicats de l’arbre de gène. n scénarios de réconciliation. BIF7002 – Séminaire de Bioinformatique 21 Alix Boc

BIF7002 – Séminaire de Bioinformatique 22 Alix Boc RÉFÉRENCES Boc, A. and Makarenkov, V. (2003), New Efficient Algorithm for Detection of Horizontal Gene Transfer Events, Algorithms in Bioinformatics, G. Benson and R. Page (Eds.), 3rd Workshop on Algorithms in Bioinformatics, Springer-Verlag, pp. 190-201. Delwiche, C.F., and J. D. Palmer (1996). Rampant Horizontal Transfer and Duplication of Rubisco Genes in Eubacteria and Plastids. Mol. Biol. Evol. 13:873-882. I. Dyen, I., Kruskal, J.B. and Black, P. (1997) Comparative IE Database Collected by Isidore Dyen, http://www.ntu.edu.au/education/langs/ielex/IE-RATE1. Gray, R.D. and Atkinson, Q.D. (2003) Language-tree divergence times support the Anatolian theory of Indo-European origin. Nature, 426:435-439. Levenshtein, V. I. (1966). Binary codes capable of correcting deletions, insertions, and reversals. Soviet Physics Doklady 10:707–710. Makarenkov,V. (2001), T-Rex: reconstructing and visualizing phylogenetic trees and reticulation networks. Bioinformatics, 17, 664-668. Makarenkov, V., Boc, A., Delwiche, C.F. and Philippe, H. (2006). New efficient algorithm for modeling partial and complete gene transfer scenarios. In V. Batagelj, H.-H. Bock, A. Ferligoj, and A. Ziberna, editors, IFCS 2006, Series: Studies in Classification, Data Analysis, and Knowledge Organization, Springer Verlag, pages 341--349. Matte-Tailliez O., Brochier C., Forterre P. & Philippe H. (2002). Archaeal phylogeny based on ribosomal proteins. Mol. Biol. Evol. 19, 631-639. Robinson, D.R. and Foulds L.R. (1981), Comparison of phylogenetic trees, Mathematical Biosciences 53, 131-147. Than, C. Ruths, D. and Nakhleh, L. (2008), PhyloNet: A Software Package for Analyzing and Reconstructing Reticulate Evolutionary Relationships. BMC Bioinformatics, 9:322. Woese, C. R., G. Olsen, M. Ibba, and D. Söll. 2000. Aminoacyl-tRNA synthetases, the genetic code, and the evolutionary process. Microbiol. Mol. Biol. Rev. 64:202-236. BIF7002 – Séminaire de Bioinformatique 22 Alix Boc