Generating Random Genomic Sequences and Structures with GenRGenS Bonjour, je m’appelle Yann PONTY et je suis ici pour vous présenter GenRGenS, un logiciel développé parallèlement à ma thèse en collaboration avec Michel TERMIER et Alain DENISE. Yann Ponty – Michel Termier – Alain Denise Laboratoire de Recherche en Informatique - UMR 8623 - Orsay Institut de Génétique et Microbiologie - UMR 8621 - Orsay
Yann Ponty - Bioinformatique - LRI JOBIM'06 random sequences random sequences random sequences random sequences random sequences random sequences Voici 8 articles indexés par PubMed publiés en 2005-2006 dans des domaines très différents : Génétique des populations, biochimie, nanotechnologie, monde à ARN,etc … Ce que ces articles ont en commun, c’est l‘utilisation de séquences ou de structures aléatoires. random sequences random structures random sequences 14/11/2018 Yann Ponty - Bioinformatique - LRI JOBIM'06
Random sequences/structures : Why ? Significance ( P-value, Z-score … ) Sensibility of algorithms Thresholds for bioinformatic methods Algorithmic complexity Properties of null-models Experimental validation of models Probability for an observed phenomenon to happen under a given null hypothesis ? Probability for a heuristic detection algorithm to find its target ? Above which score do we investigate a finding ? Ces séquences ou structures peuvent jouer différents rôles, parmi lesquels : - Le calcul de significativité d’un phénomène observé - Evaluation de la sensibilité des algorithmes heuristiques - Calcul de seuil pour des méthodes bioinformatiques - Evaluation pratique de la relation taille des données/puissance de calcul nécessaire - Propriétés des modèles nuls - Et enfin la validation ultime d’un modèle pour un phénomène, qui consiste à engendrer des séquences décrites par le modèle puis de tester in vivo sur les séquences obtenue l’apparition du phénomène. What is the average relationship between the size of the input (sequence length, number of bases) and the time consumed by a program ? What remains to be explained and added to the model ? Perfect validation of a model : Generate from model and test in vivo ! 14/11/2018 Yann Ponty - Bioinformatique - LRI JOBIM'06
Models for random sequences Standard/Framed Markov/HMMs PROSITE Patterns Structures Regular Expressions Weighted Context Free Grammars Hierarchical Models G A G A U A C C G A U U G U G G U Face à un telle diversité de contextes d’applications, on dénombre plusieurs classes de modèles. Certaines privilégient des aspects séquentiels, comme les chaînes de Markov. Certaines permettent la modélisation de structures grâce à des mécanismes de réécritures successives. On engendre alors deux symboles dépendant au cours d’une étape, que les étapes ultérieures sépareront. On obtient alors des objets présentant à la fois des aspects séquentiels et des interactions longue portée. 14/11/2018 Yann Ponty - Bioinformatique - LRI JOBIM'06
Models for random sequences Standard/Framed Markov; HMMs PROSITE Patterns Structures Regular Expressions Weighted Context Free Grammars Hierarchical Models G A G A U A C C G A U U G U G G U Ce qui est une propriété qu’on peut souhaiter d’un modèle pour la structure secondaire d’ARN, par exemple. 14/11/2018 Yann Ponty - Bioinformatique - LRI JOBIM'06
Want to know more about random generation and the way GenRGenS performs its task ? Meet us at poster #68 !!! Or visit GenRGenS homepage: Tous ces modèles sont pris en charge par GenRGens, un logiciel dédié à la génération aléatoire de séquences génomiques … … que je vous invite à découvrir au poster 68 où nous serons ravis de vous fournir des renseignements, ou sur la page d’accueil du logiciel, que vous trouverez à l’adresse indiquée dans les actes. Merci de votre attention. http://www.lri.fr/~genrgens Thank you for your attention ! 14/11/2018 Yann Ponty - Bioinformatique - LRI JOBIM'06