Projet GenoTo3D Apprentissage automatique appliqué à la prédiction de la structure tertiaire des protéines GenoTo3D Guermeur Y 1, Benabdelsem K 2, Bréhélin.

Slides:



Advertisements
Présentations similaires
Modèles de Markov Cachés (HidenMarkovModel)
Advertisements

Le centre d’intérêt, un concept pour structurer les apprentissages
Apprentissage supervisé à partir de séquences
Nicolas Terrapon Olivier Gascuel 26/03/2017 Laurent Bréhélin
Illustration élémentaires des filtres particulaires utiliser pleinement la puissance de calcul des ordinateurs pour contourner les limitation des approches.
A L I M E N T A T I O N A G R I C U L T U R E E N V I R O N N E M E N T.
RPM - Reconnaissance de la Parole Multilingue - Un début de Parcours -
Reconnaissance de la parole
Reconnaissance Automatique de la Parole
Reconnaissance Automatique de la Parole
Pons Nicolas, Jean-Michel Batto, S.Dusko Ehrlich, Pierre Renault
Paris F-RO /1/98 De lemploi de modèles pour explorer de nouvelles stratégies de conduite de culture : application à la conduite du blé M.H. Chatelin.
OBJECTIFS FouDanGA : Fouille de données pour lannotation de génomes dactinomycètes CONTEXTE Laccumulation des séquences.
Audition CNRS pour le poste 44/04 au LOCEAN
Colloque Traitement et Analyse de séquences : compte-rendu
Master Génie Biologique et Informatique, première année
Présentation de l’enseignement de « Gestion et Information » Présentation conçue par : Sophie Da Costa Philippe Louchet Éric Noël Marie-Claude Rialland.
Structure des protéines, Transcription, Traduction, Code Génétique,
« Modélisation du cycle du carbone et impact climatique »
Reconnaissance de la parole
Data Mining: Définition
Bioinformatique =?? génomique protéomique
INTELLIGENCE COLLECTIVE : RENCONTRES 2006Nîmes mai 2006 CENTRE DE RECHERCHE LGI2P 1- Doctorante Ecole des mines de Paris, 2- Maitre de Conférences.
Caractérisation structurale d ’un régulateur transcriptionnel du « Quorum Sensing » chez Brucella abortus.
Yoann Beausse Journée Bioinformatique des Génopoles
Exploitation du modèle holonique dans un cadre combinant IAD et IHM
Décodage des informations
Champs de Markov cachés pour la classification de gènes..
Groupe Béna Parallélisme entre la structure de l’information dans le code génétique et dans l’arithmétique Alain Bruyère Alain Bruyère.
Froduald Kabanza Département d’informatique Université de Sherbrooke
Maîtrise des risques et sûreté de fonctionnement – Avignon – 6-10 Octobre 2008 Modélisation des dysfonctionnements dun système dans le cadre dactivités.
Biologie 1S - introduction
UBLO Comparaison de génomes bactériens : questions méthodologiques autour de la définition du squelette et des boucles
La Bioinformatique à Nancy
Reconnaissance Vocale
Bioinformatique et Biologie Structurale I/ – Principes et techniques A/ Linformation structurale B/ Les différentes techniques de détermination de structure.
Présentation du mémoire
Protéines.
L’arbre du vivant.
Apprentissage semi-supervisé
Démographie d'entreprises sur la base des chaînes de Markov: une application aux données belges François COPPENS Fabienne VERDUYN Direction Analyse Micro-économique.
La recherche d’information en bioinformatique
RECONNAISSANCE DE FORMES
Mise en oeuvre des MMCs L'utilisation des MMCs en reconnaissance des formes s'effectue en trois étapes : définition de la topologie de la chaîne de Markov,
Jean Dubé CRDT, Université du Québec à Rimouski Mars 2012
Activités développées RTP 12 : Information et connaissance : "découvrir et résumer" Actions spécifiques et équipes-projets associées Objectifs thématiques.
Avignon, 14 novembre 2006http://biobimo.eurecom.fr Sous-Projet 4 : Segmentation et Authentification conjointes de la voix et du visage Etat de l’art -
Modèle neuromimètique de l’apprentissage par renforcement Les aspects temporels (réponse retardée) peuvent être facilement intégrés au niveau cortical.
Amélioration de la simulation stochastique
Ministère de l’Enseignement Supérieur et de la Recherche Scientifique
Protéines: Structure tertiaire
Christelle Scharff IFI 2004
Arkhênum Patrimoine du Futur. Répartitions par types d’erreurs mineures.
Les processus métiers : concepts, modèles et systèmes Claude Godart Université de lorraine. Esstin
L’Union Européenne et la Gestion Intégrée des Zones Côtières
Protéine.
Knowledge discovery in Databases (KDD)
References [1] S.D. Bentley et al., Complete genome sequence of the model actinomycete Streptomyces coelicolor A3(2), Nature, 2002, 417, [2] K.
Changement de représentation et alignement de séquences. Hugues DELALIN Encadrement: E. Mephu Nguifo.
OBJECTIFS FouDanGA : Fouille de données pour l’annotation de génomes d’actinomycètes CONTEXTE Mise en œuvre de méthodes.
PAA 1140 Biochimie vétérinaire, cours 9
Traitements d'images et Vision par ordinateur
DES Premièrement, il faut une matière maniable qui se prête aux repliements … L’origami est l’art noble du pliage du papier. Car celle-ci peu plier ceci…
Présentation du système
Conférences (CR) PACLING'03 Pacific Association for Computational LINGuistics 22 au 25 août 2003 Halifax, côte Est Canada RANLP Recent Advances in Natural.
CHMI 4206 Bioinformatique appliquée
Comment une protéine se reploie t’elle?. Folding Probability An n-residue protein’s 2 n torsion angles (  &  ) have 3 stable conformations: –3 2n (~
Modélisation algébrique des arbres de défaillance dynamiques, contribution aux analyses qualitative et quantitative Guillaume Merle Thèse soutenue à l’ENS.
Gabrion Thomas 1. Sommaire I Présentation du LAPP - LAPTH II Contexte du stage III Réalisation du stage IV Bilan 2.
Generating Random Genomic Sequences and Structures with GenRGenS
Transcription de la présentation:

Projet GenoTo3D Apprentissage automatique appliqué à la prédiction de la structure tertiaire des protéines GenoTo3D Guermeur Y 1, Benabdelsem K 2, Bréhélin L 3, Capponi C 4, Coste F 6, Darcy Y 1, Deléage G 2, Denis F 4, Gascuel O 3, Geourjon C 2, Gibrat JF 5, Jacquemin I 6, Magnan C 4, Marin A 5, Martin J 5, Monfrini E 1, Nicolas J 6, Ralaivola L 4, Taly JF 5 1 : LORIA-Nancy, 2 : IBCP-Lyon, 3 : LIRMM-Montpellier, 4 : LIF-Marseille, 5 : MIG-Jouy en Josas, 6 : IRISA-Rennes La prédiction est améliorée grâce aux séquences homologues. Les contributions des séquences homologues sont combinées avec les pondération de Henikoff. Le taux de bonne prédiction atteint ainsi 76%. La même méthodologie appliquées aux zones d’angles permet d’atteindre un taux de prédiction de 78%. Prédiction des ponts disulfures Notre objectif est de prédire la structure locale en terme de structure secondaires (hélices a, brins b, boucles) et de zones d’angles dièdres Phi/Psi qui apportent une information sur la structure des boucles. La structure locale de la protéine constitue le processus caché du modèle de chaîne de Markov caché (HMM) avec une mémoire d’ordre 1. La séquence de la protéine est le processus observé. Les acides aminés sont émis indépendamment conditionnellement à la structure locale. Chaque classe structurale est modélisée par un ensemble d’états cachés. Deux stratégies ont été mises en place pour construire ces modèles :  Modélisation des structures secondaires à partir d’a priori biologiques (modélisation des hélices amphiphiles) et d’une étude des mots exceptionnels dans les brins.  -Choix du nombre d’états cachés selon des critères de performance et le critère BIC HMM à 21 états cachés. Les états carrés privilégient les résidus polaires, les états héxagonaux les résidus hydrophobes. Le taux de bonne prédiction obtenu est de 65%. HMM à 36 états cachés. Seules les transitions les plus probables sont indiquées. Le taux de bonne prédiction obtenue est de 68%. Prédiction de la structure locale des protéines Approche hiérarchique de la prédiction de la structure secondaire Apprentissage à partir des cœurs structuraux Modèles discriminants et génératifs pour l’intégration d’informations de bas et haut niveau Modélisation probabiliste des appariements d'acides aminés autours des cystéines Prédiction des ponts disulfures par PLI Protocole pour détecter la présence d’information locale pour la prédiction de contacts entre acides aminés Références - Ingrid Jacquemin. Découverte de motifs relationnels en bioinformatique : application à la prédiction des ponts disulfures. Thèse de doctorat de l’Université Rennes 1, Ingrid Jacquemin & Jacques Nicolas. Modélisation de cystéines oxydées à l’aide de la programmation logique inductive. JOBIM, Lyon, juillet 2005, Juliette Martin, Jean-François Gibrat & François Rodolphe. HMM for local protein structure. ASMDA, Brest, mai 2005, Juliette Martin, Jean-François Gibrat & François Rodolphe. How to choose the optimal hidden Markov model for protein secondary structure prediction. IEEE Intelligent Systems, Special issue on Data Mining for Bioinformatics, accepté, à paraître en novembre/décembre Khalid Benabdeslem, Christophe Geourjon, Yann Guermeur & Nicolas Sapay. Apprentissage automatique, application à la prédiction de la structure secondaire et tertiaire des protéines. Communication sur invitation présentée dans la session thématique : Bioinformatique II, ASTI, Clermont-Ferrand, octobre Khalid Benabdeslem, Gilbert Deléage & Christophe Geourjon. A neural network system based on structural alignment and clustering for proteins fold recognition. ECCB, Madrid, septembre 2005, Khalid Benabdeslem, Gilbert Deléage & Christophe Geourjon. Cores extraction based neural network model for proteins fold recognition. JOBIM, Lyon, juillet 2005, Yann Guermeur, A Lifchitz & Régis Vert. A kernel for protein secondary structure prediction. In «Kernel Methods in Computational Biology», Editors : B. Schölkopf, K. Tsuda & Jean-Philippe Vert, The MIT Press, 2004,