Gabrion Thomas 1
Sommaire I Présentation du LAPP - LAPTH II Contexte du stage III Réalisation du stage IV Bilan 2
I Présentation du LAPP - LAPTH 3
Créé en 1976, le LAPP est l'un des laboratoires de l'IN2P3, Institut National de Physique Nucléaire et de Physique des Particules, organisme public français dépendant du CNRS et de l’Université de Savoie. Le LAPP a l’objectif ambitieux de mettre à jour les constituants ultimes de la matière, les particules, d’établir la nature des interactions qui les lient et de comprendre les principes sous jacents à cette organisation. Laboratoire d'Annecy-le-Vieux de Physique des Particules 4
Installé au LAPP dès 1979, le LAPTH est une unité mixte de recherche CNRS/Université de Savoie et dépend du département "Sciences Physiques et Mathématiques" du CNRS. Trois axes principaux sont développés au sein du LAPTH : La physique des particules élémentaires La cosmologie/astrophysique des particules La physique mathématique Laboratoire d'Annecy-le-vieux de Physique Théorique 5
II Contexte du stage 6
Chercheurs : Feverati Giovanni (Mathématicien-Physicien) Lesieur Claire (Biologiste) Verkindt Didier (Physicien experimental) Service Informatique : Barbier Cécile Stagiaires : Gabrion Thomas Mottin Luc Vrhovac Ivan Présentation de l’équipe 7
Introduction à la biologie Un organisme vivant est composé de milliards de cellules. Une cellule est capable de créer des protéines afin de répondre à une fonction dont notre corps a besoin. Une protéine est constituée d’une chaine d’acides aminés. Un acide aminé n’est rien de plus qu’une molécule composée d’atomes. 8
Termes à connaitre : Segment : sous partie de la chaine d’acides aminés Région : deux segments en interaction Introduction à la biologie 9
Le but du projet est d’étudier les structures des protéines afin de comprendre leur fonctionnement. Ce qui permettrait de lutter contre des maladies comme Alzheimer ou Parkinson, car elles sont dues à un mauvais fonctionnement des protéines des cellules du cerveau. Présentation du projet 10
Les Fichiers PDB La banque de données sur les protéines (Protein Data Bank) est une collection mondiale de données sur la structure tridimensionnelle de macromolécules biologiques (protéines). 11
Les Fichiers Output Les fichiers Output sont les fichiers comprenant le résultat d’un programme écrit par un chercheur du LAPP : Feverati Giovanni Ce programme traite les données brutes des fichiers PDB afin d’en extraire des informations utiles dans les fichiers Outputs. 12
Ma mission Compléter la base de données à l’aide des fichiers PDB et Output Ecrire les requêtes permettant d’exploiter ces données 13
Schéma 14 PDB Programme de Giovanni Output Mon programme BDDPDB
Perl est optimisé pour l'extraction d'informations de fichiers textes. Utilisation du module DBI (DataBase Independent) pour communiquer avec la base de données. Le Perl 15
Connaissances limitées en biologie Fichiers PDB pas toujours conformes Mises à jour fréquentes du programme de Giovanni Contraintes 16
III Réalisation du stage 17
Mon programme Il lit chaque fichier Output puis extrait les données pour chaque protéines afin de les insérer dans la base de données. Il lit aussi les fichiers PDB pour compléter la base de données avec certaines informations manquantes dans les fichiers Output. 18
Modèle Conceptuel de Données 19
La Base de Données 20
La table des protéines 21
La table des segments 22
La table des acides aminés 23
La table des atomes 24
Les Requêtes Nombre d'acides aminés ARG dans les interfaces d'heptamères Pourcentage d'acides aminés polaires dans les segments de protéines de chaque stœchiométrie Les heptamères dont les segments d'interface ont plus de 3 acides aminés hydrophobes. 25
Pourcentage d'acides aminés polaires dans les segments des heptamères = 52% 26
IV Bilan 27
Première expérience professionnelle Apprentissage d’un nouveau langage Travail d’équipe positif Conclusion 28