Un aperçu de la bioinformatique moléculaire A. Denise Bioinformatique LRI Orsay Université Paris-Sud 11
La cellule, unité du vivant
Les trois règnes primaires Procaryotes Archae Eucaryotes Bactéries
Les trois règnes primaires
Le dogme central ADN ARN Protéines Réplication Transcription Traduction Protéines
Transcription de l’ADN en ARN
Traduction de l’ARN en protéines
Au début était la séquence (d’ADN). 5’ 3’ Transparents à complexifier peut-être (zones régulatrices…). Première étape obligée de l’analyse d’un génome : faire l’inventaire aussi exhaustif que possible des informations qu’il contient. (Puis il faudra comprendre comment ces informations s’expriment, et les intégrer dans une vision dynamique du fonctionnement de la cellule) Je me bornerai à la première étape dans cet exposé. Faire l’inventaire du contenu génétique. Elucider la fonction de chaque élément.
Au début était la séquence (d’ADN). 5’ 3’ Promoteur Gène protéique ARNm Protéine transcription traduction ARNt ARNt ARNr Introns ... Transparents à complexifier peut-être (zones régulatrices…). Première étape obligée de l’analyse d’un génome : faire l’inventaire aussi exhaustif que possible des informations qu’il contient. (Puis il faudra comprendre comment ces informations s’expriment, et les intégrer dans une vision dynamique du fonctionnement de la cellule) Je me bornerai à la première étape dans cet exposé. Faire l’inventaire du contenu génétique. Elucider la fonction de chaque élément.
Séquences Inventaire Connaissances biologiques Evolution Algorithmique ORF = ATG [(A+C+G+T)3]* (TAA+TAC+TAG) Algorithmique Statistiques Inventaire
L’évolution nous aide ! Zones conservées
Mais la séquence n’est pas tout ! Par quels mécanismes l’information génétique s’exprime-t-elle ? Comment se structure-t-elle ? Comment participe-t-elle à la dynamique de la cellule ?
Structure des protéines
Structure de l’ARN
Dynamique de l’expression : facteurs de transcription Facteurs protéiques liant le promoteur, juste avant l'initiation de la transcription. Cas typique, mais nullement général, les facteurs de variant considérablement suivant les gènes et l'environnement. On connait plus de 2000 facteurs de transcription.
Régulation Gene network in the system of genes regulated by PPAR factors. Here and in Fig. 2, circles indicate proteins; rectangles show genes coding for these proteins. ACO, acyl-CoA oxidase; ACS, acyl-coenzyme A synthetase; poAI - apolipoprotein AI; apoCIII - apolipoprotein CIII; GR - glucocorticoid receptor; HD, Hydratase-dehydrogenase; HNF4, hepatocyte nuclear factor 4; PPAR - peroxisome proliferator activated receptor;
Réseaux de régulation
« Vue d’artiste » © Ebbe Sloth Andersen
Séquence Fonction Structure Régulation
Quelles sont les données ? Structure Interactome Transcriptome Génome Protéome Evolution Paillasse Données « haut débit »
Où sont les données ? Données : pléthoriques hétérogènes redondantes plus ou moins fiables contradictoires évolutives …
Nous (informaticiens) avons du travail en : Statistiques Algorithmique et combinatoire. Programmation logique et réseaux de contraintes. Optimisation. Model-checking. Inférence, apprentissage, classification, fouille de textes et extraction de connaissances. Analyse d’images. Visualisation, IHM. Intégration de données massives et hétérogènes. Grilles de calcul … GdR de Bioinformatique moléculaire : www.gdr-bim.u-psud.fr Société Française de Bioinformatique : www.sfbi.fr