elmousaoui mourad dalli mohammed bouzIane omar Prof. N. Boukhatem

Slides:



Advertisements
Présentations similaires
Initiation à la bioinformatique
Advertisements

LA SYNTHÈSE DES PROTÉINES
La banque UniprotKB et le logiciel Blast
Introduction à la Bio-Informatique
Mais d’abord rappelez-vous!!
Les banques de séquences nucléiques
CHMI 4206 Bioinformatique appliquée
CHMI 4206 Bioinformatique appliquée
Bio-Informatique Analyse de séquences nucléotidiques
BIO-INFORMATIQUE Analyse de séquences nucléotidiques - séance n°1 Illustration:
Chapitre 18 L’ADN (acide désoxyribonucléique) la molécule d’acide nucléique qui dirige le processus de l’hérédité de toutes les cellules eucaryotes.
Bibliothèque Centrale de l’École Polytechnique Session pratique Recherches documentaires en sciences dures PSC 2011 septembre/octobre 2011 Denis Roura,
TP3 – Évolution et conservation de motifs Hypothèse: Les gènes et les protéines évoluent continuellement pour permettre l’évolution et l’adaptation des.
Adopter le KM mix pour obtenir ou renforcer le leadership Préparé par: Ilham ELKORCHI Meriem NASIRI Mohammed BENMRAH Encadré par: Ouidad AMRANI.
Présentation du programme
L’EPISSAGE ALTERNATIF DE L’ARN
Collège Lionel-Groulx
Formation relative à la ligne directrice GD211
Rechercher des articles et des sites web
Rechercher des livres et des DVD
L’art de dialoguer avec un texte
Master II BioInfo - Galaxy – Session Décembre 2016
Ce videoclip produit par l’Ecole Polytechnique Fédérale de Lausanne
Les chromosomes Dr K Sifi Faculté de médecine UC3
Parrainage BIOINFORMATIQUE
Plateforme CountrySTAT
Base de données: Généralité IFT6800 Jian-Yun Nie.
Images et morphogenèse végétale
Collège Lionel-Groulx
Plans d’experiences : plans de melanges
FICHE METHODOLOGIE 1 Spécificités des données et des informations à caractère sanitaire et social.
Les répétitions en tandem et l ’étude des génomes
– La communication : notions de base. – INTRODUCTION : QU’EST-CE QUE LA COMMUNICATION ? I/ LES DIFFÉRENTS TYPES DE COMMUNICATION II/ LES COMPOSANTES DE.
Initiation à l’informatique Généralités et Définitions Université de Tébessa 1 ère Année MI Y. MENASSEL.
Ecole supérieure privée d’ingénierie et de technologie Année Universitaire Projet: EFQM Réalisé Par: kbada Haythem Bchir Ahmed Znaidi Maher.
République Algérienne Démocratique et Populaire Ministère de l'Enseignement Supérieur et de la Recherche Scientifique Université Saad.
Méthodologie de la recherche Programme du module.
1 Internet Elaboré par :. 2 Introduction L’histoire Fonctionnement d’internet L’utilité d’internet Les avantages d’internet Les inconvénient d’internet.
REVUE DE LITTERATURE. Introduction Première partie majeure dans la rédaction du mémoire, la réalisation d’une revue de littérature consiste à effectuer.
T HÈME 4 : L ES SYSTÈMES VIVANTS CONTIENNENT, ÉCHANGENT ET UTILISENT DE L ' INFORMATION GÉNÉTIQUE.
la structure de l’entreprise: Définition : La structure organisationnelle d’une entreprise définie le mode d’organisation entre les différentes unités.
Les applications de groupware
La stratégie pédagogique en
Hajri khalil Seyah mohamed Aziz El aid Oussama Mejri abir
Note 1 : Tous les rapports de T. P
– La communication notions de base. – INTRODUCTION : QU’EST-CE QUE LA COMMUNICATION ? I/ LES DIFFÉRENTS TYPES DE COMMUNICATION II/ LES COMPOSANTES DE.
Projet de communication n°2
Royaume de Maroc Université Hassan Premier Settat Faculté des Sciences et Techniques de Settat LA CLASSIFICATION K-MEANS SOUS R /MATLAB Master :Automatique.
Chapitre2: SGBD et Datawarehouse. On pourrait se demander pourquoi ne pas utiliser un SGBD pour réaliser cette structure d'informatique décisionnelle.
Le programme génétique d’un individu est contenu dans le noyau des cellules.
Présentation de la base Frantext
LA SYNTHÈSE DES PROTÉINES
L’EPISSAGE ALTERNATIF DE L’ARN
Expression du Génome Le transcriptome.
La transcription.
L’ADN et les Traits.
Data Mining Fait par : Belhaj Nadia Derouich Maryem.
SUJET : E C L A T UNIVERSITE GASTON BERGER DE SAINT LOUIS UFR DES SCIENCES APPLIQUEES ET DE TECHNOLOGIE MASTER PROFESSIONNEL EN DÉVELOPPEMENT DE SYSTÈMES.
Moteurs de recherches Data mining Nizar Jegham.
Roowth 1 Université d'Adrar Faculté des Sciences et de la Technologie Département des Mathématiques et Informatique 1 er Année master : Informatique Option:
NUTRITION ET EXPRESSION GENETIQUE (NUTRIGENOMIQUE) présentée par: kebaili Imene Année universitaire: 2018/2019.
Expression du Génome Le transcriptome.
Tableau de bord d’un système de recommandation
L’outil bio-informatique pour la génomique structurale
4.2 L’importance de l’ADN.
Concepts et étapes Ateliers de formation à la mise en œuvre
Nouveau programme SES Seconde
La transcription.
Transcription de la présentation:

elmousaoui mourad dalli mohammed bouzIane omar Prof. N. Boukhatem UNIVERSITÉ MOHAMMED PREMIER FACULTÉ DES SCIENCES D'OUJDA MASTER DE PHYSIOLOGIE ET SANTÉ MODULE DE GÉNOMIQUE Outils bio-informatique ___pour l’études des___ ________génomes________ elmousaoui mourad dalli mohammed bouzIane omar Prof. N. Boukhatem

Plan : Chapitre 1 : introduction et généralité sur la bio-informatique Histoire Définition de la bio-informatique et leur utilisation Chapitre 2 : les outils bio-informatique Data-base : Annotation : Prédiction des gènes Alignement de séquences

Pourquoi faire ce travail à la main??!! Généralité Séquençage d’ADN Lecture de la succession des nucléotides Exp : E .coli séquençage de génome plus de 4 millions de lettres Recherche des gènes codants pour des protéines Pourquoi faire ce travail à la main??!!

Historique Années 2000 : Années 80 : Début de la micro-informatique Création des premières bases de données (GENBANK) Années 90 : Développement de l’internet et des réseaux Apparition des logiciels de comparaison de séquences (FASTA, BLAST) Années 2000 : Consultation libre en ligne des bases de données Mutualisation des données avec les projets de séquençages de génomes.

Mathématiques formelles La bioinformatique? Ensemble de méthodes, de logiciels et d’applications en ligne qui permettent de gérer, manipuler, et analyser des données biologiques. La bio-informatique met en jeu plusieurs champs disciplinaires : Mathématiques formelles Informatique Statistiques Biologie

Comment ça marche? Fournit des bases de données centrales, accessibles mondialement, qui permettent aux scientifiques de présenter, rechercher et analyser de l'information. Propose des logiciels d'analyse de données pour les études de données et les comparaisons Fournit des outils pour la modélisation, la visualisation, l'exploration et l'interprétation des données Fournit des outils de prédiction

Mieux comprendre phénomènes et processus biologiques Ça sert à quoi ? stockage, traitement et analyse de grandes quantités de données de biologie. But: Mieux comprendre phénomènes et processus biologiques nouvelles découvertes scientifiques améliorer la qualité de vie des personnes malades la mise en place de nouveaux traitements médicaux plus efficaces.

A quelles questions répond la bio-informatique ? visualiser les structures invisibles tels que les protéines , leur travail et leur fonction. comprendre les questions essentielles de la vie : Comment les organismes fonctionnent-ils ? Comment la vie s'est-elle développée ? Comment peuvent se développer de nouveaux traitements contre des maladies telles que le cancer ?

Chapitre 2:les outils bio-informatique

C’est quoi data base ? Ou « base de données » DATA Base ou base de données est un ensemble bien structuré et bien organisée qi permettent le stockage d’une grande quantité d’informations à fin de faciliter le travail et l’utilisation dans la recherche ou dans certains analyses.

Genome browsers: bases de données qui nous donnent accès aux données du génome humain. En plus des données des séquences ils nous donnent accés aussi aux autres annotations comme (Gènes avec exon et intron, sites de fixation et aussi l’homologie).

Les plus populaires browsers : -Ensembl : (European bioinformatics institute/ welcome trust sanger institute). -NCBI: National cancer for biology information. -UCSC: University of California santa cruz. Il existe d’autres browsers comme: (Vista, Genatlas, Argo...).

Annotations : L’annotation d’une séquence génomique peut être abordée à différents niveaux d’analyse, une première phase incontournable consistant à identifier les gènes de l’organisme, c’est-à-dire à trouver leur localisation précise sur la séquence du génome. Dans une seconde étape, on cherche ensuite à assigner une (ou plusieurs) fonction biologique à chacun de ces gènes. Cette seconde étape est généralement conduite par comparaison des séquences des gènes hypothétiques avec les séquences de gènes de fonction déjà connue.

L’annotation automatique comparaison des séquences à annoter avec les séquences présentes dans les banques de données.

L’annotation manuelle subdivisée en trois catégories : 1-Annotation syntaxique : appelé aussi annotation structurale qui permet de déterminé les éléments génomique d’intérêts. L’essentiel de ces régions sont les séquences codant des protéines et des molécules d’ARN et aussi les transposantS plus que les centromères. Dans ce cas en tente de prédire le contenue du gène leur localisation et aussi la région de lecture ouverte, sans oublier les introns et les exons. Comme cette technique nous permet aussi de connaitre l’organisation des gènes.

Annotation fonctionnelle : à pour but de prédire les fonctions préalable des gènes identifiés dans l’annotation syntaxique. (similitudes, sturctures). Annotation relationnelle : permet de déterminé les relations susceptibles exister entre les éléments caractérisés auparavant.

Annotation fonctionnelle : à pour but de prédire les fonctions préalable des gènes identifiés dans l’annotation syntaxique. (similitudes, sturctures). Annotation relationnelle : permet de déterminé les relations susceptibles exister entre les éléments caractérisés auparavant.

Prédiction des gènes Conditions de base :

Prédiction des gènes Conditions de base : une région codante ne peut se situer qu'entre 2 Stop. Triplet STOP

Prédiction des gènes Conditions de base : une région codante ne peut se situer qu'entre 2 Stop. distance minimale entre les 2 codons stop est requise pour coder une protéine suffisamment longue (par example ≈300 de nucléotides). Triplet STOP --------------distance minimale-------------

Prédiction des gènes Open Reading Frame (ORF) : Si la distance entre 2 triplets stop consécutifs est supérieure au seuil Triplet STOP ----------------------ORF-------------------

Prédiction des gènes Open Reading Frame (ORF) : Si la distance entre 2 triplets stop consécutifs est supérieure au seuil une ORF (Open Reading Frame) rechercher le premier codon Start Triplet STOP ----------------------ORF------------------- Triplet Start ----------région codante prédite----------

Prédiction des gènes Open Reading Frame (ORF) : Si la distance entre 2 triplets stop consécutifs est supérieure au seuil une ORF (Open Reading Frame) rechercher le premier codon Start Triplet STOP ----------------------ORF------------------- ----------région codante prédite----------

Prédiction des gènes RBS ‘ribosome binding site’ : site de fixation du ribosome qui est toujours en amont de la région codant. Codon START Codon START RBS Triplet STOP Triplet STOP

Prédiction des gènes RBS ‘ribosome binding site’ : site de fixation du ribosome qui est toujours en amont de la région codant. Nouveau codon START C’est RIEN! Nouvelle région codante prédite RBS Triplet STOP Triplet STOP

Prédiction des gènes RBS ‘ribosome binding site’ : site de fixation du ribosome qui est toujours en amont de la région codant. au sein même d'un organisme ce motif n'est pas toujours conservé.

Prédiction des gènes RBS ‘ribosome binding site’ : site de fixation du ribosome qui est toujours en amont de la région codant. au sein même d'un organisme ce motif n'est pas toujours conservé. certains gènes ne sont pas précédés de RBS.

Prédiction des gènes LA PRÉDICTION DE GÈNES DANS LES GÉNOMES EUCARYOTES: très longues régions intergéniques (exons constituent moins de 2 % de la longueur totale du génome)

Prédiction des gènes LA PRÉDICTION DE GÈNES DANS LES GÉNOMES EUCARYOTES: très longues régions inter-géniques. Les gènes sont interrompus par des introns. Les jonctions introns-exons doivent être prédites.

Prédiction des gènes LA PRÉDICTION DE GÈNES DANS LES GÉNOMES EUCARYOTES: très longues régions inter-géniques. Les gènes sont interrompus par des introns. Les jonctions introns-exons doivent être prédites. l'épissage alternatif.

Prédiction des gènes LA PRÉDICTION DE GÈNES DANS LES GÉNOMES EUCARYOTES: Motifs caractérisant les jonctions exon/intron

Prédiction des gènes LA PRÉDICTION DE GÈNES DANS LES GÉNOMES EUCARYOTES: Motifs caractérisant les jonctions exon/intron Données expérimentales ADN complémentaire (cDNA) cDNA ADN

Alignement de séquences Représenter deux ou plusieurs séquences, les unes sous les autres pour comparer des séquences homologues, de longueur comparable, pour comparer un gène et l'ARNm repérer exons et introns.

Alignement de séquences Pairwise Sequence Alignment: ------------------------------------------------ identifier des régions de similarité (relations fonctionnelles, structurelles et/ou évolutives) entre deux séquences biologiques (protéines ou acides nucléiques).------------------------------------ ------------------------------------------------

Alignement de séquences Pairwise Sequence Alignment: Alignement global:( Needle; Stretcher …) Alignement local:( water; matcher ; LALIGN …) Alignement génomique :(Wise2DBA ; GeneWise ; PromoterWise…)

Alignement de séquences Multiple Sequence Alignment (MSA): ------------------------------------------------ l'alignement de trois ou plusieurs séquences biologiques (protéines ou acide nucléique) d'une longueur similaire------------------------------------- -------------------------------------------------------

Alignement de séquences Clustal Omega programme d'alignement de séquences multiples.

Alignement de séquences Clustal Omega programme d'alignement de séquences multiples. Résultats biologiquement significatives de séquences divergentes Les relations évolutives peuvent être vues via la visualisation de Cladogrammes ou Phylogrammes. Kalign, MAFFT, Mview, T-Coffee, WebPRANK…

Conclusion : ------------------------------------------------ Les prédictions bio-informatiques sont des prédictions!!! seuls les démarches expérimentales permettrons de confirmer ou infirmer ces prédiction

Merci pour votre attention