Télécharger la présentation
Publié parNoëlle Leroy Modifié depuis plus de 7 années
1
elmousaoui mourad dalli mohammed bouzIane omar Prof. N. Boukhatem
UNIVERSITÉ MOHAMMED PREMIER FACULTÉ DES SCIENCES D'OUJDA MASTER DE PHYSIOLOGIE ET SANTÉ MODULE DE GÉNOMIQUE Outils bio-informatique ___pour l’études des___ ________génomes________ elmousaoui mourad dalli mohammed bouzIane omar Prof. N. Boukhatem
2
Plan : Chapitre 1 : introduction et généralité sur la bio-informatique
Histoire Définition de la bio-informatique et leur utilisation Chapitre 2 : les outils bio-informatique Data-base : Annotation : Prédiction des gènes Alignement de séquences
3
Pourquoi faire ce travail à la main??!!
Généralité Séquençage d’ADN Lecture de la succession des nucléotides Exp : E .coli séquençage de génome plus de 4 millions de lettres Recherche des gènes codants pour des protéines Pourquoi faire ce travail à la main??!!
4
Historique Années 2000 : Années 80 : Début de la micro-informatique
Création des premières bases de données (GENBANK) Années 90 : Développement de l’internet et des réseaux Apparition des logiciels de comparaison de séquences (FASTA, BLAST) Années 2000 : Consultation libre en ligne des bases de données Mutualisation des données avec les projets de séquençages de génomes.
5
Mathématiques formelles
La bioinformatique? Ensemble de méthodes, de logiciels et d’applications en ligne qui permettent de gérer, manipuler, et analyser des données biologiques. La bio-informatique met en jeu plusieurs champs disciplinaires : Mathématiques formelles Informatique Statistiques Biologie
6
Comment ça marche? Fournit des bases de données centrales, accessibles mondialement, qui permettent aux scientifiques de présenter, rechercher et analyser de l'information. Propose des logiciels d'analyse de données pour les études de données et les comparaisons Fournit des outils pour la modélisation, la visualisation, l'exploration et l'interprétation des données Fournit des outils de prédiction
7
Mieux comprendre phénomènes et processus biologiques
Ça sert à quoi ? stockage, traitement et analyse de grandes quantités de données de biologie. But: Mieux comprendre phénomènes et processus biologiques nouvelles découvertes scientifiques améliorer la qualité de vie des personnes malades la mise en place de nouveaux traitements médicaux plus efficaces.
8
A quelles questions répond la bio-informatique ?
visualiser les structures invisibles tels que les protéines , leur travail et leur fonction. comprendre les questions essentielles de la vie : Comment les organismes fonctionnent-ils ? Comment la vie s'est-elle développée ? Comment peuvent se développer de nouveaux traitements contre des maladies telles que le cancer ?
9
Chapitre 2:les outils bio-informatique
10
C’est quoi data base ? Ou « base de données »
DATA Base ou base de données est un ensemble bien structuré et bien organisée qi permettent le stockage d’une grande quantité d’informations à fin de faciliter le travail et l’utilisation dans la recherche ou dans certains analyses.
11
Genome browsers: bases de données qui nous donnent accès aux données du génome humain. En plus des données des séquences ils nous donnent accés aussi aux autres annotations comme (Gènes avec exon et intron, sites de fixation et aussi l’homologie).
12
Les plus populaires browsers :
-Ensembl : (European bioinformatics institute/ welcome trust sanger institute). -NCBI: National cancer for biology information. -UCSC: University of California santa cruz. Il existe d’autres browsers comme: (Vista, Genatlas, Argo...).
14
Annotations : L’annotation d’une séquence génomique peut être abordée à différents niveaux d’analyse, une première phase incontournable consistant à identifier les gènes de l’organisme, c’est-à-dire à trouver leur localisation précise sur la séquence du génome. Dans une seconde étape, on cherche ensuite à assigner une (ou plusieurs) fonction biologique à chacun de ces gènes. Cette seconde étape est généralement conduite par comparaison des séquences des gènes hypothétiques avec les séquences de gènes de fonction déjà connue.
15
L’annotation automatique
comparaison des séquences à annoter avec les séquences présentes dans les banques de données.
16
L’annotation manuelle
subdivisée en trois catégories : 1-Annotation syntaxique : appelé aussi annotation structurale qui permet de déterminé les éléments génomique d’intérêts. L’essentiel de ces régions sont les séquences codant des protéines et des molécules d’ARN et aussi les transposantS plus que les centromères. Dans ce cas en tente de prédire le contenue du gène leur localisation et aussi la région de lecture ouverte, sans oublier les introns et les exons. Comme cette technique nous permet aussi de connaitre l’organisation des gènes.
17
Annotation fonctionnelle : à pour but de prédire les fonctions préalable des gènes identifiés dans l’annotation syntaxique. (similitudes, sturctures). Annotation relationnelle : permet de déterminé les relations susceptibles exister entre les éléments caractérisés auparavant.
18
Annotation fonctionnelle : à pour but de prédire les fonctions préalable des gènes identifiés dans l’annotation syntaxique. (similitudes, sturctures). Annotation relationnelle : permet de déterminé les relations susceptibles exister entre les éléments caractérisés auparavant.
19
Prédiction des gènes Conditions de base :
20
Prédiction des gènes Conditions de base :
une région codante ne peut se situer qu'entre 2 Stop. Triplet STOP
21
Prédiction des gènes Conditions de base :
une région codante ne peut se situer qu'entre 2 Stop. distance minimale entre les 2 codons stop est requise pour coder une protéine suffisamment longue (par example ≈300 de nucléotides). Triplet STOP distance minimale
22
Prédiction des gènes Open Reading Frame (ORF) :
Si la distance entre 2 triplets stop consécutifs est supérieure au seuil Triplet STOP ORF
23
Prédiction des gènes Open Reading Frame (ORF) :
Si la distance entre 2 triplets stop consécutifs est supérieure au seuil une ORF (Open Reading Frame) rechercher le premier codon Start Triplet STOP ORF Triplet Start région codante prédite
24
Prédiction des gènes Open Reading Frame (ORF) :
Si la distance entre 2 triplets stop consécutifs est supérieure au seuil une ORF (Open Reading Frame) rechercher le premier codon Start Triplet STOP ORF région codante prédite
25
Prédiction des gènes RBS ‘ribosome binding site’ :
site de fixation du ribosome qui est toujours en amont de la région codant. Codon START Codon START RBS Triplet STOP Triplet STOP
26
Prédiction des gènes RBS ‘ribosome binding site’ :
site de fixation du ribosome qui est toujours en amont de la région codant. Nouveau codon START C’est RIEN! Nouvelle région codante prédite RBS Triplet STOP Triplet STOP
27
Prédiction des gènes RBS ‘ribosome binding site’ :
site de fixation du ribosome qui est toujours en amont de la région codant. au sein même d'un organisme ce motif n'est pas toujours conservé.
28
Prédiction des gènes RBS ‘ribosome binding site’ :
site de fixation du ribosome qui est toujours en amont de la région codant. au sein même d'un organisme ce motif n'est pas toujours conservé. certains gènes ne sont pas précédés de RBS.
29
Prédiction des gènes LA PRÉDICTION DE GÈNES DANS LES GÉNOMES EUCARYOTES: très longues régions intergéniques (exons constituent moins de 2 % de la longueur totale du génome)
30
Prédiction des gènes LA PRÉDICTION DE GÈNES DANS LES GÉNOMES EUCARYOTES: très longues régions inter-géniques. Les gènes sont interrompus par des introns. Les jonctions introns-exons doivent être prédites.
31
Prédiction des gènes LA PRÉDICTION DE GÈNES DANS LES GÉNOMES EUCARYOTES: très longues régions inter-géniques. Les gènes sont interrompus par des introns. Les jonctions introns-exons doivent être prédites. l'épissage alternatif.
32
Prédiction des gènes LA PRÉDICTION DE GÈNES DANS LES GÉNOMES EUCARYOTES: Motifs caractérisant les jonctions exon/intron
33
Prédiction des gènes LA PRÉDICTION DE GÈNES DANS LES GÉNOMES EUCARYOTES: Motifs caractérisant les jonctions exon/intron Données expérimentales ADN complémentaire (cDNA) cDNA ADN
34
Alignement de séquences
Représenter deux ou plusieurs séquences, les unes sous les autres pour comparer des séquences homologues, de longueur comparable, pour comparer un gène et l'ARNm repérer exons et introns.
35
Alignement de séquences
Pairwise Sequence Alignment: identifier des régions de similarité (relations fonctionnelles, structurelles et/ou évolutives) entre deux séquences biologiques (protéines ou acides nucléiques)
36
Alignement de séquences
Pairwise Sequence Alignment: Alignement global:( Needle; Stretcher …) Alignement local:( water; matcher ; LALIGN …) Alignement génomique :(Wise2DBA ; GeneWise ; PromoterWise…)
37
Alignement de séquences
Multiple Sequence Alignment (MSA): l'alignement de trois ou plusieurs séquences biologiques (protéines ou acide nucléique) d'une longueur similaire
38
Alignement de séquences
Clustal Omega programme d'alignement de séquences multiples.
39
Alignement de séquences
Clustal Omega programme d'alignement de séquences multiples. Résultats biologiquement significatives de séquences divergentes Les relations évolutives peuvent être vues via la visualisation de Cladogrammes ou Phylogrammes. Kalign, MAFFT, Mview, T-Coffee, WebPRANK…
40
Conclusion : Les prédictions bio-informatiques sont des prédictions!!! seuls les démarches expérimentales permettrons de confirmer ou infirmer ces prédiction
41
Merci pour votre attention
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.