Colloque Traitement et Analyse de séquences : compte-rendu

Slides:



Advertisements
Présentations similaires
Applications de GdX Coordinateur thématique : Christophe Cérin
Advertisements

Un aperçu de la bioinformatique moléculaire
Evaluation dheuristiques pour lalignement de séquences génomiques Stéphane Guyetant Séminaire Symbiose du 23/01/03.
Recherche de motifs par méthodes exploratoires: Comparaisons de performances et statistiques sur le score.
Introduction à l’Algorithmique
Reconnaissance de la parole
1. L’ADN et l’information génétique
Transcription de l’ADN
OBJECTIFS FouDanGA : Fouille de données pour lannotation de génomes dactinomycètes CONTEXTE Laccumulation des séquences.
Initiation à la bioinformatique
Le remplacement moléculaire
Recherche heuristique de similitudes dans les séquences dADN École Jeunes Chercheurs en Algorithmique et Calcul Formel Laurent Noé
ADN.
Sensibilité de graines espacées du type Subset seed Gregory Kucherov, Laurent Noé, Mikhaïl Roytberg LORIA (Nancy) 9-10 décembre 2004, Lille AS Indexation.
Comment obtenir un prix Nobel ?
Bioinformatique =?? génomique protéomique
YASS : Recherche de similarités dans les séquences d'ADN
ARN késako ? Julie BERNAUERAdrien GUILHOT-GAUDEFFROY Yann PONTYMireille REGNIER EQUIPE PROJET AMIB Inria Saclay 28 Septembre 2012.
1. L’ADN et l’information génétique
La phylogénomique sans alignement de séquences
BIO 2533 — Chapitre 1 Importance de la génétique et sa portée:
Le code génétique Biologie 122.
TP 5 Du génome au protéome
Alignement de séquences (suite)
UBLO Comparaison de génomes bactériens : questions méthodologiques autour de la définition du squelette et des boucles
CHAPITRE 19 - La génétique des populations
LA SYNTHÈSE DES PROTÉINES
La synthèse des protéines
L’arbre du vivant.
Révisions - IA Généralité: problèmes de lIA Recherche Logique Traitement de lincertitude Apprentissage Langue naturelle.
1.
Chapitre 3 Syntaxe et sémantique.
Cours des Acides Nucléiques
Mise en oeuvre des MMCs L'utilisation des MMCs en reconnaissance des formes s'effectue en trois étapes : définition de la topologie de la chaîne de Markov,
1 La détection de gènes impliqués dans les maladies multifactorielles Marie-Pierre Etienne ENGREF Laboratoire GRESE Statistique et Génome.
LA SYNTHÈSE DES PROTÉINES
LA REGULATION DE L’EXPRESSION DES GENES
Annotation de génomes complets
DDP Double Digest Problem présenté par Patrick Charbonneau Cours: IFT 6100 Université de Montréal.
Recherche heuristique dans les bases de données L’algorithme BLAST
Comment passer du gène (allèle): séquence spécifique de nucléotides
Génétique moléculaire
Chapitre 2 : l’expression du patrimoine génétique
"POLYMORPHISME" Plusieurs Formes
Scénario Quatre hommes entrent en collision un dans l'autre dans un ascenseur plein de personnes. En conséquence ils laissent tomber leurs téléphones cellulaires.
La génétique et la biométrie
Complexité des Problèmes Combinatoires Module IAD/RP/RO/Complexité Philippe Chrétienne.
Réunion MODULOME 28/05/2008 Christine ROUSSEAU L'analyse des CRISPR et des gènes associés comme répétitions locales et voisine MODULOME.
Quand la génétique s'en mêle.
Alignement de séquences biologiques
De l’ADN aux protéines.
Soutenance de Stage DEA / DESS
Recherche de motifs par projections aléatoires
STAN (Suffix Tree ANalyser) Un outil de recherche de motif dans les génomes Grégory Ranchy Anne-Sophie Valin 9 décembre 2004.
Protéine.
20/06/2015propagation de signatures lexicales dans le graphe du Web 1 Propagation de signatures lexicales dans le graphe du Web M. Bouklit M. Lafourcade.
OBJECTIFS FouDanGA : Fouille de données pour l’annotation de génomes d’actinomycètes CONTEXTE Mise en œuvre de méthodes.
ANNEE UNIVERSITAIRE :2010/2011
Biodiversité génétique
La génétique et la biométrie
Recherche heuristique dans les bases de données L’algorithme BLAST
Exercice L’EPISSAGE ALTERNATIF DE L’ARN
Introduction à la bioinformatique « Génomique Nouvelle Génération »
REGULATION DE L’EXPRESSION DES GENES
Introduction à la Bio-Informatique
Mais d’abord rappelez-vous!!
Régulation de l’expression génétique: la transcription
Les banques de séquences nucléiques
CHMI 4206 Bioinformatique appliquée
Bio-Informatique Analyse de séquences nucléotidiques
Transcription de la présentation:

Colloque Traitement et Analyse de séquences : compte-rendu Modèles aléatoires (+ stat) Statistiques de motifs (+ stat) Scores (+ stat) Alignements (+ info) Gènes/Annotation (+ bio) Répétitions (+ info) Protéines (+ bio) Algorithmes combinatoires (+ info) Génomes (+ bio)

Modèles aléatoires Significativité d’un événement (except ou hasard ?) => chaînes de Markov Détection de propriétés de structures => chaînes de Markov cachées (HMM) Grammaires formelles pondérées pour générer des séquences aléatoires (+ info)

Statistiques de motifs Fréquence - hétérogène/homogène, complexité/simplicité, codant/non codant Longueur - long des mots, répétitions, distance Description : expressions régulières, PROSITE,etc Calcul E et V apparition, nb occurrences, etc - math-stat + fonctions génératrices - algo de mots, autocorrélation (cf M. Régnier)

Scores Nucléotide (ou acide aminé) <=> score séquence <=> score global = somme scores séquence <=> score local = max scores des seq possibles Degré de signification d’un score : déterminer distrib proba du score => souvent dur, souvent asymptotique

Alignements Degré similarité, homologie, nb opérations d’édition Global / local => prog dynamique, heuristiques Parallélisation de prog dynamique alignement arbres / structures secondaires indexation de motifs pour alignements (??) Recombinaisons : graphes/cliques maximales

Gènes / Annotation Où sont les gènes ? Quelles sont leurs fonctions ? Procaryotes + facile, eucaryotes + dur Gène (ADN) => messager (ARNm, plusieurs alternatives) => protéine (plusieurs formes)

Méthode expérimentale : - cloner transcrit + séquencer + comparer avec ADN - fiable mais coûteuse et fastidieuse Méthodes informatiques : - rechercher similarité dans BDs - propriétés génériques des gènes (fct espèces) Validation : jeu de données propre !!!

Répétitions Algo recherche motifs à trous basé sur DAG Algo recherche répétitions (pas nb entier) Un autre basé sur oracle des facteurs

Protéines Alphabet structural pour décomposer la structure 3D des protéines => chaîne de Markov cachée… Site NPSA : sur protéines similarités, alignements, prédiction structures secondaires, … Threading : méthode de reconnaissance de repliements de protéines

Algorithmes combinatoires MF Sagot : cf son habilitation Génomes Définition profil basé sur structure secondaire, puis recherche motif dans le génome Technique des ondelettes = zoom

Rôle évolutif des systèmes de restriction et modification : fréquence de mots, chaîne de Markov maximale, palindrome,… Nature fractale des séquences d’ADN : technique des ondelettes Dernier ?