La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Colloque Traitement et Analyse de séquences : compte-rendu

Présentations similaires


Présentation au sujet: "Colloque Traitement et Analyse de séquences : compte-rendu"— Transcription de la présentation:

1 Colloque Traitement et Analyse de séquences : compte-rendu
Modèles aléatoires (+ stat) Statistiques de motifs (+ stat) Scores (+ stat) Alignements (+ info) Gènes/Annotation (+ bio) Répétitions (+ info) Protéines (+ bio) Algorithmes combinatoires (+ info) Génomes (+ bio)

2 Modèles aléatoires Significativité d’un événement (except ou hasard ?) => chaînes de Markov Détection de propriétés de structures => chaînes de Markov cachées (HMM) Grammaires formelles pondérées pour générer des séquences aléatoires (+ info)

3 Statistiques de motifs
Fréquence - hétérogène/homogène, complexité/simplicité, codant/non codant Longueur - long des mots, répétitions, distance Description : expressions régulières, PROSITE,etc Calcul E et V apparition, nb occurrences, etc - math-stat + fonctions génératrices - algo de mots, autocorrélation (cf M. Régnier)

4 Scores Nucléotide (ou acide aminé) <=> score
séquence <=> score global = somme scores séquence <=> score local = max scores des seq possibles Degré de signification d’un score : déterminer distrib proba du score => souvent dur, souvent asymptotique

5 Alignements Degré similarité, homologie, nb opérations d’édition
Global / local => prog dynamique, heuristiques Parallélisation de prog dynamique alignement arbres / structures secondaires indexation de motifs pour alignements (??) Recombinaisons : graphes/cliques maximales

6 Gènes / Annotation Où sont les gènes ? Quelles sont leurs fonctions ?
Procaryotes + facile, eucaryotes + dur Gène (ADN) => messager (ARNm, plusieurs alternatives) => protéine (plusieurs formes)

7 Méthode expérimentale : - cloner transcrit + séquencer + comparer avec ADN - fiable mais coûteuse et fastidieuse Méthodes informatiques : - rechercher similarité dans BDs - propriétés génériques des gènes (fct espèces) Validation : jeu de données propre !!!

8 Répétitions Algo recherche motifs à trous basé sur DAG
Algo recherche répétitions (pas nb entier) Un autre basé sur oracle des facteurs

9 Protéines Alphabet structural pour décomposer la structure 3D des protéines => chaîne de Markov cachée… Site NPSA : sur protéines similarités, alignements, prédiction structures secondaires, … Threading : méthode de reconnaissance de repliements de protéines

10 Algorithmes combinatoires
MF Sagot : cf son habilitation Génomes Définition profil basé sur structure secondaire, puis recherche motif dans le génome Technique des ondelettes = zoom

11 Rôle évolutif des systèmes de restriction et modification : fréquence de mots, chaîne de Markov maximale, palindrome,… Nature fractale des séquences d’ADN : technique des ondelettes Dernier ?


Télécharger ppt "Colloque Traitement et Analyse de séquences : compte-rendu"

Présentations similaires


Annonces Google