Soutenu par : Cédric Bonnier et Marion Carrier 24/03/2011
Outil dalignement de séquences Performances Validation et tests 2
I. Les objectifs 1. Principe général 2. Format dentrée de la banque 3. Séquence dADN inconnue II. La solution implémentée 1. Organisation de la solution 2. Transformation des données 3. Recherche de solutions III. Les tests réalisés 1. Influence de la taille de la séquence connue 2. Influence de la taille du fragment cherché 3. Influence de la marge derreur 3
4 I. Les objectifsII. La solution implémentéeIII. Les tests réalisés
5 Banque de données de séquences dADN 33 ATCCGATCTA AATCATCCGA TCTATCCGAT CTA Séquences dADN connues … … … … … … I. Les objectifsII. La solution implémentéeIII. Les tests réalisés
6 ACTGTAGCCT… 1 ACT 3 TGT 8 CCT … Format de représentation habituel des séquences Nouveau format utilisé Liste de marqueurs I. Les objectifsII. La solution implémentéeIII. Les tests réalisés
7 Programmes Transformation Recherche … Solution trouvée : … Langage C I. Les objectifsII. La solution implémentéeIII. Les tests réalisés
Mise des séquences sous forme de tableau Calculs binaires ACTACCA ACT 6 1 ACTA ACTAC I. Les objectifsII. La solution implémentéeIII. Les tests réalisés
Sauvegarde des nouvelles données Fichiers binaires I. Les objectifsII. La solution implémentéeIII. Les tests réalisés
Transformation des données sur les marqueurs Calculs binaires Marge d'erreur = 2 Transformation en indices Transformation en intervalles 10 I. Les objectifsII. La solution implémentéeIII. Les tests réalisés
Recherche des marqueurs dans les séquences des banques de données Utilisation d'une pile Intervalle dans la séquence connue Taille de la séquence connue : 100 Taille de la séquence cherchée : [ 23 ; 27 ] [ 57 ; 61 ] Solution [ 10 ; 78 ] [ 48 ; 52 ] 11 I. Les objectifsII. La solution implémentéeIII. Les tests réalisés
12 Solution unique Entre 2 et 5 solutions Plus de 5 solutions Nombre de solutions nul Pas assez dinformations nucléotides nucléotides nucléotides I. Les objectifsII. La solution implémentéeIII. Les tests réalisés
13 Solution unique Entre 2 et 5 solutions Plus de 5 solutions Nombre de solutions nul Pas assez dinformations 500 nucléotides1 000 nucléotides nucléotides I. Les objectifsII. La solution implémentéeIII. Les tests réalisés
14 Solution unique Entre 2 et 5 solutions Plus de 5 solutions Marge nulle3 nucléotides 6 nucléotides I. Les objectifsII. La solution implémentéeIII. Les tests réalisés
Approche différente du problème Programmation en vue des performances Améliorations possibles Point de vue dun biologiste 15