Réunion MODULOME 15/10/2007 Christine ROUSSEAU Recherche des CRISPRs : Résultats MODULOME
Réunion MODULOME 15/10/2007 Recherche des CRISPR Observés chez les archéas et les bactéries Rôle supposé : mémoire immunitaire Clustered Regularly Interspaced Short Palindromic Repeat
Réunion MODULOME 15/10/2007 CRISPR : vers un modèle ✔ Unités régulièrement espacées ✔ Présence d'un leader en amont ou aval du CRISPR à une distance variable ✔ Présence d'un gène CAS Gène CAS
Réunion MODULOME 15/10/2007 Méthode ✔ Extraire les λ µ local maximal repeat ✔ Recherche des λ µ local maximal repeat chevauchants et régulièrement espacés ✔ Alignement multiple pour déterminer le consensus. ✔ Etude des régions flanquantes
Réunion MODULOME 15/10/2007 Etape 1 : Extraction des λ µ local maximal repeat Position min = 25 Position max = 189 Objectif : n'extraire que les répétitions localement répétées. λ = scope = position max – position min = 164
Réunion MODULOME 15/10/2007 Etape 1 : Extraction des λ µ local maximal repeat µ partitions contenant au moins 2 éléments µ=2, scope = moyenne des scopes locales = 44,5 scope1= 81 scope2= 8
Réunion MODULOME 15/10/2007 Etape 1 : Extraction des λ µ local maximal repeat µ partitions contenant au moins 2 éléments µ=2, scope = moyenne des scopes locales = 44,5 scope1= 4 scope3= 8 µ=3, scope = 13 scope2 = 27
Réunion MODULOME 15/10/2007 Etape 1 : Extraction des λ µ local maximal repeat µ partitions contenant au moins 2 éléments µ=2, scope = moyenne des scopes locales = 44,5 scope1= 4 scope3= 2 µ=3, scope = 13 scope2 = 27 µ = ∞, scope = 9 scope4= 4
Réunion MODULOME 15/10/2007 Etape 1 : Extraction des λ µ local maximal repeat Et pour les CRISPRs ? μ = ∞ = 50 λ = 500
Réunion MODULOME 15/10/2007 Etape 2 : rechercher les λ µ LMR régulièrement espacés Calcul de la période dans une fenêtre de taille = nombre minimum d’occurrences. On augmente la taille de la fenêtre tant que l'on a la même période.
Réunion MODULOME 15/10/2007 Etape 2 : rechercher les λ µ LMR régulièrement espacés Calcul de la période dans la fenêtre : P = médiane des distances entre 2 unités Toutes les distances entre unités = P +/- 25% Si vrai, on augmente la taille de la fenêtre Sinon on recalcule la période en supposant la présence d’un parasite.
Réunion MODULOME 15/10/2007 Etape 3 : alignement multiple des unités
Réunion MODULOME 15/10/2007 Pyrococcus abyssi GE5
Réunion MODULOME 15/10/2007 Détection des CRISPRs chez les thermococcales : résultats ✔ Pyrococcus abyssi : 3 CRISPRs ✔ Pyrococcus horikoshii : 6 CRISPRs ✔ Pyrococcus furiosus : 7 CRISPRs ✔ Thermococcus kodakarensis : 3 CRISPRs
Réunion MODULOME 15/10/2007 Détection des CRISPRs chez les thermococcales : Analyse des spacers Blast contre banques virales et plasmids
Réunion MODULOME 15/10/2007 Détection des CRISPRs chez les thermococcales : Comparaison des résultats avec les autres méthodes
Réunion MODULOME 15/10/2007 Etape 4 : leader et gène CAS ? Propriétés connues : Emplacement +/ Bp d’un CRISPR Domaines conservés Idée : Rechercher les maximal repeat au voisinage des régions CRISPR isolées et présents seulement dans ce voisinage ( δ neighbour)
Réunion MODULOME 15/10/2007 Pyrococcus horikoshii
Réunion MODULOME 15/10/2007 Vers une base de données CRISPR génome coordonnées séquence consensus + logo unités / spacers image Pygram gènes CAS si connus