Réunion MODULOME 15/10/2007 Christine ROUSSEAU Recherche des CRISPRs : Résultats MODULOME.

Slides:



Advertisements
Présentations similaires
Évaluation diagnostique
Advertisements

Placement de Motifs Architecture Application Contraintes: - Charge
Journées AReNA, Strasbourg,18-20 Avril 2005 Problèmes liés à lidentification de gènes bactériens exprimant des ARN non traduits en protéines UPRES JE 2311,
Données du réseau sismique de lOVPF Réseau sismique de lOVPF 5 éruptions sur la période étudiée 07/1999 à 12/2000 Différents types de signaux : Comment.
Efficient Simplification of Point-Sampled Surfaces
Recherche de motifs par méthodes exploratoires: Comparaisons de performances et statistiques sur le score.
Nicolas Terrapon Olivier Gascuel 26/03/2017 Laurent Bréhélin
Les Structures de contrôles itératives
La parité de pouvoir d'achat Kim Geraghty Julien Levesque
I) Obtention de l’ADN recombinant
3. Analyse et estimation du mouvement dans la vidéo
LA VITESSE Seule qualité physique pour laquelle on se doit de
Colloque Traitement et Analyse de séquences : compte-rendu
1 Recherche de répétitions distantes dans les séquences Etudiant : Laurent NOE Encadrant : Gregory KUCHEROV.
Recherche heuristique de similitudes dans les séquences dADN École Jeunes Chercheurs en Algorithmique et Calcul Formel Laurent Noé
Présenté par : MOHSEN BEN HASSINE
Déterminer une distance
Les système linéaires Stéphane Paris.
1. L’ADN et l’information génétique
Régression linéaire simple
Construction de modèles visuels
Rappel... Solution itérative de systèmes linéaires (suite et fin).
Algorithmique et Programmation
Alignement de séquences (suite)
UBLO Comparaison de génomes bactériens : questions méthodologiques autour de la définition du squelette et des boucles
Introduction à l’algorithmique
Semaine #1 INF135 par Frédérick Henri.
Génération d’un segment de droite
OPTIMISATION cours 17.
Les propriétés des fonctions
Prédiction d’interactions protéine-protéine
Extraction Automatique de formes complexes : Application à la création de modèle anatomique de la tête J. Piovano, T. Papadopoulo Séminaire Odyssee 9,
GPA750 – Gestion de Projets
La régression multiple

Recherche heuristique dans les bases de données L’algorithme BLAST
1 Algorithmique et programmation en Itérations (boucles) Types numériques simples (suite)
Chapitre 6 Les traitements avancés
Howell Chap. 11: ANOVA. Du monde connu au monde inconnu Du test t à l’analyse de varianceDu test t à l’analyse de variance Trouvez des nouveaux noms pour.
Laboratoire de Physique Nucléaire et des Hautes Energies, Paris
Les tensions électriques variables
Mémoire 1. Généralités.
Chapitre E3: Utilisation d’une interface d’acquisition
Recherche exacte de motifs
Réunion MODULOME 28/05/2008 Christine ROUSSEAU L'analyse des CRISPR et des gènes associés comme répétitions locales et voisine MODULOME.
Programmation Création d’une mire 1 afficher une image
Structures de données avancées : Fichiers multidimensionnels Pr ZEGOUR DJAMEL EDDINE Ecole Supérieure d’Informatique (ESI) zegour.esi.dz
2008/ Plan du cours 1.Introduction –Contenu du cours 2.Logique mathématique –Calcul propositionnel –Calcul des prédicats –Logique floue et aide à.
Recherches locales et méta-heuristiques
Réunion MODULOME 28/05/2008 Christine ROUSSEAU Inventaire des miHsmar1 dans le génome Humain MODULOME.
STAN (Suffix Tree ANalyser) Un outil de recherche de motif dans les génomes Grégory Ranchy Anne-Sophie Valin 9 décembre 2004.
PROGRAMMATION SCIENTIFIQUE EN C PRO Résolution de système d’équations non- linéaires (racines d’équations) u Méthode de la bissection u Analyse.
2005/2006 Structures de Données Introduction à la complexité des algorithmes.
Construire un graphique
A B UCDUCONNUCDUCONN Mean Median Max Min
La génétique et la biométrie
Recherche heuristique dans les bases de données L’algorithme BLAST
Introduction à la programmation (420-PK2-SL) cours 18 Gestion des applications Technologie de l’information (LEA.BW)
Correction problème 1.
Tension Variable ou continue ?
Échantillonnage (STT-2000)
Partie II : Segmentation
PROGRAMMATION SCIENTIFIQUE EN C
Les banques de séquences nucléiques
CHMI 4206 Bioinformatique appliquée
Algorithmique Boucles et Itérations
ALGORITHME ET PROGRAMMATION RÉVISION Informatique et Sciences du Numérique.
LE CHOIX DE LA FORMULE  Reprise du cours du 09 au 12 décembre (GR 1 à 5, même si redites) o Question : vitesse moyenne du cycliste A sur l’ensemble de.
Jean Gaudart1 Détection de clusters spatiaux d'évènements Jean Gaudart Labo. Biostatistiques Faculté de Médecine de Marseille.
Lead Generation Model.
Transcription de la présentation:

Réunion MODULOME 15/10/2007 Christine ROUSSEAU Recherche des CRISPRs : Résultats MODULOME

Réunion MODULOME 15/10/2007 Recherche des CRISPR Observés chez les archéas et les bactéries Rôle supposé : mémoire immunitaire Clustered Regularly Interspaced Short Palindromic Repeat

Réunion MODULOME 15/10/2007 CRISPR : vers un modèle ✔ Unités régulièrement espacées ✔ Présence d'un leader en amont ou aval du CRISPR à une distance variable ✔ Présence d'un gène CAS Gène CAS

Réunion MODULOME 15/10/2007 Méthode ✔ Extraire les λ µ local maximal repeat ✔ Recherche des λ µ local maximal repeat chevauchants et régulièrement espacés ✔ Alignement multiple pour déterminer le consensus. ✔ Etude des régions flanquantes

Réunion MODULOME 15/10/2007 Etape 1 : Extraction des λ µ local maximal repeat Position min = 25 Position max = 189 Objectif : n'extraire que les répétitions localement répétées. λ = scope = position max – position min = 164

Réunion MODULOME 15/10/2007 Etape 1 : Extraction des λ µ local maximal repeat  µ partitions contenant au moins 2 éléments µ=2, scope = moyenne des scopes locales = 44,5 scope1= 81 scope2= 8

Réunion MODULOME 15/10/2007 Etape 1 : Extraction des λ µ local maximal repeat  µ partitions contenant au moins 2 éléments µ=2, scope = moyenne des scopes locales = 44,5 scope1= 4 scope3= 8 µ=3, scope = 13 scope2 = 27

Réunion MODULOME 15/10/2007 Etape 1 : Extraction des λ µ local maximal repeat  µ partitions contenant au moins 2 éléments µ=2, scope = moyenne des scopes locales = 44,5 scope1= 4 scope3= 2 µ=3, scope = 13 scope2 = 27 µ = ∞, scope = 9 scope4= 4

Réunion MODULOME 15/10/2007 Etape 1 : Extraction des λ µ local maximal repeat Et pour les CRISPRs ? μ = ∞ = 50 λ = 500

Réunion MODULOME 15/10/2007 Etape 2 : rechercher les λ µ LMR régulièrement espacés Calcul de la période dans une fenêtre de taille = nombre minimum d’occurrences. On augmente la taille de la fenêtre tant que l'on a la même période.

Réunion MODULOME 15/10/2007 Etape 2 : rechercher les λ µ LMR régulièrement espacés Calcul de la période dans la fenêtre : P = médiane des distances entre 2 unités Toutes les distances entre unités = P +/- 25% Si vrai, on augmente la taille de la fenêtre Sinon on recalcule la période en supposant la présence d’un parasite.

Réunion MODULOME 15/10/2007 Etape 3 : alignement multiple des unités

Réunion MODULOME 15/10/2007 Pyrococcus abyssi GE5

Réunion MODULOME 15/10/2007 Détection des CRISPRs chez les thermococcales : résultats ✔ Pyrococcus abyssi : 3 CRISPRs ✔ Pyrococcus horikoshii : 6 CRISPRs ✔ Pyrococcus furiosus : 7 CRISPRs ✔ Thermococcus kodakarensis : 3 CRISPRs

Réunion MODULOME 15/10/2007 Détection des CRISPRs chez les thermococcales : Analyse des spacers Blast contre banques virales et plasmids

Réunion MODULOME 15/10/2007 Détection des CRISPRs chez les thermococcales : Comparaison des résultats avec les autres méthodes

Réunion MODULOME 15/10/2007 Etape 4 : leader et gène CAS ? Propriétés connues : Emplacement +/ Bp d’un CRISPR Domaines conservés Idée : Rechercher les maximal repeat au voisinage des régions CRISPR isolées et présents seulement dans ce voisinage ( δ neighbour)

Réunion MODULOME 15/10/2007 Pyrococcus horikoshii

Réunion MODULOME 15/10/2007 Vers une base de données CRISPR génome coordonnées séquence consensus + logo unités / spacers image Pygram gènes CAS si connus