Laurent Labarre AGC - UMR 8030 - Génoscope Synténie bactérienne : aide pour l’annotation de Cenibacterium arsenoxydans Laurent Labarre AGC - UMR 8030 - Génoscope labarre@genoscope.cns.fr
Plan Génomique comparative avec les mains Détection de groupes de synténie Détection de régions spécifiques Les synténies dans MaGe
Comparaison de génomes éloignés Régions conservées Bacillus subtilis Escherichia coli k12
Comparaison de génomes proches Escherichia coli O157 H7 Région spécifique Escherichia coli k12
Génomique comparative : remarques Aspect multi-génome Comparaison toujours par rapport à … Présence / absence de gènes orthologie/paralogie/gènes spécifiques ? correspondance fonctionnelle ? Conservation de l’organisation des gènes groupes de synténie, groupes de gènes spécifiques ? couplage fonctionnel ?
La synténie : pourquoi ? Applications Opérons Régulation Transcriptionelle Attribution Fonctionnelle Contextuelle ? Similitude Familles de gènes "Universels" Voies Métaboliques
Synténie bactérienne : modélisation Nous utilisons le formalisme des graphes pour modéliser les groupes de synténie. Génome A Génome B "correspondance" "co-localisation" Les gènes sont les nœuds du graphe et sont connectés par deux types d’arêtes : Relation de "correspondance" (inter génomes) principalement résultats de comparaisons de séquences (avec contraintes restrictives sur la similitude) mais aussi classifications fonctionnelles ou conservation de domaines protéiques Relation de "co-localisation" (intra génome) paramètre de gap qui autorise tous types de réarrangements => L’algorithme développé recherche les groupes de gènes (‘syntons’) qui vérifient ces deux relations.
Synténie bactérienne : modélisation Génome A Synton #1 Synton #2 gap <= 2 Génome B Réarrangement Fusion Duplication Insertion Inversion => Correspondances multiples, réarrangements et insertions autorisés
Synténie bactérienne : un exemple Cet exemple montre quels types de groupes de synténie peuvent être détectés. Le système de sécrétion de type III : On détecte aussi ce groupe de gènes chez Y. pseudotuberculosis, S. typhi, S. typhimurium et E. coli O157. Ce groupe n’a pas d’équivalent chez E coli
Régions spécifiques : modélisation Génome A Génome B "co-localisation" "absence de correspondance" Comme pour les synténies, nous utilisons les graphes pour modéliser les régions spécifiques avec deux types d’arêtes : Relation d’ "absence de correspondance" (inter génomes) représentée explicitement Relation de "co-localisation" (intra génome) paramètre de gap qui autorise les insertions => Détecter les régions spécifiques revient à rechercher les gènes qui vérifient ces deux relations (trivial)
Régions spécifiques : modélisation Région spécifique gap <= 2 Insertion Génome A Génome B => Insertions autorisés
Régions spécifiques : remarque "Orthologue putatif" Critère de correspondance inter-génomes ?! "Absence de correspondant" => Statuer sur l’absence de correspondance n’est pas simple !
Algorithme (1/2) ?
Algorithme (2/2) c1 c2 c3 c4 c5 c6 c7 c8 1 4 2 ccA1 ccA2 ccB1 ccB2 ccB3 gap <= 1 ccA1/ccB1 ccA2/ccB2 ccA2/ccB3 => Raffinement de partition de l’ensemble des couples de gènes correspondant suivant leur co-localisation sur les deux génomes
Les synténies dans Mage Représentation cartographique Détails de syntons Recoupement de synténies
Le Syntonizer Un outil dédié au calcul et à l’exploration des synténies bactériennes Calcul dynamique Différents types de correspondances (Blast, COG, EC, Pfam)