NP-complétude de EDIT ( Nested, Nested ) G.Blin, G. Fertin, I. Rusu, C. Sinoquet Institut de Recherche en Informatique de Nantes.

Slides:



Advertisements
Présentations similaires
Comparaison de deux algorithmes d’approximation
Advertisements

Fabrice Lauri, François Charpillet, Daniel Szer
Dans cette partie Graphes Eulériens.
Algorithmes et structures de données avancées Cours 7
Modèle des jeux et des mécanismes
1 Modèles Economiques en Informatique Michel de Rougemont Université Paris II.
Algorithmes et structures de données avancés
Comparaison et analyse combinatoire de structures biologiques arborescentes P. Ferraro S. Dulucq J. Allali A. Ouangraoua.
Recherche de motifs par méthodes exploratoires: Comparaisons de performances et statistiques sur le score.
Modélisation par le concept de graphe
Colloque Traitement et Analyse de séquences : compte-rendu
Méthodes de comparaison entre séquences multi-échelles végétales
Séminaire Florin Périer Alain Gély LIMOS
Journées Graphes & Algorithmes, Novembre 2006, Orléans
A.Faÿ 1 Recherche opérationnelle Résumé de cours.
Recherche heuristique de similitudes dans les séquences dADN École Jeunes Chercheurs en Algorithmique et Calcul Formel Laurent Noé
Conception et analyse des algorithmes
Introduction à l’algorithmique
Algorithmes Branch & Bound
Comparaison de structures d’ARN
GPA750 – Ordonnancement des systèmes de production aéronautique
Alignement de séquences (suite)
Structures de données IFT-2000
Coloration gap sommet identifiante de graphes
IFT Complexité et NP-complétude


Algorithmes d ’approximation
PROBLEMES DE DEGRE-DIAMETRE DE GRAPHES DANS LE CAS GENERAL
Recherche Opérationnelle
Page de garde présentation
Partie II Sémantique.
Ordonnancement de tâches

8INF8061 Conception et analyse des algorithmes Comment comparer deux problèmes?
Structures de données IFT-2000 Abder Alikacem Arbres de recouvrement minimum Département dinformatique et de génie logiciel Édition Septembre 2009 JFK.
Recherche heuristique dans les bases de données L’algorithme BLAST
Modélisation géométrique de base
IFT Complexité et NP-complétude Chapitre 0 Rappels.
Apérisentation Sur les graphes évolutifs Mardi 22 novembre 16h30.
D.E ZEGOUR Ecole Supérieure d’Informatique
GRAPHES EN INFORMATIQUE. INTRODUCTION Les objets mathématiques appelés graphes apparaissent dans de nombreux domaines comme les mathématiques, la biologie,
D.E ZEGOUR Ecole Supérieure d’Informatique
Optimisation de requêtes
Reconnaissance des personnes par le visage dans des séquences vidéo
Complexité des Problèmes Combinatoires Module IAD/RP/RO/Complexité Philippe Chrétienne.
Algorithmes Branch & Bound
1 G. Gardarin Optimisation de Requêtes  1. Introduction  2. Arbres relationnels  3. Restructuration algébrique  4. Modèle de coût  5. Choix du meilleur.
1 Licence d’informatique Algorithmique des graphes Cours 7 : Graphes valués Chemins de valeur optimale Algorithme de Bellmann-Kalaba Utilisation de ce.
Problème de double digestion
Alignement de séquences biologiques
Optimisation pour la Conception de Systèmes Embarqués
Soutenance de Stage DEA / DESS
2005/2006 Structures de Données Introduction à la complexité des algorithmes.
Algorithmes génétiques en optimisation combinatoire
SONDe: Service à densité auto-organisante tolérant la charge Vincent Gramoli (INRIA) Erwan Le Merrer (INRIA) Anne-Marie Kermarrec (INRIA) Didier Neveux.

Ajouts et retraits dans un arbre de connexion Nicolas Thibault et Christian Laforest, Équipe OPAL Laboratoire IBISC (regroupement LaMI et LSC), Évry 8.
Algorithmique et Complexité
Structures de données avancées : Arbres B+ avec expansion partielle D. E ZEGOUR Institut National d ’Informatique.
Recherche heuristique dans les bases de données L’algorithme BLAST
Présentations BIN1001.
A propos du “Minimal Controllability Problem” C. Commault Département Automatique Gipsa-Lab Grenoble –FRANCE 1 Séminaire GIPSA-Lab 22 octobre 2015.
Les banques de séquences nucléiques
CSI2510 Structures de données et algorithmes Plus court chemin
Algorithmes Branch & Bound Module IAD/RP/RO Master d ’informatique Paris 6 Philippe Chrétienne.
Cycle, Cocycle, Arbre et Arborescence
Complexité algorithmique
Compilation & Apprentissage dans les Réseaux de Contraintes Hervé Cros Directeurs :Frédéric Koriche Joël Quinqueton.
Stage de Master M2 Les graphes 2-intervallaires Philippe Gambette Sous la direction de Michel Habib (LIAFA) LIAFAUniversité.
Transcription de la présentation:

NP-complétude de EDIT ( Nested, Nested ) G.Blin, G. Fertin, I. Rusu, C. Sinoquet Institut de Recherche en Informatique de Nantes

Motivations Comparaison de structures secondaires d’ARN. Prise en compte simultanément des structures primaire et secondaire. Études plus pertinentes Réponse à un problème ouvert proposé par Zhang et al en 2001

EDIT ( Nested, Nested ) ? Distance d’édition entre deux séquences annotées par des arcs. Plain Nested Crossing Unlimited ACGUCCGUGCAUAUUAA CGUCGGAUCUAGCUAUC {(op 1,op 2,…), (op 4,op 1,…),…} C1C1 C2C2 … min Distance d’édition

EDIT ( Nested, Nested ) ? Opérations sur les bases: Suppression : w d, Insertion : w d, Substitution : w m U - U A -U-U Base-deletion w d Base-insertion w d Base-mismatch w m Base-match U

EDIT ( Nested, Nested ) ? Opérations sur arcs : w am, w b, w a, w r ACGUCCGUGCAUAUUAA ACUGAC UGCA AUUA--- CCCC G-G- CUCU GAGA CCCC GGGG C-C- G-G- CCCC GGGG Arc-mismatch w am Arc-match Arc-breaking w b Arc-altering w a Arc-removing w r CACA GUGU CACA G-G- [Lin,Ma,Zhang – RECOMB01]

Exemple de calcul EDIT ( Nested, Nested )  un alignement : ACGUCCGU CAUAUUAA AGUGAC UGCA A UA- -- Score(  ) = W a + W r + W b + W am + 2W m + 2 W d - -

Complexité de EDIT UnlimitedCrossingNestedPlain Unlimited Max SNP-Hard Crossing Max SNP-Hard Nested ? O(nm 3 ) où m taille de séqu. plain Plain O(nm) EDIT(Nested, Nested) est NP-Complet

Problème NP-Complet Deux grandes classes de problèmes: P  Polynomiaux.  Réponse exacte en temps raisonnable NP  Non polynomiaux NP-Complet (sous-classe de NP)  Les plus difficiles  Réponse exacte en un temps non raisonnable (en centaines d’années avec la meilleure des machines)

Preuve de NP-Complétude I I0I0 Réponse(I 0 ) -> Réponse(I) en temps raisonnable Problème difficileNotre problème est difficile

Complexité de EDIT ( Nested, Nested ) ? Max Independent Set : Ensemble stable de taille maximale MIS est NP-Complet sur des graphes cubiques planaires connexes et sans isthme (noté MIS-3p). v1 v2 v3 v4 v5 v6 | MIS ( G ) | k 3,3 G  k k ?

Complexité de EDIT ( Nested, Nested ) ? MIS-3p -> plongement sur 2 pages Chaque sommet n’est pas de degré nul sur une page Page 1 Page 2 reliure

Complexité de EDIT ( Nested, Nested ) ? MIS-3p -> plongement sur 2 pages Chaque sommet n’est pas de degré nul sur une page v1v2v3v4v5v6  algorithme polynomial pour cette classe de graphe [Lin,Chen,Jiang,Wen – ICALP01]

Construction Sommet degré 2 : UAUAGG Sommet degré 1 : GGUAUA Sc Alignement canonique 3.n.w r w d

Construction Alignement canonique Alignement non canonique = Alignement non optimal Alignement avec des substitutions = Alignement non optimal

Construction Copie la configuration des arcs du plongement en doublant chacun des arcs

Les 18 types d’alignements locaux

Alignements locaux symétriques Coût similaire S2 S1 S2 S1

Démarche Un des 18 types représente les sommets de l’ensemble stable N’avoir que des alignements locaux de deux types  L’autre type représentant les sommets n’appartenant pas à l’ensemble stable

Démarche Score(  ) > > Score( ) Score(  ) alignement Canonique G-Stable

Choix des deux types t uas et t gs (le type des sommets de l’ensemble stable) Idée : pénaliser l’arc-removing wbwb wrwr wawa ss ss

Les Conditions posées par le remplacement

Edit(Nested,Nested) Sous conditions 1 à 4 Cas spécifique Cas général est difficile

Exemple 2w d Score(  ) < Score(  ) ?   0 +  < 2w d +  ? 0 < w d Un alignement contenant un sommet de type t1 n’est pas optimal 

Exemple 2w d   Un alignement contenant un sommet de type t9 n’est pas optimal  2w b 2w a Score(  ) < Score(  ) ? 0 + 2w b +  < 2w d + 2w a +  ? w b < w a

Exemple 2w d   Un alignement contenant un sommet de type t9 n’est pas optimal 2w a 2w r Score(  ) < Score(  ) ? 0 + 2w a +  < 2w d + 2w r +  ? w a + w d < w r

Exemple 2w d   Un alignement contenant un sommet de type t9 n’est pas optimal wbwb wawa Score(  ) < Score(  ) ? 0 + w a + w b +  < 2w d + w r + w a +  ? w b < w r wawa wrwr

Preuve de l’équivalence des problèmes G possède un ensemble indépendant V’ tel que |V’|  k Edit(S1,S2)  s où s = On veut maximiser k dans les deux problèmes coût de l’alignement Canonique G-Stable où k est le nombre de sommets de type t gs

Conclusion et perspectives (1) On peut trouver en temps raisonnable une instance de Edit(Nested,Nested) à partir d’un graphe cubique connexe planaire sans isthme (2) Les instances construites sont biologiquement correctes Alphabet {U,C,G,A} les arcs U-A représentent les liens hydrogènes (3) Démarche théorique Plonger un graphe intéressant vers une instance de notre problème Contraindre les coûts pour favoriser deux types de sommets Empêcher les liens entre deux sommets de l’ensemble stable

Conclusion et perspectives On apporte une réponse au problème ouvert dans [Lin,Ma,Zhang – RECOMB01] en faisant intervenir des notions non triviales issues de domaines diverses. Déterminer la complexité d’autres mesures de similarité sur l’ARN.

NP-complétude de EDIT ( Nested, Nested ) G.Blin, G. Fertin, I. Rusu, C. Sinoquet Institut de Recherche en Informatique de Nantes Questions?