Module « Epidémiologie »

Slides:



Advertisements
Présentations similaires
Taxonomie bactérienne
Advertisements

Éléments de correction du devoir novembre 2011
Tests et Validation du logiciel
Contrôle de qualité des tests de sensibilité antimicrobienne
GESTION DE PORTEFEUILLE chapitre n° 7
Dr Jacqueline COTTALORDA, Laboratoire de Virologie, CHU de Nice
Ensemble pour lEstimation et la Projection (EEP).
Algèbre de composants : une approche fonctionnelle à la sémantique de documents Bart Lamiroy LORIA/INPL QGar - École des Mines de Nancy.
Recherche de motifs par méthodes exploratoires: Comparaisons de performances et statistiques sur le score.
Présentation des programmes de terminale STG Juin 2006.
Chap. 8 – Q8.2 – Séq. 2 : Ronde des décisions (carte de Barrows)
. Surveillance de la rougeole
Actualité dans l’hépatite C 1ère antiprotéase : le telaprevir
DE ZÉRO à PAUP : Délimitation du groupe d'intérêt ("ingroup")
Variabilité nucléotidique du gène de l'acétyl coenzyme A carboxylase et Signature de sélection par un herbicide chez la plante Alopecurus myosuroides (Huds.)
Journées Physique Atlas France Mars 2006 Autrans Lalgorithme de clustering topologique Nicolas Kerschen DAPNIA Plan: Introduction Principe et propriétés.
Biologie Moléculaire des Hépatites Virales
Charge virale HCV comparaisons techniques …
Phylogénie et distances génétique
Prédiction de sites dinteraction des protéines par analyse darbres phylogénétiques Stéfan Engelen Génomique Analytique, INSERM U511 Université Pierre et.
Colloque Traitement et Analyse de séquences : compte-rendu
HEPATITES VIRALES B et C : TESTS BIOLOGIQUES
PhyloJava : une application de phylogénie sur la grille DATAGRID
1 Intégration numérique garantie de systèmes décrits par des équations différentielles non-linéaires Application à l'estimation garantie d'état et de paramètres.
Le remplacement moléculaire
Un nouveau regard sur les données moléculaires
BIO1130 LAB 4 MICROÉVOLUTION.
Génétique adaptative des pathogènes
Auto-organisation dans les réseaux ad hoc
YASS : Recherche de similarités dans les séquences d'ADN
LES ANTIVIRUS.
Marta Tomaszkiewicz (M2 BEM)
Méthode des k plus proches voisins
Phylogenetik Conception, développement et tests d’un logiciel en java
UBLO Comparaison de génomes bactériens : questions méthodologiques autour de la définition du squelette et des boucles
Bioinformatique et Biologie Structurale I/ – Principes et techniques A/ Linformation structurale B/ Les différentes techniques de détermination de structure.
Présentation du mémoire
1.
Plan Buts principaux Intérêt et pertinence du projet Rappel concernant la phylogénie Travail accompli jusquà maintenant Travail restant à accomplir Difficultés.
Prédiction d’interactions protéine-protéine
Stephanie Schiphorst Gaelle Allely
SEROPREVALENCE DE L’HEPATITE E EN TUNISIE
La Lettre de l’Hépato-Gastroentérologue AASLD Washington 2013 – Actualités dans la prise en charge des traitements de l’hépatite C (1) Prévalence du VHC.
1 Alain Casali Christian Ernst Extraction de Règles de Corrélation Décisionnelles 29 Janvier 2009.
Un outil d’estimation du temps d’exécution au pire-cas par analyse statique de programmes IRISA - Projet Solidor Antoine COLIN.
Formation Bio-informatique IRD
Analyses phylogénétiques
Introduction à la Pathologie Moléculaire du Gène
Familles de gènes Nadia El-Mabrouk.
1 Étudiants: Professeur: Salamin Nicolas Assistante: Maryam Zaheri.
2008/ Plan du cours 1.Introduction –Contenu du cours 2.Logique mathématique –Calcul propositionnel –Calcul des prédicats –Logique floue et aide à.
V. M.-R. Arnould 1,2,*, E. Froidmont 3, H. N. Nguyen 4, F. Dehareng 4, P. Dardenne 4, A. Gillon 2,5, N. Gengler 2,6 et H. Soyeurt 2,6 1 CONVIS, Zone Artisanale.
Identification of a Novel Circulating Recombinant
Objectifs de la cohorte CUPIC
Dorina Surcel et René Laprise
Evidence for a functional RNA element in the hepatitis C virus core gene Laura K. McMullan, Arash Grakoui, Matthew J. Evans, Kathleen Mihalik, Montserrat.
Synthèse d’images et Rendu Réaliste Compression Progressive de Modèles 3D DOMENGET Bruno DUMAS Benjamin EISTI.
Le HIV1 en Chine Epidémie en développement Fin 2005:
« Ecologie et dynamique des populations » Unité de Pathologie Végétale
AMDEC AMDEC : Analyse des modes de défaillances, de leurs effets et leurs criticités Origine: 1950 : USA (FMECA) 1970 : Europe.
Évolution de second ordre dans un algorithme évolutionnaire V. Lefort
Réalisation d’un arbre phylogénique à partir d’un fragment de séquence
Dr Vincent BIGE Centre de référence Mucoviscidose de Lyon
On s‘intéressera à 3 gènes paralogues humains : HTR2A, HTR2B et HTR2C du récepteur de la sérotonine humaine (Swissprot : 5HT2A_HUMAN, 5HT2B_HUMAN, 5HT2C_HUMAN).
CHMI 4206 Bioinformatique appliquée
La trithérapie IFN peg-RBV-IP est- elle justifiée pour l’ensemble des patients VHC+ de génotype 1? Contre: Rouen.
METHODES DE DIAGNOSTIC VIROLOGIQUE
Perceived challenges and attitudes to regimen and product selection from Italian haemophilia treaters: the 2013 AICE survey. Franchini M et al Haemophilia.
Comparaison post-classification. Le problème du projet 3 Les changements du couvert arborescent dans le territoire urbain (zone blanche) de la Communauté.
Approches génomiques - TD 2 L3 – BCP ALIGNEMENTS ET PHYLOGENIE
Transcription de la présentation:

Module « Epidémiologie » Approche progressive en phylogénie Application à un modèle viral C. GAUDY -GRAFFIN INSERM ERI 19/ Virus Pseudovirus, Morphogenèse et antigénicité

PHYLOGENY PROGRAMS http://evolution.genetics.washington.edu/phylip/software.html ??? ??? ???

Comment concevoir la phylogénie ?

Comment concevoir la phylogénie ? SEQUENCES X arbres , X approches # Quel arbre choisir ? METHODE INTUITIVE

Comment concevoir la phylogénie ? SEQUENCES  APPROCHE MATHEMATIQUE, METHODE PROGRESSIVE Estimer la faisabilité de l’analyse choisir le modèle de substitution le plus approprié calculer les paramètres de l’analyse plutôt que de les fixer par défaut

Pourquoi une approche progressive ? Faire une analyse préalable avant de débuter l’analyse phylogénétique «proprement dite »

Avant de débuter une analyse phylogénétique  Alignements corrects ?  Estimer le bruit phylogénétique - Région étudiée trop saturée en mutations ? (mesure de l’entropie) - Séquences trop divergentes pour être comparées ? Méthode du Quartet Puzzling TREE-PUZZLE 5.2 http://www.tree-puzzle.de/ Reconstructing tree topologies with quartet puzzling

La méthode du Quartet Puzzling ?

Méthode du quartet Puzzling (Stimmer and Von Haeseler, 1996) ETUDIER LES LIENS PHYLOGENETIQUES EXISTANT AU SEIN DU QUARTET C…GACACGTTTA…C C…GACACGTCTA…C C…GATAGGTTTA…C n séq à étudier : Regroupé par 4 = Quartet Pour n séquences n!/(n-4!)4! quartets possibles

Méthode du quartet Puzzling (Stimmer and Von Haeseler, 1996) ETUDIER LES LIENS PHYLOGENETIQUES EXISTANT AU SEIN DU QUARTET C…GACACGTTTA…C C…GACACGTCTA…C C…GATAGGTTTA…C n séq à étudier : Regroupé par 4 = Quartet Pour n séquences n!/(n-4!)4! quartets possibles Pour chaque quartet, 3 topologies d’arbres possibles S1 S3 S2 S4 S1 S2 S4 S3 S1 S2 S3 S4 Topologie 1 = Lk1 Topologie 2 = Lk2 Topologie 3 = Lk3 Valeur de vraisemblance de la topologie 1

Méthode du quartet Puzzling (Stimmer and Von Haeseler, 1996) Topologie 1 Lk1 Ln (Lk1) Topologie 2 Lk2 Ln (Lk2) Topologie 3 Lk3 Ln (Lk2) Représentation graphique Valeurs de vraisemblance de chaque topologie d’arbre reportées en distance dans un triangle équilatéral Arbre 2 = Lk2 S1 S2 S4 S3 Situation 1 : Lk3=Lk1= Lk2 Intersection (P1) au centre du triangle Topologie arbre S1,S2,S3,S4 non résolue Lk3 Lk1 Arbre 3 = Lk3 S1 S3 S2 S4 Lk2 S1 S2 S3 S4 Point 1 Arbre 1 = Lk1

Méthode du quartet Puzzling (Stimmer and Von Haeseler, 1996) Lk1 Ln (Lk1) Lk2 Ln (Lk2) Lk3 Ln (Lk3) Arbre 2 = Lk2 S1 S2 S4 S3 Situation 2 : Lk1 > Lk2 > Lk3 Intersection (P2) excentré (coin du triangle) Topologie arbre S1,S2,S3,S4 résolue Arbre 3 = Lk3 S1 S2 S3 S4 S1 S3 S2 S4 Point 2 Arbre 1 = Lk1

Méthode du quartet Puzzling (Stimmer and Von Haeseler, 1996) Renouveller l’opération pour chaque quartet : - Etudier la distribution des points dans le triangle -Majorité de topologies résolues ? -Majorité de topologies non résolues ? Zones des topologies totalement résolues Environ 30 % des points dans chaque coin = Majorité de topologies résolues -  Situation idéale

Méthode du quartet Puzzling (Stimmer and Von Haeseler, 1996) Zones des topologies partiellement résolues Majorité de points sur les côtés = majorité de topologie partiellement résolues Situation intermédiaire Topologie finale de l’arbre en «Net-Work»

= + B A C A B D C A B D C D TOPOLOGIE D’UN ARBRE PHYLOGENETIQUE Topologie en réseau « NET-WORK » C D

Méthode du quartet Puzzling (Stimmer and Von Haeseler, 1996) Zone des topologies non résolues Majorité de points dans la région centrale BRUIT PHYLOGENETIQUE ++++++ = Topologie finale de l’arbre «Star-like » Arbre phylogénétique non interprétable

1 « Tree-like » signal = 1+2+3 « Starlike » signal = 7 Network like signal = 4+5+6 4 6 7 3 2 5 LIKELIHOOD MAPPING

Estimer la pertinence d’une analyse phylogénétique Approche progressive : Application à un modèle viral Module « Epidémiologie » Estimer la pertinence d’une analyse phylogénétique par la méthode du quartet Puzzling : Application à l’analyse de la région hypervariable HVR1 du virus de l’hépatite C

de souches de VHC de génotype 1b Objectif initial de notre travail En étudiant un grand nombre de variants du VHC isolés chez des patients répondeurs ou non-répondeurs à la thérapie anti-VHC, Choix d’analyser AVANT TRAITEMENT le polymorphisme de l’enveloppe E2 de souches de VHC de génotype 1b Le polymorphisme de HVR1 avt tt est-il prédictif de la réponse ultérieure ? (hétérogénéité de HVR1 corrélé à la réponse au tt dans la littérature) En étudiant……………………..non répondeurs, nous avons choisi d’analyser…..génotype 1b, prédominant en France et le plus résistant aux thérapies actuelles, POUR tester…………………………..

Région génomique étudiée POLYPROTEINE PRECURSEUR DU VHC (Codons) (Codons) 1 1 192 192 384 384 810 810 1027 1027 1658 1658 1973 1973 2421 2421 C C E1 E1 E2/ E2/ p7 p7 NS2 NS2 NS3 NS3 NS4 NS4 NS5A NS5A NS5B NS5B 384 384 - - 410 410 E1 E1 Protéine E2 Protéine E2 p7 p7 746 746 Avec les amorces décrites par Lee et ses coll , permettant l’obtention d’un fragment de 308 pb incluant HVR1 Avec les amorces décrites par Sarrazin et ses coll, …………………………………………………………357 pb incluant PePHD HVR1 HVR1 Région N terminale de E2 / hypervariable HVR1 (81 pb)

de souches de VHC de génotype 1b Objectif initial de notre travail En étudiant un grand nombre de variants du VHC isolés chez des patients répondeurs ou non-répondeurs, Choix d’analyser AVANT TRAITEMENT le polymorphisme de l’enveloppe E2 de souches de VHC de génotype 1b  Le polymorphisme de HVR1 avt tt est-il prédictif de la réponse ultérieure ?  Avant tt, peut-on distinguer pylogénétiquement les séquences de HVR1 issus de patients répondeurs et non-répondeurs ?  PERTINENCE / FAISABILITE D’UNE ANALYSE PHYLO. REALISEE SUR UNE REGION HYPERVARIABLE En étudiant……………………..non répondeurs, nous avons choisi d’analyser…..génotype 1b, prédominant en France et le plus résistant aux thérapies actuelles, POUR tester…………………………..

ALIGNEMENT = ds BIOEDIT / option CLUSTALW Séquences analysées 150 séquences nucléotidiques de HVR1 (amplification par RT-PCR nichée et clonage dans pCR 2.1) 50 clones issus de souches infectant des patients répondeurs à l’IFN seul (R1) 50 clones issus de souches infectant des répondeurs au tt IFN-Ribavirine (R2) - 50 clones issus de souches infectant des non-répondeurs au tt IFN-Ribavirine (NR) Au total, 160 séq…..ont été obtenues dont 40 ..et 120 ALIGNEMENT = ds BIOEDIT / option CLUSTALW

Analyse des séquences nucléotidiques / Mesure de l’entropie Étude du polymorphisme de HVR1 avant traitement Analyse des séquences nucléotidiques / Mesure de l’entropie HVR1 L’étude du polymorphisme….débute par l ’analyse des séquences nucléotidiques . L’entropie nt a été mesurée pour les 3……………………….(courbe verte, courbe violette). Des valeurs d’entropie nucléotidiques fortes(supr à 1) sont obtenues pour toutes les positions de HVR1 . Elles sont bien supérieur à celles retrouvées dans les régions flanquantes Ceci confirme le domaine HVR1 est hautement tolérance aux substitutions nt. Mesure de l’entropie nucléotidique de HVR1 (logiciel DAMBE®) sur ces 3 groupes de 50 séquences (issues de souches de VHC de génotype 1b)  Grande tolérance du domaine HVR1 aux substitutions nucléotidiques

Tolérance du domaine HVR1 aux substitutions en acides aminés 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 E T H V T G G S A A H T A S G L T S L F S P G A K Q N T Y T S A A V G R A T Q S F V G F L T Q P Q K S R I V T Q S Y S V R R V A N I A S S R R G V S Q G M Y T I R N R S D D Q K D N A L Q N R H K V * (aa>2%) Cette diapositive représente un profil de substitutions en aa du domaine HVR1. Ces mutations ont été répertoriées après analyse de 299 domaines HVR1 (issus de souches de différents génotypes). Le domaine HVR1, flanqué de 6 positions conservées, est hautement substitué. N A T F Substitutions* en acides aminés répertoriées après analyse de 299 domaines HVR1 (HCV-1 à 6) Domaine hautement substitué possédant 6 positions conservées (Smith et al. 1999)

Arbre phylogénétique réalisé à partir de 150 séquences de HVR1 (81 nt) 3 groupes de séquences à comparer. R IFN / Rib. (répondeurs biT) R4 R10 R2 R8c2 R5 R5C12 R7 NR2 R8/R9 NR5 NR3/NR4 NR5C5 NR5C6 NR5C4 NR5C8 NR4C2 R6c5 R6c9 R6c10 NR1C1 NR1C9 NR1C14 NR1 R1 R6 NR5C13 R7c3 R9c2 R9c3 R8c11 VHC5A R3 88 94 85 64 69 90 77 28 45 52 32 98 17 62 9 27 4 50 8 7 41 78 5 25 1 2 16 46 0.1 R IFN (répondeurs MonoT) NR IFN / Rib.(non-répondeurs biT) - distance computation : K2P model - Neighbor Joining method - Bootstrap : 500 Unrooted / outgroup 5a Arbre réalisé avec MEGA A multiple alignment of the 150 HVR1 nucleotidique sequences was performed and an unrooted tree was build using a 5a strain as outgroup with Neighbor Joining Method . Sequences from patients who repond to IFN monotherapy are indicated in bleu. For those who respond to bitherapy, red color was used. Gren color mentions seq fron NR. This phylogenetic analyses does not reveal any cluster according to treatment outcome as seq from R and NR were scattrered throughout the tree.

 Absence de cluster patient Arbre phylogénétique réalisé à partir de 150 séquences de HVR1 (81 nt) 3 groupes de séquences à comparer. R IFN / Rib. (répondeurs biT) R4 R10 R2 R8c2 R5 R5C12 R7 NR2 R8/R9 NR5 NR3/NR4 NR5C5 NR5C6 NR5C4 NR5C8 NR4C2 R6c5 R6c9 R6c10 NR1C1 NR1C9 NR1C14 NR1 R1 R6 NR5C13 R7c3 R9c2 R9c3 R8c11 VHC5A R3 88 94 85 64 69 90 77 28 45 52 32 98 17 62 9 27 4 50 8 7 41 78 5 25 1 2 16 46 0.1 R IFN (répondeurs MonoT) NR IFN / Rib.(non-répondeurs biT) - distance computation : K2P model - Neighbor Joining method - Bootstrap : 500 Unrooted / outgroup 5a Arbre réalisé avec MEGA NR4 Clones de NR3 et NR4 A multiple alignment of the 150 HVR1 nucleotidique sequences was performed and an unrooted tree was build using a 5a strain as outgroup with Neighbor Joining Method . Sequences from patients who repond to IFN monotherapy are indicated in bleu. For those who respond to bitherapy, red color was used. Gren color mentions seq fron NR. This phylogenetic analyses does not reveal any cluster according to treatment outcome as seq from R and NR were scattrered throughout the tree.  Absence de cluster patient Valeurs de Boostrap trop faibles Résultats non interprétables

Présence d’un important bruit phylogénétique Comment tester la fiabilité d’une telle analyse phylogénétique ? (étudiant les liens entre 3 groupes de 50 séquences de HVR1) - Méthode du « Quartet Puzzling » réalisée sur l’alignement de 150 domaines HVR1 Présence d’un important bruit phylogénétique (32% des quartets non résolus) Pour tester la ……………………………………., la méthode ………………a été réalisée .avec TREE PUZZLE L’analyse du triangle de représentation montre un regroupement des quartets au centre donc la présence d’un important bruit phylogénétique. Analyse phylogénétique portant sur HVR1 non interprétable / arbre: topologie « Star-like »

Inclure les régions flanquantes de HVR1 dans cette analyse ? POLYPROTEINE PRECURSEUR DU VHC POLYPROTEINE PRECURSEUR DU VHC (Codons) (Codons) 1 1 192 192 384 384 810 810 1027 1027 1658 1658 1973 1973 2421 2421 C C E1 E1 E2/ E2/ p7 p7 NS2 NS2 NS3 NS3 NS4 NS4 NS5A NS5A NS5B NS5B 384 384 - - 410 410 659 659 - - 670 670 E1 E1 Protéine E2 Protéine E2 p7 p7 746 746 Avec les amorces décrites par Lee et ses coll , permettant l’obtention d’un fragment de 308 pb incluant HVR1 Avec les amorces décrites par Sarrazin et ses coll, …………………………………………………………357 pb incluant PePHD HVR1 HVR1 PePHD 32 32 nt nt (en nucléotides) (en nucléotides) 195 195 nt nt Région HVR1 et son environnement (308 pb)

Réduction du bruit phylogénétique « Quartet Puzzling » réalisé sur l’alignement de 150 séquences E2/HVR1 (308 nt) Réduction du bruit phylogénétique (5.2 % des quartets non résolus) Analyse phylogénétique portant sur E2/HVR1 interprétable / arbre : topologie « Tree-like » Dans ce cas : L’ arbre phylogénétique présentait des clusters / patient

Phylogénie et régions hypervariables Conclusion Phylogénie et régions hypervariables Nécessaire d’estimer au préalable le bruit phylogénétique TREE-PUZZLE : bon outil Rq : dans la littérature : nombreux arbres comparant des séquences de HVR1 - sans analyse préalable avec la méthode de quartet puzzling Quel sens donner à ces arbres ? Conseil 1 : Pour rendre interprétable l’analyse phylogénétique sur une région hypervariable - inclure les séquences flanquantes moins saturées en mutations

Phylogénie et régions hypervariables Conclusion Phylogénie et régions hypervariables Nécessaire d’estimer au préalable le bruit phylogénétique TREE-PUZZLE : bon outil Rq : dans la littérature : nombreux arbres comparant des séquences de HVR1 - sans analyse préalable avec la méthode de quartet puzzling Conseil 2 : Si la région d’intérêt étudiée inclut une région hypervariable - ôter cette région de l’alignement pour éliminer le bruit phylogénétique qui lui est inhérent