La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Un enfant de modulome : le projet ANR ‘LTR’ Dépôt ANR ‘génomique des plantes’, avril 2008.

Présentations similaires


Présentation au sujet: "Un enfant de modulome : le projet ANR ‘LTR’ Dépôt ANR ‘génomique des plantes’, avril 2008."— Transcription de la présentation:

1 Un enfant de modulome : le projet ANR ‘LTR’ Dépôt ANR ‘génomique des plantes’, avril 2008

2 2 Plan Retrotransposons à LTR (LTRR) –Description modèle statique modèle dynamique (mécanisme de duplication) –Méthodes en vigueur pour l’identification de LTR Projet LTR –Objectifs –Génomes visés –Partenaires –Modèle logique des LTRR avec Logol –En bonus : Stan ++

3 3 Retrotransposons à LTR (LTRR)

4 4 LTR : Modèle statique Rétro transposons à LTR (Long Terminal Repeats): encadrés par de longues répétitions non inversées. Eléments inter-LTR : codent la fabrication de différentes protéines dont une transcriptase inverse, une intégrase et une protéase. 2…6 1…100 1 000… 20 000 100…400 PPT PBS DR LTR gag polenv LTR

5 5 LTR : Modèle dynamique Mécanisme de réplication: «copier/coller ». Les différentes générations cohabitent dans la séquence.

6 6 LTR Modèle dynamique : Phase 1

7 7 LTR Modèle dynamique : Phase 2

8 8 LTR Modèle dynamique : Phase 3

9 9 LTR Modèle dynamique : Dernière phase

10 10 LTR Modèle dynamique : Résumé Mécanisme de réplication: «copier/coller ». Les différentes générations cohabitent dans la séquence.

11 11 Bien sûr: recombinaisons parfois plus compliquées

12 12 Exemple: Algorithme Rho et al., BMC Genomics 2007 3 étapes dans l’identification de rétrotransposons LTR: 1.LTR jeunes : paire de LTR de très forte identité >95% par recherche d’une paire à partir de répétitions exactes >40pb + à bonne distance + présence des gènes entre les 2 LTR 2.LTR solo : similaires aux jeunes LTR trouvés, mais tout seul 3.LTR anciens : association de 2 solos qui vont assez bien ensemble (rapprochement phylogénétique) LTR : méthodes actuelles d’identification : ~homologie 123 + = ??

13 13 Projet LTR

14 14 Projet LTR : Objectifs Cadre : dépôt ANR ‘génomique des plantes’ But: Paléontologie Génomique Recherche des rétrotransposons LTR en tenant compte du modèle dynamique (langage de modélisation : Logol) La vision structurées des LTRR devrait permettre de mieux faire le lien entre les différents LTRR et de reconstituer les générations => phylogénie Etude sur plusieurs génomes d’une même famille : peut aider à retrouver les traces les plus anciennes

15 15 Projet LTR : Génomes Drosophile Les 12 génomes de drosophile Riz : 11 espèces étudiées parmi les 22 Oryza Les 11 génomes seront entièrement séquencés en 2010

16 16 Projet LTR : Partenaires URGI-Evry : Hadi Quesneville & co Symbiose-Rennes : Jacques Nicolas & co LGDP-Perpignan : Olivier Panaud & co GIRI-Californie : Jerzy Jurka, Sébastien Tempel cf RepBase

17 17 Modèle logique des LTR : cas statique DR:[2..6], («tg», Ltr :[100..400]: 95%, «ca »), [1..100], pbs, [1 000..20 000], ppt, [1..100], («tg», Ltr : 95%, «ca»), DR Age 2…6 1…100 1 000… 20 000 100…400 PPT PBS DR LTR gag polenv LTR

18 18 Modèle logique des LTR: cas dynamique Génération suivante U3RU5 U3RU5 PPT PBS DR LTR 2…6 1…100 1 000… 20 000 100…400 gag polenv U3RU5 U3RU5 PPT PBS DR LTR gag polenv

19 19 Modèle logique des LTR: cas dynamique DR:[2..6], («tg», (A1,R,B1), «ca »), [1..100], pbs, [1 000..20 000], ppt, [1..100], («tg», (A2, R:90%, B2), «ca»), DR DR:[2..6], («tg», (A2, R,B1):[100..400]:95%, «ca »), [1..100], pbs, [1 000..20 000], ppt, [1..100], («tg», (A2, R, B1):95%, «ca»), DR Notion d’ancêtre commun Dynamique= Génération suivante Age Coefficient d’hybridation Recherche = remontée du temps

20 20 Projet LTR : Retombées sur STAN Parmi les produits envisagés par le projet : Nouvelle version de STAN - Expressivité augmentée (même si sous-ensemble de Logol): plusieurs variables de chaîne, plus de possibilités de définir des contraintes sur les segments etc. - Meilleure lisibilité du résultat (dans le modèle de départ)

21 21

22 22 3 steps in retrotransposons identification : 1.young LTR (software from research team) 2.solo LTR 3.old intact LTR Algorithm Rho et al. BMC Genomics 2007 123 + = ??

23 23 Young LTR identification Summary: Fast approximated string matching to find similarity in LTR and length filtering: –Pairs of occurrences of exact maximal repeats > 40 bp –Repeats were merged if they were proximal in the genome locations, if the length of the merged repeats is greater than 100 bp and the identity is greater than 80% If identity > 80% –Translate to protein (transeq) –Check against profile HMM (GAG….) (hmmsearch) If profile unknown: –Look at ORF length to find possibly new domains Remove known transposons found in UCSC database (manual curation)

24 24 Steps maximal exact direct 1 2 Group with length < 500*x + 1100 3 Make pairs within groups 4 Chain pairs 5 Find similarity LTR positions LTR sequences

25 25 Step 1.1 MR : maximal exact repeat Suffix Array ACGTTGCA… Find exact repeats of length>40 pos11,pos12 pos21,pos22 …. Filter pairs (a,b) such that 1100< pos(b) – pos(a)<16000 Genome Occurrences

26 26 Step 1.2 LTR pair 1 LTR pair 2 LTR pair 3 1600 group0group1 group4group3 … Group LTR pairs according to their distance (tool 500

27 27 Step 1.3/1.4 Steps 3 and 4 use same formulae to pair the LTR fragments but steps 3 focus on groups made in step 2 while step4 tries to link baig pairs with results of step 3 If all following conditions are satisfied, LTR fragments are merged <40 100<l<1000 1100<l<16000

28 28 Step 1.5 Similarity search (stretcher) between LTR pairs >80% transeq hmmsearch HMM profile(Asp, RnaseH, RVP…) LTR Known profile >700 unknown profile yes

29 29 Solo LTR identification Clusterize the found LTRs (BAG seq clustering) Requires LEDA C++ library license Web interface available On each cluster do: –Align cluster (clustalw) –Build HMM (hmmbuild) –Search HMM against complete sequence (hmmsearch) A new Perl script has been created to automate the per cluster operations as well as web BAG request

30 30 Old intact LTR identification To detect LTR with low similarity (old) Do phylogenetic analysis on all solo LTR within a same cluster (clustalw, phylip) 2 solo LTR = 1 old intact LTR if: –Low distance range in sequence (new perl script created to automate probable neighbours search) –Closest neighbors in the tree (dnadist, dnapars..? Which options?) (manual analysis)

31 31 LTR analysis New web interface (Php) created to look at LTR distribution along the sequence with zoom on required range LTR loaded in a database for queries and display (with cluster info, linked LTR…)

32 32 Structure générique des retrotransposon LTR DR:[2..6], («tg», Y:[100..400]:80%, «ca »), [1..100], pbs, [1 000..20 000], ppt, [1..100], («tg», Y:80%, «ca »), DR

33 33 Petit bestiaire LTR Les rétrotransposons à LTR sont généralement divisés en 4 groupes : –Ty1/copia, Ty3/gypsy; –DIRS et BEL chez les non végétaux; –LARDs et les TRIMs non autonomes chez les végétaux. PBS=Primer Binding Site tRNA GAG=Group specific AntiGen (capside) Polymerase Pol= AP+ Reverse Transcriptase+ INtegrase Env=Envelope PPT=PolyPurine Tract

34 34 Âge des éléments génétiques mobiles pour différentes espèces Evènements récents chez la mouche, beaucoup plus anciens chez l’homme.

35 35 Vers un projet ANR ? Paléontologie génomique des rétrotransposons à LTR sur les drosophiles; Idées clés : –Générer les ancêtres pour diminuer la distance entre copies; –Exploiter l’existence de 12 génomes pour retrouver les traces les plus anciennes; –Indexer les génomes de façon adaptée au type de répétitions; –Décrire abstraitement les copies de LTR dans les génomes à partir d’un modèle de LTR.


Télécharger ppt "Un enfant de modulome : le projet ANR ‘LTR’ Dépôt ANR ‘génomique des plantes’, avril 2008."

Présentations similaires


Annonces Google