La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

1. LADN et linformation génétique. lADN linformation génétique est contenue dans lADN (ARN) (ADN) A G T C U.

Présentations similaires


Présentation au sujet: "1. LADN et linformation génétique. lADN linformation génétique est contenue dans lADN (ARN) (ADN) A G T C U."— Transcription de la présentation:

1 1. LADN et linformation génétique

2 lADN linformation génétique est contenue dans lADN (ARN) (ADN) A G T C U

3 traduction linformation génétique est organisée par triplets (codons)

4 1 triplet = 1 codon = 3 lettres = 1 acide aminé le code génétique le code génétique est dégénéré : 4 3 = 64 > 20 !

5 le gène unité de linformation génétique gène introns : non codantsexons : codants

6 le gène gène unité de linformation génétique

7 le génome organisation de linformation génétique chez la bactérie : Escherichia Coli bps 4732 gènes

8 le génome organisation de linformation génétique codant séquences répétées non codant pseudogènes chez lhomme : 3 milliards de pbs ~20000 gènes < 2 % dADN codant !

9 le génome quantité dADN codant en fonction de la taille du génome

10 ADN codant et non codant ADN « poubelle » exons introns pourquoi autant dADN non codant ? peut-on en comprendre le rôle ? en résumé :

11 2. étudier les séquences dADN

12 analyse des séquences comparaison entre séquences / alignement de séquences : recherche de gènes, comparaison despèces, de motifs répétés recherche de caractéristiques « globales » : rechercher des régularités, un « ordre » dans le désordre apparent… approche « déterministe » : approche statistique : 1.information mutuelle 2.fonction de corrélation / densité spectrale de puissance 3.techniques basées sur la « marche ADN » 4.…

13 de la séquence symbolique à une séquence numérique choisir un code binaire : par exemple ATGCATGC AGTCAGTC double liaison hydrogène triple liaison hydrogène ou purines pyrimidines n= … A T C G G T C A T A… n = … on peut donc étudier la variable numérique binaire n = 1 où n = position on obtient :

14 le signal n (ADN) signal aléatoire signal déterministe signal corrélé

15 3. fonction de corrélation et densité spectrale de puissance (DSP) xx ( ) S xx ( f ) T 1/T

16 fonction de corrélation de (t) : périodicité « cachée » / oscillations dans la corrélation fonction de corrélation (t) signal aléatoire fonction du temps t, stationnaire : ici sinus + bruit

17 fonction de corrélation Signal temporel mesure de la persistance (mémoire) dun signal : Une mesure de la « mémoire » du signal

18 (bruit blanc) Signal « sans mémoire » : chaque valeur est indépendante de la précédente fonction de corrélation bb ( ) = ( ) doù b 2 = bb ( ) = + b(t) b(t) signal stationnaire, b(t) = 0 (centré),

19 moyennes temporelles fonction de corrélation de (t) si « ergodique » : on peut remplacer la moyenne densemble par une moyenne sur le temps : chaque t 0 initial considéré comme une nouvelle réalisation ?

20 densité spectrale de puissance (DSP) Densité spectrale de puissance Théorème de Wiener-Khintchine : où limitée à lintérvalle [0, T] Estimateur de la DSP dun signal réel :

21 ( ) ~ exp(- / a) exponentielle S ( f ) ~ 1/( 1+(2 a f ) 2 ) lorentzienne f largeur de bande 2. échelle de « mémoire » = a largeur de bande 1/ a 1. périodicité « cachée » = T pic à la fréquence 1/T xx ( ) S xx ( f ) f T 1/T Fonction de corrélation et DSP

22 4. corrélation à longue portée dans lADN

23 si léchelle de mémoire est infinie ( xx ( ) nest pas intégrable) on parle de corrélation à longue portée. Typiquement, loi de puissance : corrélation à longue portée (échelle log) ) (échelle log) pente 1/ f (échelle log) S(f) (échelle log) pente 1/

24 dans lADN R. F. Voss, PRL, 1992 (variation de la méthode : construction de 4 sous-séquences 0/1 pour A, T, C, G) résultat 1 : pic à f = 1/3 cytomégalovirus, pbs (codant) résultat 2 : DSP 1/f le résultat semble plutôt général… (non codant) échelle log-log : log(DSP) - log(f) f=1/3

25 pour lADN codant des résultats controversés : pas de corrélation ? (Stanley group, ) LADN codant est sans doute moins corrélé que le non codant…

26 pourquoi une mémoire étendue ? procaryotes (bactéries et archea) ADN : un filament hautement compacté bps 2 cm dADN taille de la cellule 1 m ratio =

27 pourquoi une mémoire étendue ? eucaryotes : CHROMATINE ! Goodsell nucléosomes DNA histones nucléosomes fibre de chromatine chromatine DNA fibre de chromatine boucles noyau cellulaire parties verrouillées parties transcrites une structure fonctionnelle hautement organisée

28 dautres images

29 un rôle pour les séquences non codantes les séquences non codantes montrent toujours une corrélation à longue portée lADN « poubelle » participe à létablissement dun arrangement fonctionnel de lADN dans le noyau/la cellule ! la corrélation à longue portée indique la présence dun ordre global ; et lADN codant ? il a aussi un autre rôle, participe peut-être en moindre mesure…

30 5. en pratique

31 signal discret fonction de corrélation de n n = … A T C G G T C A T A C… n = … si =0 (autrement, on soustrait la moyenne) d = distance entre 2 sites le long de la séquence moyenne « temporelle » moyenne sur n (attention à la staionnarité…)

32 fonction de corrélation de n en pratique : sur un ordinateur, le signal est toujours discret ! z(t) (z 1, z 2, z 3, z 4,… z N ) = z pour nous, le signal est intrinsèquement discret (pas=1), car cest la séquence. sous scilab, on peut utiliser la fonction : corr : corr(z, d max ) =fonction de corrélation de x, en fonction de la distance d, pour d = 0, 1, 2,… d max -1 (remarque : corr soustrait automatiquement la moyenne de z)

33 DSP de n – 1. calculer la TF : x(t)x(t) t |X(f)| f SpectreSignal Signal échantillonné t Spectre périodique de période ƒ e = 1/t Signal echantillonné : x k = k t de 0 à T e = N T tktk xkxk f -f e f e /2 0 FFT du signal : ƒ n = n ƒ de 0 à ƒ e = N ƒ Transformée de Fourier Rapide : FFT

34 DSP de n – 2. déduire la DSP : Wiener-Khintchine : estimateur DSP = doù |fft(z)| 2 / N DSP de z sous scilab, commencer par soustraire la moyenne de z FFT = transformée de Fourier Rapide sous scilab : fft : fft(z, -1) = fft(z) = TF de z donne TF pour f = 0, f, 2f,… f e -1

35 fin


Télécharger ppt "1. LADN et linformation génétique. lADN linformation génétique est contenue dans lADN (ARN) (ADN) A G T C U."

Présentations similaires


Annonces Google