La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

1. L’ADN et l’information génétique

Présentations similaires


Présentation au sujet: "1. L’ADN et l’information génétique"— Transcription de la présentation:

1 1. L’ADN et l’information génétique

2 l’information génétique est contenue dans l’ADN
(ARN) A G T C U

3 traduction l’information génétique est organisée par triplets (codons)

4 le code génétique le code génétique est dégénéré : 43 = 64 > 20 !
1 triplet = 1 codon = 3 lettres = 1 acide aminé

5 le gène unité de l’information génétique gène introns : non codants
exons : codants Genome atlas of the L. bulgaricus genome. The seven circles (outer to inner) show the following. Circle 1, pseudogenes on positive (red) or negative (blue) strand. Circle 2, IS elements (transposases or ISL4-related hypothetical genes). Elements with fewer than four copies are represented in gray, and elements with more than five copies are represented by separate colors of red (ISL7), purple (ISL4), blue (ISL5), and green (ISL4ミ5). (See also Table 2.) Circle 3, CDS (excluding pseudogenes and transposases) on positive (red) or negative (blue) strand. Circle 4, rRNA (red) and tRNA (green) genes. Circle 5, [(G-C)/window size (2000)], from less than −0.1 (cyan) to more than +0.1 (red). Circle 6, [(A+T)/window size (500)], from <0.3 (cyan) to >0.7 (red). Circle 7, position on the genome. The genome atlas was constructed by using GENEWIZ software (53).

6 le gène unité de l’information génétique gène
Genome atlas of the L. bulgaricus genome. The seven circles (outer to inner) show the following. Circle 1, pseudogenes on positive (red) or negative (blue) strand. Circle 2, IS elements (transposases or ISL4-related hypothetical genes). Elements with fewer than four copies are represented in gray, and elements with more than five copies are represented by separate colors of red (ISL7), purple (ISL4), blue (ISL5), and green (ISL4ミ5). (See also Table 2.) Circle 3, CDS (excluding pseudogenes and transposases) on positive (red) or negative (blue) strand. Circle 4, rRNA (red) and tRNA (green) genes. Circle 5, [(G-C)/window size (2000)], from less than −0.1 (cyan) to more than +0.1 (red). Circle 6, [(A+T)/window size (500)], from <0.3 (cyan) to >0.7 (red). Circle 7, position on the genome. The genome atlas was constructed by using GENEWIZ software (53).

7 le génome organisation de l’information génétique
chez la bactérie : Escherichia Coli bps 4732 gènes A REVOIR Genome atlas of the L. bulgaricus genome. The seven circles (outer to inner) show the following. Circle 1, pseudogenes on positive (red) or negative (blue) strand. Circle 2, IS elements (transposases or ISL4-related hypothetical genes). Elements with fewer than four copies are represented in gray, and elements with more than five copies are represented by separate colors of red (ISL7), purple (ISL4), blue (ISL5), and green (ISL4ミ5). (See also Table 2.) Circle 3, CDS (excluding pseudogenes and transposases) on positive (red) or negative (blue) strand. Circle 4, rRNA (red) and tRNA (green) genes. Circle 5, [(G-C)/window size (2000)], from less than −0.1 (cyan) to more than +0.1 (red). Circle 6, [(A+T)/window size (500)], from <0.3 (cyan) to >0.7 (red). Circle 7, position on the genome. The genome atlas was constructed by using GENEWIZ software (53).

8 le génome organisation de l’information génétique chez l’homme :
3 milliards de pbs ~20000 gènes < 2 % d’ADN codant ! codant séquences répétées non codant pseudogènes Distribution of probes (black = coding, gray = noncoding + intergenic) and copy-number polymorphisms (red) on chromosome arm 3R.

9 le génome pourcent d’ADN non codant et « complexité » des organismes
quantité d’ADN codant en fonction de la taille du génome A REVOIR Genome atlas of the L. bulgaricus genome. The seven circles (outer to inner) show the following. Circle 1, pseudogenes on positive (red) or negative (blue) strand. Circle 2, IS elements (transposases or ISL4-related hypothetical genes). Elements with fewer than four copies are represented in gray, and elements with more than five copies are represented by separate colors of red (ISL7), purple (ISL4), blue (ISL5), and green (ISL4ミ5). (See also Table 2.) Circle 3, CDS (excluding pseudogenes and transposases) on positive (red) or negative (blue) strand. Circle 4, rRNA (red) and tRNA (green) genes. Circle 5, [(G-C)/window size (2000)], from less than −0.1 (cyan) to more than +0.1 (red). Circle 6, [(A+T)/window size (500)], from <0.3 (cyan) to >0.7 (red). Circle 7, position on the genome. The genome atlas was constructed by using GENEWIZ software (53).

10 ADN codant et non codant
en résumé : ADN « poubelle » exons introns pourquoi autant d’ADN non codant ? peut-on en comprendre le rôle ?

11 2. étudier les séquences d’ADN
approche « déterministe » : comparaison entre séquences / alignement de séquences : recherche de gènes recherche de similarités entre espèces - évolution recherches de motifs répétés - régulation, organisation à la recherche de caractéristiques « globales » : différencier les régions codantes et non codantes rechercher un « ordre » dans le désordre apparent… approche statistique :

12 analyse statistiques des séquences
qu’est-ce qui différencie les séquences d’ADN de simples séquences aléatoires ? mesurer l’ordre dans l’ADN information mutuelle fonction de corrélation / densité spectrale de puissance techniques basées sur la « marche ADN » il y a plusieurs outils informatiques/numériques pour le faire :

13 de la séquence symbolique à une séquence numérique
choisir un code binaire : par exemple A T G C double liaison hydrogène triple liaison hydrogène ou purines pyrimidines +1 -1 n= … A T C G G T C A T A…           n= … on peut donc étudier la variable numérique binaire n =  où n = position on obtient :

14 le signal n (ADN) signal aléatoire signal déterministe signal corrélé

15 3. fonction de corrélation et densité spectrale de puissance (DSP)
xx() Sxx( f ) T 1/T TABLEAU: déf stationnaire fonc corr def expliquer dessin ensemble ergodique => moy temporelle dessin rem on est ici dans le continu signal completement aléatoire = bruit blanc par déf : fonc correl =0 sauf à 0 (dirac) donc si fonc corr diff de 0 => le signal depend des valeurs précedentes exemple limite signal déterministe ex sinus (autres fonctions? faire !!) signal correlé : 3 slides suivantes

16 fonction de corrélation
soit (t) signal aléatoire fonction du temps t, stationnaire : 1. on peut définir la fonction de corrélation de (t) 2. si « ergodique », on peut remplacer la moyenne d’ensemble par une moyenne sur le temps : chaque t0 initial considéré comme une nouvelle réalisation TABLEAU: déf stationnaire fonc corr def expliquer dessin ensemble ergodique => moy temporelle dessin rem on est ici dans le continu signal completement aléatoire = bruit blanc par déf : fonc correl =0 sauf à 0 (dirac) donc si fonc corr diff de 0 => le signal depend des valeurs précedentes exemple limite signal déterministe ex sinus (autres fonctions? faire !!) signal correlé : 3 slides suivantes

17 fonction de corrélation
Signal temporel Périodicités cachées Signal musical (Strauss) : La fonction de corrélation présente de pics pour des retards  multiples du « tempo » t (sec) fonction de corrélation  (msec)

18 fonction de corrélation
Signaux persistants : la fonction de corrélation décroît plus lentement pour des signaux qui ont tendance à varier lentement Signal temporel fonction de corrélation Une mesure de la « mémoire » du signal

19 fonction de corrélation
(bruit blanc) Signal « sans mémoire » : chaque valeur est indépendante de la précédente b(t) b(t) signal stationnaire, b(t) = 0 (centré), bb() = () d’où b2 = bb() = + fonction de corrélation

20 effet du bruit

21 densité spectrale de puissance (DSP)
3. on peut passer à la représentation en fréquence par transformée de Fourier (TF) : on obtient la densité spectrale de puissance 4. Théorème de Wiener-Khintchine : où limitée à l’intérvalle [0, T] 5. On peut alors évaluer S( f ) directement à partir du signal : estimateur de la DSP d’un signal réel : AU TABLEAU def de TF WK + dessin de xT(t) rond autour de l’estimateur puis : TF de dirac = bruit *blanc* TF de cos = +-f TF des exemples précedents = slide suivant

22 Fonction de corrélation et DSP
1. périodicité « cachée » = T  pic à la fréquence  1/T xx() Sxx( f ) f T 1/T  () ~ exp(- /a) exponentielle S ( f ) ~ 1/( 1+(2  a f )2 ) lorentzienne f largeur de bande 2. échelle de « mémoire » = a  largeur de bande  1/a

23 4. corrélation à longue portée

24 corrélation à longue portée
si l’échelle de mémoire est infinie (xx() n’est pas intégrable) on parle de corrélation à longue portée. Typiquement, loi de puissance : t (échelle log) j(t) (échelle log) pente 1/a pente 1/b S(f) (échelle log) f (échelle log)

25 5. corrélation et ADN

26 ADN : résultat 1 – périodicité 3
périodicité dans la fonction de corrélation positions n = 3i positions n = 3i+1, 3i+2 d C(d) lié à la structure en triplets (codons) du code génétique ; mais comment ? pourquoi ?

27 résultat 2 – corrélation à longue portée
le résultat semble plutôt général… (non codant) (variation de la méthode : construction de 4 sous-séquences 0/1 pour A, T, C, G) cytomégalovirus, pbs (codant)  résultat 2 : DSP  1/f f=1/3 résultat 1 : pic à f = 1/3 R. F. Voss, PRL, 1992 échelle log-log : log(DSP)  - log(f)

28 pour l’ADN codant des résultats controversés :
pas de corrélation ? (Stanley group, ) L’ADN codant est sans doute moins corrélé que le non codant

29 revenons à la fonction de corrélation
pour bien analyser les résultats obtenus : positions n = 3i positions n = 3i+1, 3i+2 d C(d) on la reporte en échelle log : décroissance en d corrélation longue portée pour « une base sur trois » ? d C(d) séquence codante comment évolue l’amplitude des pics en position 3i ?

30 séquences codantes : la dégénérescence du code laisse « passer » un peu de corrélation longue portée dégénérescence sur la troisième lettre du codon H calculé sur différentes échelles q introns : H≈0.6 position 1 du codon : H≈0.55 position 2 du codon : H≈0.55 position 3 du codon : H≈0.58 Arnéodo group, la position 3 du codon, plus libre, peut suivre la contrainte « globale »

31 pourquoi une mémoire étendue ?
procaryotes (bactéries et archea) bps  2 cm d’ADN taille de la cellule 1 m ratio = ADN : un filament hautement compacté

32 pourquoi une mémoire étendue ?
eucaryotes : CHROMATINE ! Goodsell nucléosomes DNA histones fibre de chromatine chromatine boucles noyau cellulaire parties verrouillées parties transcrites une structure fonctionnelle hautement organisée

33 d’autres images

34 un rôle pour les séquences non codantes
la corrélation à longue portée indique la présence d’un ordre global ; les séquences non codantes montrent toujours une corrélation à longue portée  l’ADN « poubelle » participe à l’établissement d’un arrangement fonctionnel de l’ADN dans le noyau/la cellule !

35 interprétation rôle de la fonction biologique :
corrélation longue portée : en général, reflet d’une contrainte sur l’ordre global de l’ADN codage d’une protéine : représente une contrainte sur le choix des bases, lié à la bonne séquence d’a.a. séquences non codantes séquences codantes soumises à deux contraintes : peut-on les « simuler » ? mais on peut revoir comme un questionnement autour de la trascription. qu’est ce que c’est dans les procaryotes c’est ca

36 signal discret fonction de corrélation de n
n = … A T C G G T C A T A C…            n= … n signal aléatoire discret fonction de la position n plutôt que du temps t : si <n>=0 (autrement, on soustrait la moyenne) alors la fonction de corrélation s’écrit d = distance entre 2 sites le long de la séquence moyenne d’ensemble  moyenne sur n

37  fonction de corrélation de n
en pratique : sur un ordinateur, le signal est toujours discret ! z(t)  (z1, z2, z3, z4,… zN) = z pour nous, le signal est intrinsèquement discret (pas=1), car c’est la séquence. sous scilab, il donc d’utiliser la fonction : corr : corr(z, dmax) = fonction de corrélation de x, en fonction de la distance d, pour d = 0, 1, 2,… dmax-1 sous scilab, corr soustrait automatiquement la moyenne de z

38  DSP de n – 1. calculer la TF :
x(t) t |X(f)| f Spectre Signal Signal échantillonné ∆t  Spectre périodique de période ƒe = 1/∆t Signal echantillonné : xk = k t de 0 à Te = N ∆T tk xk f -fe fe/2 FFT du signal : ƒn = n ƒ de 0 à ƒe = N ∆ƒ Transformée de Fourier Rapide : FFT

39  DSP de n – 2. déduire la DSP:
FFT = transformée de Fourier Rapide sous scilab : fft : fft(z, -1) = fft(z) = TF de z donne la TF pour f = 0, ∆f, 2∆f,… fe-1 Wiener-Khintchine : estimateur DSP = d’où |fft(z)|2 / N ≈ DSP de z sous scilab, commencer par soustraire la moyenne de z

40 fin

41 1. information mutuelle probabilité jointe d’avoir les symboles i et j à distance d probabilités d’avoir les symboles i et j (densités) zéro si indépendants car Pij(d)=PiPj remarque : en thermo, S = -kB∑pilnpi … c’est une mesure d’entropie! voir « entropie de Shannon »


Télécharger ppt "1. L’ADN et l’information génétique"

Présentations similaires


Annonces Google