1. L’ADN et l’information génétique

Slides:



Advertisements
Présentations similaires
La Cyclostationnarité Aspects théoriques et application au Diagnostic
Advertisements

Analyse Spectrale de Fourier
Analyse temps-fréquence
Calculs de complexité d'algorithmes
Calcul de la composition fréquentielle du signal audio
Du signal continu au numérique
Mesures dans le domaine fréquentiel
L’information génétique
Modulation numérique.
GENETIQUE I. RAPPELS 1. STRUCTURE DE LA CELLULE 2. chromosome.
1. L’ADN et l’information génétique
La transformée de Fourier en pratique
Colloque GRETSI, Paris, 8-11 septembre 2003 Sur la Décomposition Modale Empirique P. Flandrin (Cnrs - Éns Lyon) et P. Gonçalvès (Inrialpes)
Colloque Traitement et Analyse de séquences : compte-rendu

Cours analyse spectrale Part I
Régression -corrélation
Acide désoxyribonucléique : ADN
SON COMPLEXE - SPECTRE Le son pur est un modèle mathématique (sinusoïde…) Un son complexe peut être décomposé en une sommes de sinusoïdes (Théorème de.
ADN.
Le noyau : le centre de commande de la cellule
LA SYNTHÈSE DES PROTÉINES
4.2 – Structure des acides nucléiques
L’EPISSAGE ALTERNATIF DE L’ARN
Projet Génome Humain (HGP)
Activité 5. Du génome au protéome
Le code génétique Biologie 122.
1. Information génétique et protéines
Le code génétique.
TP 5 Du génome au protéome
La synthèse des protéines
Signaux aléatoires.
Transformée de Fourier discrète et transformée de Fourier rapide
Le ribosome.
La transcription.
Rappels de 1èreS Rappelez la définition du génotype et celle du phénotype. Génotype : ensemble des gènes d’un individu existant sous leur forme allélique.
L’ADN, d’un fil à un chromosome…
ELG La transformée de Fourier, énergie, puissance et densités spectrales.
Expression du Génome Le transcriptome.
LA SYNTHÈSE DES PROTÉINES
ADN à ARN La synthèse des protéines étape 1
Dispersion de gènes et structures génétiques spatiales
L’arbre du vivant.
ADN.
1) Structure du noyau 2) Structure des gènes et des chromosomes
LA SYNTHÈSE DES PROTÉINES
Chapitre 7.3 Réplication de l’ADN
La structure et la reproduction de l’ ADN
Transformée de Fourier en Temps Continu (TFTC)
TNS et Analyse Spectrale
DU TRAITEMENT DU SIGNAL
Quand la génétique s'en mêle.
TNS et Analyse Spectrale
Théorie de Files d’Attente
TNS et Analyse Spectrale
De l’ADN aux protéines Introduction.
De l’ADN aux protéines.
Calcul numérique de la transformée de Fourier Applications:
Structure et fonctions de l’ADN
Réunion MODULOME 15/10/2007 Christine ROUSSEAU Recherche des CRISPRs : Résultats MODULOME.
DU TRAITEMENT DU SIGNAL
Calcul de la composition fréquentielle du signal audio
ANALYSE DES SERIES CHRONOLOGIQUES METHODES ET APPLICATIONS EN HYDROLOGIE Danièle VALDES-LAO
Le noyau : le centre de commande de la cellule
Exercice L’EPISSAGE ALTERNATIF DE L’ARN
Chapitre 2 : La nature du vivant.
Régulation de l’expression génétique: la transcription
ECHANTILLONAGE ET ESTIMATION
RASAHOLIARISON Nomena Interne 1 er semestre en Neurologie USFR Neurologie CHU-JRB FACULTE DE MEDECINE UNIVERSITE D’ANTANANARIVO Cours du 01 avril 2015.
ADN : Acide désoxyribonucléique Santatra Ratsitohara RAZAFINDRASATA Interne des hôpitaux en Neurologie 1 er semestre – USFR Neurologie CHU/JRB FACULTE.
Transcription de la présentation:

1. L’ADN et l’information génétique

l’information génétique est contenue dans l’ADN (ARN) A G T C U

traduction l’information génétique est organisée par triplets (codons)

le code génétique le code génétique est dégénéré : 43 = 64 > 20 ! 1 triplet = 1 codon = 3 lettres = 1 acide aminé

le gène unité de l’information génétique gène introns : non codants exons : codants Genome atlas of the L. bulgaricus genome. The seven circles (outer to inner) show the following. Circle 1, pseudogenes on positive (red) or negative (blue) strand. Circle 2, IS elements (transposases or ISL4-related hypothetical genes). Elements with fewer than four copies are represented in gray, and elements with more than five copies are represented by separate colors of red (ISL7), purple (ISL4), blue (ISL5), and green (ISL4ミ5). (See also Table 2.) Circle 3, CDS (excluding pseudogenes and transposases) on positive (red) or negative (blue) strand. Circle 4, rRNA (red) and tRNA (green) genes. Circle 5, [(G-C)/window size (2000)], from less than −0.1 (cyan) to more than +0.1 (red). Circle 6, [(A+T)/window size (500)], from <0.3 (cyan) to >0.7 (red). Circle 7, position on the genome. The genome atlas was constructed by using GENEWIZ software (53).

le gène unité de l’information génétique gène Genome atlas of the L. bulgaricus genome. The seven circles (outer to inner) show the following. Circle 1, pseudogenes on positive (red) or negative (blue) strand. Circle 2, IS elements (transposases or ISL4-related hypothetical genes). Elements with fewer than four copies are represented in gray, and elements with more than five copies are represented by separate colors of red (ISL7), purple (ISL4), blue (ISL5), and green (ISL4ミ5). (See also Table 2.) Circle 3, CDS (excluding pseudogenes and transposases) on positive (red) or negative (blue) strand. Circle 4, rRNA (red) and tRNA (green) genes. Circle 5, [(G-C)/window size (2000)], from less than −0.1 (cyan) to more than +0.1 (red). Circle 6, [(A+T)/window size (500)], from <0.3 (cyan) to >0.7 (red). Circle 7, position on the genome. The genome atlas was constructed by using GENEWIZ software (53).

le génome organisation de l’information génétique chez la bactérie : Escherichia Coli 4938920 bps 4732 gènes A REVOIR Genome atlas of the L. bulgaricus genome. The seven circles (outer to inner) show the following. Circle 1, pseudogenes on positive (red) or negative (blue) strand. Circle 2, IS elements (transposases or ISL4-related hypothetical genes). Elements with fewer than four copies are represented in gray, and elements with more than five copies are represented by separate colors of red (ISL7), purple (ISL4), blue (ISL5), and green (ISL4ミ5). (See also Table 2.) Circle 3, CDS (excluding pseudogenes and transposases) on positive (red) or negative (blue) strand. Circle 4, rRNA (red) and tRNA (green) genes. Circle 5, [(G-C)/window size (2000)], from less than −0.1 (cyan) to more than +0.1 (red). Circle 6, [(A+T)/window size (500)], from <0.3 (cyan) to >0.7 (red). Circle 7, position on the genome. The genome atlas was constructed by using GENEWIZ software (53).

le génome organisation de l’information génétique chez l’homme : 3 milliards de pbs ~20000 gènes < 2 % d’ADN codant ! codant séquences répétées non codant pseudogènes Distribution of probes (black = coding, gray = noncoding + intergenic) and copy-number polymorphisms (red) on chromosome arm 3R.

le génome quantité d’ADN codant en fonction de la taille du génome A REVOIR Genome atlas of the L. bulgaricus genome. The seven circles (outer to inner) show the following. Circle 1, pseudogenes on positive (red) or negative (blue) strand. Circle 2, IS elements (transposases or ISL4-related hypothetical genes). Elements with fewer than four copies are represented in gray, and elements with more than five copies are represented by separate colors of red (ISL7), purple (ISL4), blue (ISL5), and green (ISL4ミ5). (See also Table 2.) Circle 3, CDS (excluding pseudogenes and transposases) on positive (red) or negative (blue) strand. Circle 4, rRNA (red) and tRNA (green) genes. Circle 5, [(G-C)/window size (2000)], from less than −0.1 (cyan) to more than +0.1 (red). Circle 6, [(A+T)/window size (500)], from <0.3 (cyan) to >0.7 (red). Circle 7, position on the genome. The genome atlas was constructed by using GENEWIZ software (53).

ADN codant et non codant en résumé : ADN « poubelle » exons introns pourquoi autant d’ADN non codant ? peut-on en comprendre le rôle ?

2. étudier les séquences d’ADN

analyse des séquences approche « déterministe » : comparaison entre séquences / alignement de séquences : recherche de gènes, comparaison d’espèces, de motifs répétés recherche de caractéristiques « globales » : rechercher des régularités, un « ordre » dans le désordre apparent… approche statistique : information mutuelle fonction de corrélation / densité spectrale de puissance techniques basées sur la « marche ADN » …

de la séquence symbolique à une séquence numérique choisir un code binaire : par exemple A T G C double liaison hydrogène triple liaison hydrogène ou purines pyrimidines +1 -1 n=1 2 3 4 5 6 7 8 9 10… A T C G G T C A T A…           n= +1 +1 -1 -1 -1 +1 -1 +1 +1 +1… on peut donc étudier la variable numérique binaire n =  1 où n = position on obtient :

le signal n (ADN) signal aléatoire signal déterministe signal corrélé

3. fonction de corrélation et densité spectrale de puissance (DSP) xx() Sxx( f )  T 1/T TABLEAU: déf stationnaire fonc corr def expliquer dessin ensemble ergodique => moy temporelle dessin rem on est ici dans le continu signal completement aléatoire = bruit blanc par déf : fonc correl =0 sauf à 0 (dirac) donc si fonc corr diff de 0 => le signal depend des valeurs précedentes exemple limite signal déterministe ex sinus (autres fonctions? faire !!) signal correlé : 3 slides suivantes

fonction de corrélation (t) signal aléatoire fonction du temps t, stationnaire : ici sinus + bruit jxx(t) fonction de corrélation de (t) : périodicité « cachée » / oscillations dans la corrélation

fonction de corrélation mesure de la persistance (mémoire) d’un signal : Signal temporel fonction de corrélation Une mesure de la « mémoire » du signal

fonction de corrélation (bruit blanc) Signal « sans mémoire » : chaque valeur est indépendante de la précédente b(t) b(t) signal stationnaire, b(t) = 0 (centré),  bb() = () d’où b2 = bb() = + fonction de corrélation 

moyennes temporelles fonction de corrélation de (t) ? si « ergodique » : on peut remplacer la moyenne d’ensemble par une moyenne sur le temps : chaque t0 initial considéré comme une nouvelle réalisation TABLEAU: déf stationnaire fonc corr def expliquer dessin ensemble ergodique => moy temporelle dessin rem on est ici dans le continu signal completement aléatoire = bruit blanc par déf : fonc correl =0 sauf à 0 (dirac) donc si fonc corr diff de 0 => le signal depend des valeurs précedentes exemple limite signal déterministe ex sinus (autres fonctions? faire !!) signal correlé : 3 slides suivantes

densité spectrale de puissance (DSP) Théorème de Wiener-Khintchine : où limitée à l’intérvalle [0, T] Estimateur de la DSP d’un signal réel : AU TABLEAU def de TF WK + dessin de xT(t) rond autour de l’estimateur puis : TF de dirac = bruit *blanc* TF de cos = +-f TF des exemples précedents = slide suivant

Fonction de corrélation et DSP 1. périodicité « cachée » = T  pic à la fréquence  1/T xx() Sxx( f ) f  T 1/T  () ~ exp(- /a) exponentielle S ( f ) ~ 1/( 1+(2  a f )2 ) lorentzienne  f largeur de bande 2. échelle de « mémoire » = a  largeur de bande  1/a

4. corrélation à longue portée dans l’ADN http://www.scholarpedia.org/article/1/f_noise

corrélation à longue portée si l’échelle de mémoire est infinie (xx() n’est pas intégrable) on parle de corrélation à longue portée. Typiquement, loi de puissance :  t (échelle log) j(t) (échelle log) pente 1/a pente 1/b S(f) (échelle log) f (échelle log)

dans l’ADN résultat 1 : pic à f = 1/3 le résultat semble plutôt général… (non codant) (variation de la méthode : construction de 4 sous-séquences 0/1 pour A, T, C, G) cytomégalovirus, 230000 pbs (codant)  résultat 2 : DSP  1/f f=1/3 résultat 1 : pic à f = 1/3 R. F. Voss, PRL, 1992 échelle log-log : log(DSP)  - log(f)

pour l’ADN codant des résultats controversés : pas de corrélation ? (Stanley group, 1992-1995) L’ADN codant est sans doute moins corrélé que le non codant…

pourquoi une mémoire étendue ? procaryotes (bactéries et archea) 4 600 000 bps  2 cm d’ADN taille de la cellule 1 m ratio = 5 10-5 ADN : un filament hautement compacté

pourquoi une mémoire étendue ? eucaryotes : CHROMATINE ! Goodsell nucléosomes DNA histones fibre de chromatine chromatine boucles noyau cellulaire parties verrouillées parties transcrites une structure fonctionnelle hautement organisée

d’autres images

un rôle pour les séquences non codantes la corrélation à longue portée indique la présence d’un ordre global ; les séquences non codantes montrent toujours une corrélation à longue portée  l’ADN « poubelle » participe à l’établissement d’un arrangement fonctionnel de l’ADN dans le noyau/la cellule ! et l’ADN codant ? il a aussi un autre rôle, participe peut-être en moindre mesure…

5. en pratique

signal discret fonction de corrélation de n n = 1 2 3 4 5 6 7 8 9 10 11… A T C G G T C A T A C…            n= +1 +1 -1 -1 -1 +1 -1 +1 +1 +1 -1… si <n>=0 (autrement, on soustrait la moyenne) d = distance entre 2 sites le long de la séquence moyenne « temporelle »  moyenne sur n (attention à la staionnarité…)

 fonction de corrélation de n en pratique : sur un ordinateur, le signal est toujours discret ! z(t)  (z1, z2, z3, z4,… zN) = z pour nous, le signal est intrinsèquement discret (pas=1), car c’est la séquence. sous scilab, on peut utiliser la fonction : corr : corr(z, dmax) = fonction de corrélation de x, en fonction de la distance d, pour d = 0, 1, 2,… dmax-1 (remarque : corr soustrait automatiquement la moyenne de z)

 DSP de n – 1. calculer la TF : x(t) t |X(f)| f Spectre Signal Signal échantillonné ∆t  Spectre périodique de période ƒe = 1/∆t Signal echantillonné : xk = k t de 0 à Te = N ∆T tk xk f -fe fe/2 FFT du signal : ƒn = n ƒ de 0 à ƒe = N ∆ƒ Transformée de Fourier Rapide : FFT

 DSP de n – 2. déduire la DSP : FFT = transformée de Fourier Rapide sous scilab : fft : fft(z, -1) = fft(z) = TF de z donne TF pour f = 0, ∆f, 2∆f,… fe-1 Wiener-Khintchine : estimateur DSP = d’où |fft(z)|2 / N ≈ DSP de z sous scilab, commencer par soustraire la moyenne de z

fin