BCM3531- Outils Bio-informatiques Lynda Dekakra-Bellili lynda.dekakra-bellili @umontreal.ca Hiver 2018
Plan du cours Mutagénèse par PCR Analyse de la séquence de laβ-galactosidase Analyse d’association génétique avec PLINK Analyse de données d’ARN-seq avec R Visualisation des résultats d’ARN-seq avec ggplot2 sur R Quiz 1 % ( 15 dernières minutes )
LacZ de l’opéron lactose – Gène rapporteur 3 gènes composent l’opéron : lacZ, lacY et lacA En amont de du promoteur P de l’opéron , il y a un gène qui code pour un régulateur de l’opéron : LacI En absence de lactose , il faut réprimer la synthèse nécessaire au transport et le métabolisme du lactose. - lacI est donc transcrit et la synthèse du répresseur a lieu. - Le répresseur lie la séquence opérateur O qui se trouve en aval du promoteur - La liaison du répresseur empêche donc le recrutement de l’ARN polymérase au niveau du promoteur P - Pas de transcription des gènes de structure de l’opéron En présence de lactose , le lactose est convertis en son analogue l’allolactose qui lie le répresseur afin de le rendre inactif. La synthèse des enzymes du métabolisme du lactose qui est désormais présent dans l’environnement peut se faire. http://www.hammiverse.com/lectures/18/4.html
LacZ de l’opéron lactose – Gène rapporteur Précipité bleu https://fr.wikipedia.org/wiki/X-gal https://www.bcm.edu/research/labs/joshua-wythe/reagent-requests/ssrsandlineagetracing
Transformation dans les bactéries compétentes + Xgal Expérience- Mutagénèse par PCR afin de recouvrir l’activité du peptide αde la β-galactosidase LacZ Synthèse Dénaturation pUC18 Hybridation des amorces (sens et anti-sens) ayant les sites de mutation LacZ muté β-galactosidase non fonctionnelle (codant stop TAG) Digestion de l’ADN parental non muté par la DPN I Transformation dans les bactéries compétentes + Xgal Ré-hybridation Vecteur codant pour uneβ-galactosidase fonctionnelle SÉQUENÇAGE Pour débuter le TP – Se rendre sur le site http://www-bac.esi.umontreal.ca/~dbcm3531/
Analyse de la séquence de laβ-galactosidase SECTION I Analyse de la séquence de laβ-galactosidase
Séquençage – Méthode Sanger Sur le terminal , visualiser le chromatogramme > trev nomdelasequence.ab1 Qualité de la séquence ? http://ib.bioninja.com.au/higher-level/topic-7-nucleic-acids/71-dna-structure-and-replic/dna-sequencing.html
Alignement du contig reverse sur pUC18 théorique http://www.ebi.ac.uk/Tools/psa/ Séquence reverse Brin théorique + ou - ? Alignement global ou local ?
Alignement par paires Comparaison de deux séquences entre elles Alignement global L’ensemble de la séquence. Deux séquences de même longueur et assez similaires . Alignement local Trouve les régions locales avec la plus haute similarité. http://www.majordifferences.com/2016/05/difference-between-global-and-local.html#.WchkWXCrHRA
Analyse d’association génétique avec PLINK SECTION II Analyse d’association génétique avec PLINK
Variations génétiques Variant génétique – région dans le génome qui est variable d’un individu à l’autre Variation mononucléotidique : >1% dans une population Variabilité du nombre de copies d’un gène Microsatellites ( séquences répétées en tandem) http://readingroom.mindspec.org/?page_id=8221 https://atlasofscience.org/single-nucleotide-polymorphisms-as-genomic-markers-for-high-throughput-pharmacogenomic-studies/
Études d’association génétique pangénomiques But - Identifient des facteurs de susceptibilité génétiques des maladies multifactorielles Comparer la fréquence de centaines de milliers de variants génétiques distribués sur l’ensemble des chromosomes entre un groupe de cas atteints de la maladie et un groupe témoins , en utilisant des technologies de génotypage à haut débit. Tenir de l’origine ethnique et géographique afin d’éviter une stratification de la population à l’étude Sans hypothèse préalable Une valeur de p-value < 5 × 10-8 généralement considérée significative Répliquer les associations significatives dans une population indépendante La valeur-p est une mesure statistique qui aide les scientifiques à déterminer si leurs hypothèses sont correctes. Celle-ci est utilisée pour savoir si les résultats d’une expérience se trouvent dans la gamme normale des valeurs pour un événement observé. Généralement, si la valeur P d’un jeu de données est au-dessous d’une valeur prédéterminée (comme 0,05 par exemple), les scientifiques rejetteront l’ « hypothèse nulle » de leur expérience – autrement dit, ils élimineront l’hypothèse selon laquelle les variables testées au cours de leur expérience n’ont aucun effet significatif sur les résultats. Dans ce cas , il faut que la valeur-p soit plus petite que 5 fois dix à la moins 8 . S Debette - Sang Thrombose Vaisseaux, 2012 - jle.com
PLINK- outil d’analyse d’association génétique 2 fichiers d’entrée plink_sim_hemoglobin.map plink_sim_hemoglobin.ped .map .ped
Modèle linéaire Phénotype - mesures de concentrations corpusculaires moyennes d'hémoglobine normalisées Test d’association d’un trait quantitatif Test linéaire dans PLINK plink --noweb --file plink_sim_hemoglobin --linear --out plink_output SNP significatifs ? Sont-ils associés à une augmentation ou une diminution de la concentration de l’hémoglobine ?
Analyse de données d’ARN-seq SECTION III Analyse de données d’ARN-seq
Expression différentielle de gènes Dans R Données d’ARN-seq analysées avec DESeq2 Cellules musculaires lisses traitées ou non au dexamethasone Changement dans l’expression de gènes ?
Visualiser les résultats d’ARN-Seq avec ggplot2 Les gènes dérégulés sont de part et d’autres du graphique https://www.r-bloggers.com/using-volcano-plots-in-r-to-visualize-microarray-and-rna-seq-results/
Quiz 1%