Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
Publié parSandrine Villeneuve Modifié depuis plus de 6 années
1
CAPRISNP Détection et sélection de SNPs pour la construction d'une puce 50K caprine
2
Contexte Consortium Equipes impliquées Ref site web
3
Génome de référence Assemblage produit par les chinois :
scaffolds/contigs => longueur totale = pb - avec des longueurs de 100 pb à pb Bejing Genome Institute / Kumming Institute of Zoology / Inner Mongolia Agricultural University, China (W. Zhang, W. Wang) 2 731 scaffolds > 10 kb => 97.2%
4
Les données INRA (Ph. Mulsant / R. Rupp / C.Moreno) :
RRL of 6 goats (454) and whole genome sequencing (HiSeq) of 13 Alpine, Saanen and Creole Malaysian Agricultural Research and Development Institute, Malaysia & DNA Landmarks, Canada (JJ Abdullah / TP Yu) : Whole genome sequencing of 3*20 Boer, Savanna and Kacang meat and indigenous goats University of Utrecht, Netherlands (H. Heuven / M. Groenen) RRL of 17 Saanen dairy goats. 120 millions of 32 bp paired-ends sequences Autres : EST + gènes d'intérêt
5
Le pipeline – données INRA (et hollandaises)
samtools merge Alpine.bam Saanen.bam Créole.bam Filtre - qualité de mapping > 30 - alignement unique BWA aln samtools sort samtools mpileup bcftools view Alpine.bcf Saanen.bcf Créole.bcf Filtre - vcfutils.pl varFilter - SNPs homozygote A + S + C varFilter : - profondeur min 6 - profondeur max 100 - min. allèle minoritaire 2 Alpine.bcf Saanen.bcf Créole.bcf
6
Les données -1- Créoles Alpines (10) Saanens (5 + 8)
(6 lanes – 3 indiv.) Alpines (10) (10 lanes – 7 indiv.) Saanens (5 + 8) (Holl. 5 lanes) (INRA 8 lanes – 6 indiv.)
7
Les données -2-
8
Le pipeline – données externes
Données malésiennes Alignement BWA (bwasw) Extraction de la position des SNPs Construction du fichier pour chargement dans la base de données EST Alignement BWA (bwasw) Validation par alignement SIM4 Extraction de la position des SNPs Construction du fichier pour chargement dans la base de données
9
Les données externes
10
Chargement en base de données
Alpine.bcf #Chrom Pos Race Ref A C G T createDB.pl Table des SNPs
11
Chargement en base de données
Alpine.bcf #Chrom Pos Race Ref A C G T createDB.pl Table des SNPs
12
Chargement en base de données
Alpine.bcf #Chrom Pos Race Ref A C G T createDB.pl Table des SNPs Infinium - II : autres => 1 sonde - I : A/T et C/G => 2 sondes
13
Nombre de SNP par catégorie avant filtrage
entrées dans la table avec : Indels SNPs 1 : EST 2 : Hétéroz. dans 5 races 3 et 4 : Hétéroz. dans 4 races 5 et 6 : Hétéroz. dans 3 races 10 : Hétéroz. S et A 11 : Hétéroz. (A ou S) et (C ou B ou KS) 12 : Hétéroz. C et (B ou KS) 13 : Hétéroz. A ou S 20 : autres 90 : INDEL SNPs
14
Sélection des SNPs 537 145 SNPs Sélection des SNPs :
Table des SNPs Sélection des SNPs : Présent sur un scaffold > pb Bi-allélique « Frame » minimun de 20 pb MAF > 0.2 Illumina > 0.8 Infinium II Tri de la sélection : Catégorie croissante MAF décroissante Sélection + Tri SNPs triés par catégorie et MAF SNPs Répartition SNPs sélectionnés alternatifs
15
Sélection des SNPs 537 145 SNPs Sélection des SNPs :
Table des SNPs Sélection des SNPs : Présent sur un scaffold > pb Bi-allélique « Frame » minimun de 20 pb MAF > 0.2 Illumina > 0.8 Infinium II Tri de la sélection : Catégorie croissante MAF décroissante Sélection + Tri SNPs triés par catégorie et MAF SNPs Répartition X X Avec X = pb / = pb SNPs sélectionnés alternatifs
16
Sélection des SNPs 537 145 SNPs Sélection des SNPs :
Table des SNPs Sélection des SNPs : Présent sur un scaffold > pb Bi-allélique « Frame » minimun de 20 pb MAF > 0.2 Illumina > 0.8 Infinium II Tri de la sélection : Catégorie croissante MAF décroissante Sélection + Tri SNPs triés par catégorie et MAF SNPs Répartition SNPs sélectionnés alternatifs
17
Sélection des SNPs 537 145 SNPs Sélection des SNPs :
Table des SNPs Sélection des SNPs : Présent sur un scaffold > pb Bi-allélique « Frame » minimun de 20 pb MAF > 0.2 Illumina > 0.8 Infinium II Tri de la sélection : Catégorie croissante MAF décroissante Sélection + Tri SNPs triés par catégorie et MAF SNPs Répartition SNPs sélectionnés alternatifs
18
Sélection des SNPs 537 145 SNPs Sélection des SNPs :
Table des SNPs Sélection des SNPs : Présent sur un scaffold > pb Bi-allélique « Frame » minimun de 20 pb MAF > 0.2 Illumina > 0.8 Infinium II Tri de la sélection : Catégorie croissante MAF décroissante Sélection + Tri SNPs triés par catégorie et MAF SNPs Répartition SNPs sélectionnés alternatifs
19
60 000 SNPs - Par catégorie 5 races => ~38% 4 races => ~78%
1 : EST 2 : Hétéroz. dans 5 races 3 et 4 : Hétéroz. dans 4 races 5 et 6 : Hétéroz. dans 3 races 10 : Hétéroz. S et A 11 : Hétéroz. (A ou S) et (C ou B ou KS) 12 : Hétéroz. C et (B ou KS) 13 : Hétéroz. A ou S 20 : autres 90 : INDEL 5 races => ~38% 4 races => ~78% 3 races => ~96%
20
60 000 SNPs - Par catégorie et « frame »
21
60 000 SNPs - MAF - Score illumina
22
SNPs - Répartition
23
60 000 SNPs - Pourcentage par race
1 684 SNPs EST
24
SNPs - Répartion vs UMD3 3 316 scaffold/chr. => Longueur totale = pb 30 chromosomes => pb Localisation bovine des SNPs : SNPs localisés avec bwa bwasw (150 / SNP / 150) SNPs localisés sur un chr bovin
25
Merci pour votre attention ...
26
260 regions > pb
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.