La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Contexte Consortium Equipes impliquées Ref site web.

Présentations similaires


Présentation au sujet: "Contexte Consortium Equipes impliquées Ref site web."— Transcription de la présentation:

1 CAPRISNP Détection et sélection de SNPs pour la construction d'une puce 50K caprine

2 Contexte Consortium Equipes impliquées Ref site web

3 Génome de référence Assemblage produit par les chinois :
scaffolds/contigs => longueur totale = pb - avec des longueurs de 100 pb à pb Bejing Genome Institute / Kumming Institute of Zoology / Inner Mongolia Agricultural University, China (W. Zhang, W. Wang) 2 731 scaffolds > 10 kb => 97.2%

4 Les données INRA (Ph. Mulsant / R. Rupp / C.Moreno) :
RRL of 6 goats (454) and whole genome sequencing (HiSeq) of 13 Alpine, Saanen and Creole Malaysian Agricultural Research and Development Institute, Malaysia & DNA Landmarks, Canada (JJ Abdullah / TP Yu) : Whole genome sequencing of 3*20 Boer, Savanna and Kacang meat and indigenous goats University of Utrecht, Netherlands (H. Heuven / M. Groenen) RRL of 17 Saanen dairy goats. 120 millions of 32 bp paired-ends sequences Autres : EST + gènes d'intérêt

5 Le pipeline – données INRA (et hollandaises)
samtools merge Alpine.bam Saanen.bam Créole.bam Filtre - qualité de mapping > 30 - alignement unique BWA aln samtools sort samtools mpileup bcftools view Alpine.bcf Saanen.bcf Créole.bcf Filtre - vcfutils.pl varFilter - SNPs homozygote A + S + C varFilter : - profondeur min 6 - profondeur max 100 - min. allèle minoritaire 2 Alpine.bcf Saanen.bcf Créole.bcf

6 Les données -1- Créoles Alpines (10) Saanens (5 + 8)
(6 lanes – 3 indiv.) Alpines (10) (10 lanes – 7 indiv.) Saanens (5 + 8) (Holl. 5 lanes) (INRA 8 lanes – 6 indiv.)

7 Les données -2-

8 Le pipeline – données externes
Données malésiennes Alignement BWA (bwasw) Extraction de la position des SNPs Construction du fichier pour chargement dans la base de données EST Alignement BWA (bwasw) Validation par alignement SIM4 Extraction de la position des SNPs Construction du fichier pour chargement dans la base de données

9 Les données externes

10 Chargement en base de données
Alpine.bcf #Chrom Pos Race Ref A C G T createDB.pl Table des SNPs

11 Chargement en base de données
Alpine.bcf #Chrom Pos Race Ref A C G T createDB.pl Table des SNPs

12 Chargement en base de données
Alpine.bcf #Chrom Pos Race Ref A C G T createDB.pl Table des SNPs Infinium - II : autres => 1 sonde - I : A/T et C/G => 2 sondes

13 Nombre de SNP par catégorie avant filtrage
entrées dans la table avec : Indels SNPs 1 : EST 2 : Hétéroz. dans 5 races 3 et 4 : Hétéroz. dans 4 races 5 et 6 : Hétéroz. dans 3 races 10 : Hétéroz. S et A 11 : Hétéroz. (A ou S) et (C ou B ou KS) 12 : Hétéroz. C et (B ou KS) 13 : Hétéroz. A ou S 20 : autres 90 : INDEL SNPs

14 Sélection des SNPs 537 145 SNPs Sélection des SNPs :
Table des SNPs Sélection des SNPs : Présent sur un scaffold > pb Bi-allélique « Frame » minimun de 20 pb MAF > 0.2 Illumina > 0.8 Infinium II Tri de la sélection : Catégorie croissante MAF décroissante Sélection + Tri SNPs triés par catégorie et MAF SNPs Répartition SNPs sélectionnés alternatifs

15 Sélection des SNPs 537 145 SNPs Sélection des SNPs :
Table des SNPs Sélection des SNPs : Présent sur un scaffold > pb Bi-allélique « Frame » minimun de 20 pb MAF > 0.2 Illumina > 0.8 Infinium II Tri de la sélection : Catégorie croissante MAF décroissante Sélection + Tri SNPs triés par catégorie et MAF SNPs Répartition X X Avec X = pb / = pb SNPs sélectionnés alternatifs

16 Sélection des SNPs 537 145 SNPs Sélection des SNPs :
Table des SNPs Sélection des SNPs : Présent sur un scaffold > pb Bi-allélique « Frame » minimun de 20 pb MAF > 0.2 Illumina > 0.8 Infinium II Tri de la sélection : Catégorie croissante MAF décroissante Sélection + Tri SNPs triés par catégorie et MAF SNPs Répartition SNPs sélectionnés alternatifs

17 Sélection des SNPs 537 145 SNPs Sélection des SNPs :
Table des SNPs Sélection des SNPs : Présent sur un scaffold > pb Bi-allélique « Frame » minimun de 20 pb MAF > 0.2 Illumina > 0.8 Infinium II Tri de la sélection : Catégorie croissante MAF décroissante Sélection + Tri SNPs triés par catégorie et MAF SNPs Répartition SNPs sélectionnés alternatifs

18 Sélection des SNPs 537 145 SNPs Sélection des SNPs :
Table des SNPs Sélection des SNPs : Présent sur un scaffold > pb Bi-allélique « Frame » minimun de 20 pb MAF > 0.2 Illumina > 0.8 Infinium II Tri de la sélection : Catégorie croissante MAF décroissante Sélection + Tri SNPs triés par catégorie et MAF SNPs Répartition SNPs sélectionnés alternatifs

19 60 000 SNPs - Par catégorie 5 races => ~38% 4 races => ~78%
1 : EST 2 : Hétéroz. dans 5 races 3 et 4 : Hétéroz. dans 4 races 5 et 6 : Hétéroz. dans 3 races 10 : Hétéroz. S et A 11 : Hétéroz. (A ou S) et (C ou B ou KS) 12 : Hétéroz. C et (B ou KS) 13 : Hétéroz. A ou S 20 : autres 90 : INDEL 5 races => ~38% 4 races => ~78% 3 races => ~96%

20 60 000 SNPs - Par catégorie et « frame »

21 60 000 SNPs - MAF - Score illumina

22 SNPs - Répartition

23 60 000 SNPs - Pourcentage par race
1 684 SNPs EST

24 SNPs - Répartion vs UMD3 3 316 scaffold/chr. => Longueur totale = pb 30 chromosomes => pb Localisation bovine des SNPs : SNPs localisés avec bwa bwasw (150 / SNP / 150) SNPs localisés sur un chr bovin

25 Merci pour votre attention ...

26 260 regions > pb


Télécharger ppt "Contexte Consortium Equipes impliquées Ref site web."

Présentations similaires


Annonces Google