基于Super-GBS简化基因组测序技术的柞蚕SNP位点挖掘
摘要 基于Super-GBS基因分型(super-genotyping-by-sequencing)技术开展柞蚕单核苷酸多态性标记(single nucleotide polymorphism,SNP)位点挖掘研究,旨在开发性状关联SNP分子标记,为柞蚕种质资源评价鉴定、遗传图谱构建、QTL定位提供数据支撑。以白体色小白蚕为母本、黄体色H04为父本,获得BC1M群体(110个)、F1(3个)、P1(1个)、P2(1个)总计115个柞蚕材料,利用Pst Ⅰ-HF/Msp Ⅰ双酶切基因组构建Super-GBS文库并测序,使用BWA软件将过滤后的序列数据比对到柞蚕参考基因组,采用GATK 软件开发SNP标记,使用SnpEff 软件注释SNP位点及R语言分析遗传结构。测序共产生序列数据量为106.39 Gb,过滤后的平均读长为0.89 Gb,Q30测序质量值平均为90.11%,比对率平均为98.48%。共得到有效SNP位点141 100个,主要位于基因间隔区、内含子区、基因下游、上游,其中C/T、A/G 变异类型最多,转换与颠换的比例为1.296 187∶1。SNP位点变异主要为同义突变和错义突变,产生修饰(MODIFIER)影响。主成分与聚类分析将 115个样品分为4组(P1、P2、F1、BC1M),反映了样品的遗传背景及亲缘关系,群体遗传分化指数FST在0.000 377 7~0.8272间,群体遗传距离DR分布在0.000 4~1.755 6,FST与DR均表现出明显的遗传背景上的聚类。结果表明,Super-GBS技术能够获得大量柞蚕SNP位点信息,可用于SNP标记开发,且开发的SNP标记能够对115个样品的亲缘关系、体色演变进行解释,为今后柞蚕种质资源评价与鉴定、分子标记辅助育种工作奠定基础。