家蚕基因组中G四链体特征序列分布及其关联基因的功能分析
摘要 G-四链体(G-quadruplex,G4)是一种不同于双螺旋的特殊结构,由富含鸟嘌呤的DNA链在阳离子的参与下形成的四链DNA螺旋高级结构,在哺乳动物中被证明是具有重要生物学功能的表观遗传学元件。以鳞翅目模式昆虫家蚕(Bombyx mori)为对象,利用Quadparser程序,在家蚕全基因组范围预测G4结构,对其分布特征以及对其潜在调控基因的表达特性和功能的影响进行初步分析。在家蚕全基因组共预测到6 278个G4结构,其中有63.5%位于转座子区,35.3%分布在编码基因区。在基因的5′端侧翼序列转录起始位点和3′端转录终止位点附近都有相对明显的G4结构富集,暗示G4结构可能对于基因表达具有一定的调控作用。相对于基因组背景,上游含有G4结构的基因其编码区长度偏短,下游含有G4结构的基因其编码区则显著加长。上游含有G4结构的基因主要富集于核酸结合活性尤其是转录因子活性分子功能上,主要参与核酸代谢相关的调控过程,G4结构主要位于编码链;下游含G4结构的基因则主要富集于激酶和转移酶活性以及受体活性分子功能上,主要参与蛋白质加工及信号转导过程,G4结构主要位于模板链。上述结果提示G4结构位于基因上、下游所调控的靶基因有所分歧,作用机制可能也有所差异。结合家蚕基因组芯片数据分析发现,含有G4结构的基因没有明显的组织表达特异性,提示该类基因在广泛的生物学过程中均发挥作用。以上结果为后续深入研究该类表观遗传学结构在家蚕中的生物学功能提供了重要线索和参考依据。