您的当前位置:首页高良姜叶绿体基因组测序与特征分析

高良姜叶绿体基因组测序与特征分析

2021-12-13 来源:小侦探旅游网
高良姜叶绿体基因组测序与特征分析

作者:***

来源:《热带作物学报》2021年第01期

摘 要:為了探究高良姜的叶绿体基因组特征及其系统进化发育关系,本研究以高良姜总DNA为材料,采用NovaSeq高通量测序平台进行高良姜叶绿体基因组测序,并基于生物信息学方法进行高良姜叶绿体基因组的图谱构建及注释分析。结果表明:高良姜叶绿体基因组全长162 137 bp,呈典型的环状四段式结构,包括87 264 bp的大单拷贝区、15 349 bp的小单拷贝区以及2个29 762 bp的反向互补重复区;共编码132个基因,其中蛋白编码基因86个、核糖体RNA基因8个以及转运RNA基因38个。高良姜叶绿体基因组密码子偏好性较弱,偏向于以A/T碱基结尾。碱基替换分析表明,高良姜叶绿体基因组中大多数编码基因的碱基替换没有引起氨基酸的改变。基于20种物种叶绿体基因组的系统发育分析发现,高良姜与同属植物艳山姜、益智的亲缘关系更近。本研究获得了高良姜的叶绿体基因组特征信息,为高良姜资源保护、遗传进化和品种选育奠定了基础。

关键词:高良姜;叶绿体基因组;密码子偏好性;碱基替换分析;系统发育分析 中图分类号:S813.3 文献标识码:A

Abstract: To explore the chloroplast genome features and phylogenetic relationship of Alpinia officinarum Hance, total DNA of A. officinarum was used to sequence by NovaSeq, the high-

throughput sequencing platform. And then the chloroplast genome of A. officinarum was annotated and analyzed based on bioinformatics. The results showed that the chloroplast genome of A.

officinarum exhibited a typical four-stage structure with a length of 162 137 bp and was composed of a large single-copy region (87 264 bp), a small single-copy region (15 349 bp) and two inverted repeat regions (29 762 bp). A total of 132 genes were annotated in the chloroplast genome of A. officinarum, including 86 protein-coding genes, 8 rRNA genes and 38 tRNA genes. The codon preference in the chloroplast genome was weak, and the codon tended to end with A/T bases. The codon replacement in the majority of coding genes did not lead to the alteration of amino acids. Additionally, phylogenetic analysis in the chloroplast genome of 20 species revealed A. officinarum shared closer relationship with A. zerumbet and A. oxyphylla. Collectively, this study reported the characteristic information of A. officinarum chloroplast genome, which would provide a firm foundation for the researches on genetic evolution and variety breeding of A. officinarum. Keywords: Alpinia officinarum; chloroplast genome; codon preference; base replacement; phylogenetic analysis

DOI: 10.3969/j.issn.1000-2561.2021.01.001

高良姜(Alpinia officinarum Hance)为姜科山姜属多年生草本植物,主产于广东、广西和海南,其根茎入药可散寒止痛,温中止呕,是我国传统大宗中药材之一。目前,高良姜野生资源已基本灭绝,栽培高良姜由于种植强度大、成本高、收益低以及田间管理困难,药农种植积极性降低,导致高良姜栽培面积和产量显著下降,一些地区已经出现高良姜供不应求的局面[1-2]。因此,加强高良姜种质资源保护和可持续利用研究是当前高良姜产业的重要课题之一。目前主要集中于高良姜的化学成分和药理活性等方面的研究,而遗传多样性、进化和发育等方面的研究则较少。

叶绿体是植物细胞进行光合作用的场所,能为植物提供生命活动所必需的能量[3]。叶绿体拥有相对独立的遗传体系,包含一个呈环状、结构稳定的基因组,即叶绿体基因组[3-4]。与庞大的核基因组相对,叶绿体基因组DNA分子较小,长度一般在115~165 kb之间[5]。由于保守程度高、进化速率适中,叶绿体基因组已被广泛应用于植物鉴定、系统发育及遗传进化分析等研究[6-8],基于叶绿体的基因工程在种质资源保护、品种优育中发挥着越来越重要的作用。目前,益智[9]、苦参[10]、大黄[11]等常用中药材的叶绿体基因组已被相继报道。 本研究拟通过高良姜叶绿体基因组测序,从密码子偏好性、进化发育关系等方面分析高良姜叶绿体遗传体系,以期为高良姜的遗传背景、进化发育提供叶绿体基因组信息,促进高良姜种质资源保护和基因工程研究奠定基础。 1 材料与方法 1.1 材料

高良姜新鲜植物采自广东省湛江市徐闻县,液氮速冻后于‒80 ℃保存备用。经岭南中药资源教育部重点实验室(广州中医药大学)詹若挺研究员鉴定为高良姜(Alpinia officinarum Hance)。 1.2 方法

1.2.1 DNA提取、文库构建及测序 取100 mg高良姜叶片,采用改良CTAB法提取总DNA,并分别使用Qubit荧光光度计、Nanodrop分光光度计和1%琼脂糖凝胶电泳检测DNA样品的浓度、纯度和完整性。DNA样品检测合格后,经超声破碎随机打断,采用NexteraXT DNA Library Preparation Kit构建DNA文库,质检合格后采用NovaSeq测序平台进行高良姜叶绿体基因组测序。

1.2.2 序列拼接、注释和图谱绘制 将测序所得的原始读序(raw read)用NGS QC Tool Kit软件包进行数据质量检测和过滤,去除低质量序列、接头序列及含有不确定碱基序列,以得到高质量序列(clean read),随后使用SPAdes 3.11.0软件对所得的clean read进行序列拼接,参考物种及序列为益智(Alpinia oxyphylla, NC_035895),并验证拼接序列是否连接成环,序列以Fastq格式储存。采用PLANN软件对高良姜叶绿体基因组全序列进行编码基因注释。根据注释结果,使用OrganellarGenomeDraw(OGDRAW)软件绘制高良姜叶绿体基因组图谱。将序列数据和基因注释信息上传到GenBank数据库,获得序列登记号为MT254526。 1.2.3 密码子偏好性分析 采用CodonW v1.3软件对高良姜叶绿体转录组的密码子组成进行分析,获得有效密码子(effective number of codon, Nc)和相对同义密码子使用情况(relative synonymous codon usage, RSCU)等参数,评价高良姜叶绿体转录组的密码子使用偏好性。其中,Nc取值范围为20~60,该值越大,密码子使用的随机性越大,使用偏性越小。RSCU值则以1为限,若RSCU>1,该密码子使用频率较高;若RSCU<1,该密码子使用频率较低。 1.2.4 同义替换和非同义替换分析 将高良姜与参考物种益智等的叶绿体基因组序列导入MAFFT v7.429软件进行比对,寻找差异碱基,并使用PAML v4.9软件计算同义替换率Ks、非同义替换率Ka值,以评价高良姜叶绿体基因组基因的进化情况。其中,Ks=同义替换SNP数/同义替换位点数,Ka=非同义替换SNP数/非同义替换位点数。同义替换是指碱基的变化没有导致氨基酸的突变,而非同义替换指碱基的变化导致了氨基酸的突变。

1.2.5 系统发育关系分析 从GenBank数据中下载益智(Alpinia oxyphylla, NC_035895)、艳山姜(Alpinia zerumbet, JX088668)、白豆蔻(Amomum krervanh, MF991963)、黄花姜黄(Curcuma flaviflora, NC_028729)、观音姜(Curcuma roscoeana, NC_022928)、蜂巢姜(Zingiber spectabile, NC_020363)、美叶闭鞘姜(Costus pulverulentus, KF601573)、单花姜(Monocostus uniflorus, KF601572)、翅果竹芋(Thaumatococcus daniellii, KF601575)、豹纹竹芋(Marania leuconeura, KF601571)、美人蕉(Canna indica, KF601570)、旅美人蕉(Ravenala madagascariensis, NC_ 022927)、流苏兰花蕉(Orchidantha fimbriata,

KF6015969)、粉鸟蝎尾蕉(Heliconia collinsiana, NC_020362)、小果野蕉(Musa acuminate, HF677508)、野蕉(Musa balbisiana, NC_028439)、蕉麻(Musa textilis, NC_022926)等单子叶植物和牛蒡(Arctium lappa, MH161419)、紫菀(Aster tataricus, MH669275)等双子叶植物的叶绿体基因组序列,与高良姜的叶绿体基因组序列一起导入MAFFT v7.429软件进行多重序列比对,然后使用IQTREE 1.6.12软件以最大似然法(maximum likelihood, ML)和1000次重復次数构建系统发育关系树。 2 结果与分析

2.1 高良姜叶绿体基因组测序质量

高良姜叶绿体基因组经测序后获得15 840 078条raw read,经过滤后得到15 763 357条clean read,有效率为99.5%。平均测序深度为203.3X,超过了序列拼接要求的100X平均测序深度。碱基正确识别率>99%的碱基占比为96.6%,碱基正确识别率>99.9%的碱基占比为91.1%,平均碱基测序错误率为0.03%。上述结果说明高良姜叶绿体基因组测序质量良好。 2.2 高良姜叶绿体基因组的结构特征

本研究拟通过高良姜叶绿体基因组测序,从密码子偏好性、进化发育关系等方面分析高良姜叶绿体遗传体系,以期为高良姜的遗传背景、进化发育提供叶绿体基因组信息,促进高良姜种质资源保护和基因工程研究奠定基础。 1 材料与方法 1.1 材料

高良姜新鲜植物采自广东省湛江市徐闻县,液氮速冻后于‒80 ℃保存备用。经岭南中药资源教育部重点实验室(广州中医药大学)詹若挺研究员鉴定为高良姜(Alpinia officinarum Hance)。 1.2 方法

1.2.1 DNA提取、文库构建及测序 取100 mg高良姜叶片,采用改良CTAB法提取总DNA,并分别使用Qubit荧光光度计、Nanodrop分光光度计和1%琼脂糖凝胶电泳检测DNA样品的浓度、纯度和完整性。DNA样品检测合格后,经超声破碎随机打断,采用NexteraXT DNA Library Preparation Kit构建DNA文库,质检合格后采用NovaSeq测序平台进行高良姜叶绿体基因组测序。

1.2.2 序列拼接、注释和图谱绘制 将测序所得的原始读序(raw read)用NGS QC Tool Kit软件包进行数据质量检测和过滤,去除低质量序列、接头序列及含有不确定碱基序列,以得到

高质量序列(clean read),随后使用SPAdes 3.11.0软件对所得的clean read進行序列拼接,参考物种及序列为益智(Alpinia oxyphylla, NC_035895),并验证拼接序列是否连接成环,序列以Fastq格式储存。采用PLANN软件对高良姜叶绿体基因组全序列进行编码基因注释。根据注释结果,使用OrganellarGenomeDraw(OGDRAW)软件绘制高良姜叶绿体基因组图谱。将序列数据和基因注释信息上传到GenBank数据库,获得序列登记号为MT254526。 1.2.3 密码子偏好性分析 采用CodonW v1.3软件对高良姜叶绿体转录组的密码子组成进行分析,获得有效密码子(effective number of codon, Nc)和相对同义密码子使用情况(relative synonymous codon usage, RSCU)等参数,评价高良姜叶绿体转录组的密码子使用偏好性。其中,Nc取值范围为20~60,该值越大,密码子使用的随机性越大,使用偏性越小。RSCU值则以1为限,若RSCU>1,该密码子使用频率较高;若RSCU<1,该密码子使用频率较低。 1.2.4 同义替换和非同义替换分析 将高良姜与参考物种益智等的叶绿体基因组序列导入MAFFT v7.429软件进行比对,寻找差异碱基,并使用PAML v4.9软件计算同义替换率Ks、非同义替换率Ka值,以评价高良姜叶绿体基因组基因的进化情况。其中,Ks=同义替换SNP数/同义替换位点数,Ka=非同义替换SNP数/非同义替换位点数。同义替换是指碱基的变化没有导致氨基酸的突变,而非同义替换指碱基的变化导致了氨基酸的突变。

1.2.5 系统发育关系分析 从GenBank数据中下载益智(Alpinia oxyphylla, NC_035895)、艳山姜(Alpinia zerumbet, JX088668)、白豆蔻(Amomum krervanh, MF991963)、黄花姜黄(Curcuma flaviflora, NC_028729)、观音姜(Curcuma roscoeana, NC_022928)、蜂巢姜(Zingiber spectabile, NC_020363)、美叶闭鞘姜(Costus pulverulentus, KF601573)、单花姜(Monocostus uniflorus, KF601572)、翅果竹芋(Thaumatococcus daniellii, KF601575)、豹纹竹芋(Marania leuconeura, KF601571)、美人蕉(Canna indica, KF601570)、旅美人蕉(Ravenala madagascariensis, NC_ 022927)、流苏兰花蕉(Orchidantha fimbriata, KF6015969)、粉鸟蝎尾蕉(Heliconia collinsiana, NC_020362)、小果野蕉(Musa acuminate, HF677508)、野蕉(Musa balbisiana, NC_028439)、蕉麻(Musa textilis, NC_022926)等单子叶植物和牛蒡(Arctium lappa, MH161419)、紫菀(Aster tataricus, MH669275)等双子叶植物的叶绿体基因组序列,与高良姜的叶绿体基因组序列一起导入MAFFT v7.429软件进行多重序列比对,然后使用IQTREE 1.6.12软件以最大似然法(maximum likelihood, ML)和1000次重复次数构建系统发育关系树。 2 结果与分析

2.1 高良姜叶绿体基因组测序质量

高良姜叶绿体基因组经测序后获得15 840 078条raw read,经过滤后得到15 763 357条clean read,有效率为99.5%。平均测序深度为203.3X,超过了序列拼接要求的100X平均测序

深度。碱基正确识别率>99%的碱基占比为96.6%,碱基正确识别率>99.9%的碱基占比为91.1%,平均碱基测序错误率为0.03%。上述结果说明高良姜叶绿体基因组测序质量良好。 2.2 高良姜叶绿体基因组的结构特征

本研究拟通过高良姜叶绿体基因组测序,从密码子偏好性、進化发育关系等方面分析高良姜叶绿体遗传体系,以期为高良姜的遗传背景、进化发育提供叶绿体基因组信息,促进高良姜种质资源保护和基因工程研究奠定基础。 1 材料与方法 1.1 材料

高良姜新鲜植物采自广东省湛江市徐闻县,液氮速冻后于‒80 ℃保存备用。经岭南中药资源教育部重点实验室(广州中医药大学)詹若挺研究员鉴定为高良姜(Alpinia officinarum Hance)。 1.2 方法

1.2.1 DNA提取、文库构建及测序 取100 mg高良姜叶片,采用改良CTAB法提取总DNA,并分别使用Qubit荧光光度计、Nanodrop分光光度计和1%琼脂糖凝胶电泳检测DNA样品的浓度、纯度和完整性。DNA样品检测合格后,经超声破碎随机打断,采用NexteraXT DNA Library Preparation Kit构建DNA文库,质检合格后采用NovaSeq测序平台进行高良姜叶绿体基因组测序。

1.2.2 序列拼接、注释和图谱绘制 将测序所得的原始读序(raw read)用NGS QC Tool Kit软件包进行数据质量检测和过滤,去除低质量序列、接头序列及含有不确定碱基序列,以得到高质量序列(clean read),随后使用SPAdes 3.11.0软件对所得的clean read进行序列拼接,参考物种及序列为益智(Alpinia oxyphylla, NC_035895),并验证拼接序列是否连接成环,序列以Fastq格式储存。采用PLANN软件对高良姜叶绿体基因组全序列进行编码基因注释。根据注释结果,使用OrganellarGenomeDraw(OGDRAW)软件绘制高良姜叶绿体基因组图谱。将序列数据和基因注释信息上传到GenBank数据库,获得序列登记号为MT254526。 1.2.3 密码子偏好性分析 采用CodonW v1.3软件对高良姜叶绿体转录组的密码子组成进行分析,获得有效密码子(effective number of codon, Nc)和相对同义密码子使用情况(relative synonymous codon usage, RSCU)等参数,评价高良姜叶绿体转录组的密码子使用偏好性。其中,Nc取值范围为20~60,该值越大,密码子使用的随机性越大,使用偏性越小。RSCU值则以1为限,若RSCU>1,该密码子使用频率较高;若RSCU<1,该密码子使用频率较低。

1.2.4 同义替换和非同义替换分析 将高良姜与参考物种益智等的叶绿体基因组序列导入MAFFT v7.429软件进行比对,寻找差异碱基,并使用PAML v4.9软件计算同义替换率Ks、非同义替换率Ka值,以评价高良姜叶绿体基因组基因的进化情况。其中,Ks=同义替换SNP数/同义替换位点数,Ka=非同义替换SNP数/非同义替换位点数。同义替换是指碱基的变化没有导致氨基酸的突变,而非同义替换指碱基的变化导致了氨基酸的突变。

1.2.5 系统发育关系分析 从GenBank数据中下载益智(Alpinia oxyphylla, NC_035895)、艳山姜(Alpinia zerumbet, JX088668)、白豆蔻(Amomum krervanh, MF991963)、黄花姜黄(Curcuma flaviflora, NC_028729)、观音姜(Curcuma roscoeana, NC_022928)、蜂巢姜(Zingiber spectabile, NC_020363)、美叶闭鞘姜(Costus pulverulentus, KF601573)、单花姜(Monocostus uniflorus, KF601572)、翅果竹芋(Thaumatococcus daniellii, KF601575)、豹纹竹芋(Marania leuconeura, KF601571)、美人蕉(Canna indica, KF601570)、旅美人蕉(Ravenala madagascariensis, NC_ 022927)、流苏兰花蕉(Orchidantha fimbriata, KF6015969)、粉鸟蝎尾蕉(Heliconia collinsiana, NC_020362)、小果野蕉(Musa acuminate, HF677508)、野蕉(Musa balbisiana, NC_028439)、蕉麻(Musa textilis, NC_022926)等单子叶植物和牛蒡(Arctium lappa, MH161419)、紫菀(Aster tataricus, MH669275)等双子叶植物的叶绿体基因组序列,与高良姜的叶绿体基因组序列一起导入MAFFT v7.429软件进行多重序列比对,然后使用IQTREE 1.6.12软件以最大似然法(maximum likelihood, ML)和1000次重复次数构建系统发育关系树。 2 结果与分析

2.1 高良姜叶绿体基因组测序质量

高良姜叶绿体基因组经测序后获得15 840 078条raw read,经过滤后得到15 763 357条clean read,有效率为99.5%。平均测序深度为203.3X,超过了序列拼接要求的100X平均测序深度。碱基正确识别率>99%的碱基占比为96.6%,碱基正确识别率>99.9%的碱基占比为91.1%,平均碱基测序错误率为0.03%。上述结果说明高良姜叶绿体基因组测序质量良好。 2.2 高良姜叶绿体基因组的结构特征

因篇幅问题不能全部显示,请点此查看更多更全内容