图片来源:www.ebiotrade.com
技术概述
线粒体是真核细胞内的一种十分重要的细胞器,是细胞进行氧化磷酸化的场所。线粒体拥有自身的DNA和遗传体系,与生物进化及细胞起源有很密切关系。线粒体基因组是分子进化、系统发育和分子标记领域的重要研究对象,而获得目的生物的线粒体基因组全序列,则成为该领域研究人员的首要目标。
(转导生物编辑)
技术详情
除了少数低等真核生物的线粒体基因组是线状DNA分子外,一般都是一个环状的DNA分子。由于线粒体DNA并不容易从细胞中分离出来进行直接测序分析,通过对总DNA进行简并引物PCR钓取、未知序列扩增以及长PCR扩增等方法成为了精确获得线粒体基因组全序列最主流的方法。
微小型动物,极易出现混样,其主要难度在于提取的基因组浓度低,在实验方法上,采用单个个体提取基因组,核基因鉴定完后把同一目标物种的基因组混合,然后对基因组进行复制处理,用于短片段的调取,采用的试剂盒是:PicoPLEXTM WGA Kit。全长实验完成后再用一个个体进行全长验证。所以对于此类物种要求样品量充足,新鲜,尽量是一个群体采集。
植物和细菌,我们采用高通量测序测序加一代测序的方法进行全长测序,因为单纯依赖高通量技术难以获取完整环形结果,需要一代测序补漏拼接,而且花费的总时间较长。我们采用对总DNA进行提取,调取部分保守的基因,然后采用长PCR扩增,对这些长片段进行高通量测序。
线虫,这类低等动物,线粒体基因组结构在进化上非常不平衡,某些分类阶元的线虫会表现出大量的基因重排和不稳定性(基因复制,假基因)。这些基因在某些情况下,只是基因片段,在其他情况下,序列是相对保守的,但它们含有终止密码子,似乎是没有功能的基因[ ]。正是由于这一特点,我们选择用sanger测序法,实验过程中我们需要不断调整尝试直至找到正确的基因顺序,进一步确定基因组的大小和序列,而这些是高通量所不能达到的。
原生动物,由于这一类物种目前分来地位比较杂乱,而且有些线粒体基因组呈线状,且数据库中可参考的数据非常少,可想而知其测序难度。因此我们对于实验样品也有很高的要求,需要量大,且纯。根据我们已完成的线粒体基因组,会发现其拥有特殊的基因如ND9,ND7,正是由于线粒体基因组结构特殊,而如果选用高通量测序,组装的时候无法找到合适的参考基因组造成组装错误或无法完成组装。
如果遇到某些物种,其线粒体基因组变异较大,并且可参考的序列较少,有时无法准确判断基因间的排列顺序,我们会采用基因组步移的方法来推进。或是在普通PCR扩增中,无法准确获得目的片段,也可采用基因组步移
1.5’或3’未知序列的获取
根据已知序列设计3条高退火温度的特异性下游或上游引物,同时使用低退火温度的简并引物,利用特异性引物与简并引物之间退火温度的差异进行不对称PCR,通过三次巢式PCR获取侧翼序列。
2.对获取的序列进行验证
获取侧翼未知序列后,我们将分别在已知和未知序列上设计引物进行PCR扩增并对PCR产物进行测序,以验证获取序列的真实性。
对于取样,应尽可能详细地记录样品和取样程序,并尽可能多地收集样品。
1.如何,何时何地获得标本? (地理坐标)。
2.标记每个样本,如果你有条件,可以拍摄高质量的活标本照片,标签清晰可见。
3.记录每个样本的收集情况。 例如:他们属于一个个体吗? 或者他们是从不同的群体中收集的? 如果它们是寄生的 – 记录它们是从一个宿主还是多个宿主收集的。
4.对寄生虫来说,最好是让它们活着几天并且饿死,这样不会让我们的DNA样本被宿主污染。
基因组注释,基因组快速上传NCBI,生成线粒体基因组组成表,进行不同基因起始密码子/终止密码子使用的比较分析,制作环形图。可以生成各种统计表,比如按分类信息列好的基因组的AT含量、skewness以及参考文献的统计表;各物种蛋白基因的长度、起始、终止密码子统计生成统计图,如一个或多个物种的RSCU堆积图。对13编码基因进行Ka/Ks分析,计算各位点核苷酸的多样性(nucleotide diversity:π),并进行滑窗分析。也可视数据情况对非编码区分析、串联重复序列多个(二级结构),同时我们还可绘制tRNA二级结构图。可以实现基于线粒体基因组的各种形式的系统发育分析,按数据类型分有核苷酸序列建树、氨基酸序列建树;按数据分有串联蛋白基因、tRNA基因和核糖体rRNA基因建树;按软件方法分有NJ树(MEGA)、ML树(phyml/raxml)、BI树(MrBayes)以及异质性模型建的贝叶斯树(phylobayes);按数据处理有去除冗余、去除第三位密码子、去除异质性高的部分以及分区建树等。可以灵活的使用itol进行系统发育树的美化,比如用颜色和标签标记科、总科、目等信息;批量替换物种名字;将每个物种的基因顺序映射到系统发育树上;将每个物种的基因组长度和AT含量等的条形图映射到系统发育树上。
PhyloSuite,一款以流程化、界面化操作方式完成系统发育分析的工具套件[2]
系统发育分析,俗称“建树”,是科研工作中非常重要的内容之一,不管是鉴定新物种或找出不同物种间的进化关系,都离不开系统发育分析,可以说是“建树无处不在”。常规的操作步骤主要包括多重序列比对、进化模型选择和系统发育树重建等。通常情况下,完成这些流程比较费时,并且不同的步骤大都对输入数据要求不尽相同,一些关键的参数设置还需要根据实际数据进行手工调整,尤其多基因联合建树时。从获取数据(NCBI下载)到系统发育树重建的规范性以及结果的可重复性都是得出严肃科学结论的重要前提,这些不仅对于新手是一个严峻的考验,对于老手同样也不是举手投足之间可以完成的事。有鉴于此,我们开发了PhyloSuite。
软件下载地址:
https://github.com/dongzhang0725/PhyloSuite/releases
参考文献
[[1]] Zou H, Jakovlić I, Chen R, et al (2017) The complete mitochondrial genome of parasitic nematode Camallanus cotti: extreme discontinuity in the rate of mitogenomic architecture evolution within the Chromadorea class. BMC Genomics 18:840. doi: 10.1186/s12864-017-4237-x
[2]Zhang, D., Gao, F., Li, W.X., Jakovlić, I., Zou, H., Zhang, J., and Wang, G.T. (2018). PhyloSuite: an integrated and scalable desktop platform for streamlined molecular sequence data management and evolutionary phylogenetics studies. bioRxiv, doi: 10.1101/489088.
聚生物技术词条修善计划
对现在的词条不满意?或者您有关于该技术的独特见解,最新发展资讯?都可以投稿给聚生物。一经采用,您对该词条的贡献将被聚生物所有用户所看到。
投稿参加技术词条修善计划
求助,线粒体DNA测序成本