新的开源数据库改善了基因组学研究的合作

来源:news medical |校审:Kate Anderton | 2019-11-3 | 翻译:聚生物

 

随着澳大利亚和北美研究人员开发的一个新的开源数据库的启动,共享揭示基因组变异在健康和疾病中功能的数据集变得更加容易。

MaveDB数据库是一个实验数据的存储库,这些实验数据来自于“变异效应的多重测定”(MAVEs)分析的结果,系统地测量了成千上万个个体序列变异对基因功能的影响。

这些实验可以提供有价值的信息,说明由该基因产生的蛋白质如何发挥作用,该基因中的变异如何导致疾病,以及如何设计比原始蛋白质更有效的的合成蛋白。

MAPVDB是该数据的第一个可公开访问的数据库。其发展由来自澳大利亚的Walter和ElizabaHallInstitute的AlanRubin博士和来自加拿大多伦多大学的DouglasFowler教授和加拿大多伦多大学的FrederickRoth教授领导。今天在《Genome Biology》中描述了MAPVDB。

简介

新开发的数据库MaveDB增强了复杂功能基因组数据集的共享。

MaveDB是一个易于使用的存储库,用于存储来自多样性变异效应分析(MAVEs)的数据,MAVEs用于解释实验结果,这些结果详尽地测量了基因的不同变异的影响。

MaveDB增强了研究人员获取和解释复杂功能基因组数据的能力,加速了对基因基础生物学、它们在疾病中的作用以及如何设计蛋白质以产生更有效的变异的研究。

增强基因组学研究

鲁宾博士(Rubin)说,MAVEs彻底改变了研究人员理解基因功能及其在疾病中的作用的能力。他说:“过去,研究人员必须关注基因的一些变化,才能了解其功能。”它太复杂了,无法从一个可能有数百或数千个碱基长度的基因变体的详尽扫描中生成数据。

“Maves的发展为研究人员提供了一种方法来实验测量基因中的每一个基因变化及其功能后果。这些测试可以处理成千上万的基因变异,使研究人员能够了解相关的变化,并将它们与整体基因组数据相关连。“鲁宾博士说。

到目前为止,MAVE实验数据一直是孤立存在的,当研究论文发表或应其他研究人员的要求提供时,来自单个研究的数据才会被上传到期刊网站上。

“这使得研究人员很难访问其他组的数据,甚至很难知道某个MAVE实验已经完成。因此,这可能会阻碍合作和基因组学研究的进展,”鲁宾博士说。

“MaveDB使科学家更容易在数据库中共享他们的数据集合,使用灵活的格式,适用于多个研究领域,并使其他科学家可以轻松访问这些数据,以加强他们的研究。”我们还确保MaveDB可以与其他数据库“对话”,以增加额外的协作能力。对于不断增长的MAVE研究领域来说,这个数据库是朝着开放科学和可重复性的方向迈出的重要一步,它确保了数据的可用性。”

从MAVEs获得的数据有许多应用,包括了解基因或蛋白质的功能,测量疾病中遗传变异的影响,或了解合成蛋白质(如生物技术中使用的蛋白质)如何变得更有效。

可视化数据

除了建立MaveDB,该团队还开发了数据可视化软件MaveVis,使研究人员更容易理解和解释MAVE实验的结果。

“MaveVis为MAVE数据提供了即时和一致的显示,包括有价值的注释,如蛋白质结构信息,这将加速合作研究,”Rubin博士说。

“我们设想,随着MaveDB在生物信息学领域得到更广泛的应用,其他应用程序将被添加,从而提供可视化和解释复杂基因组数据的新方法,从而产生新的发现,促进生物医学研究。”这可能会促进新药物的开发,或者帮助人们理解病人的基因组变异是如何导致疾病的。”

这项研究由布罗特曼·巴蒂精确医学研究所(美国)、美国国立卫生研究院、加拿大卫生研究院、洛伦佐和帕梅拉·加利慈善信托基金、澳大利亚国家卫生和医学研究委员会和维多利亚政府资助。

Source:

Walter and Eliza Hall Institute

Journal reference:

Esposito, D. et al. (2019) MaveDB: an open-source platform to distribute and interpret data from multiplexed assays of variant effect. Genome Biology. doi.org/10.1186/s13059-019-1845-6.

 

郑重声明:本网所有文章(包括图片和音视频资料)系出于传递更多信息之目的,且明确注明来源和作者。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。所有文章版权归原作者所有,且仅代表作者观点,不代表本站立场。如作者信息标记有误,请第一时间联系我们修改或删除,谢谢。