微生物生态学学科的快速发展产生了大量的序列数据集,目前一般存储在NCBI、ENA和MG-RAST等国际生物信息学数据库。但是这些数据库缺少用于检索、整合和重新分析多个独立数据集所必需的信息,导致现有数据集利用率低、使用时间成本高等问题。此外,微生物组数据分析涉及大量的软件和多种编程语言,学习时间成本高。中国科学院成都生物研究所李香真团队经过近3年的开发与迭代,微生物组数据库V1.3版本现已正式上线(,推荐使用Chrome浏览器访问)。当前版本更新了生物信息分析流程、增加了生物信息模块分析、实时多元生态统计分析和可视化功能。
微生物组数据库的一大特点是同时收集微生物测序数据和与之关联的环境参数信息,为用户提供数据的存储、检索和分析服务。基于测序样本详细的环境参数信息,我们实现了对具有特定属性的样本的精确查询,可提高数据的使用率,降低数据收集的时间成本,为大尺度下微生物生态学研究提供了优质的数据源。微生物组数据库不仅是一个专业的实体数据库,也是一个一站式比较群落生态学研究的云平台。我们为所有注册用户免费提供“数据存储—检索—生物信息学分析—统计分析和可视化”一站式服务,让用户能够轻易地获取用于meta分析的数据集微生物数据分析云平台,不用写代码也能进行生物信息分析、统计分析和可视化。
目前,微生物组数据库已经收录了包括16S rRNA基因、18S rRNA基因、ITS、功能基因(nifH、phoD、pmoA等)和宏基因组在内的高质量数据集3529套,其中包括序列文件、样本概况、空间信息、气候特征、植被信息和理化特征信息。数据库中收录的数据有最多两年的保护期(取决于提交数据的用户),到期后会自动释放,任何注册用户均可免费使用这些数据集进行科学研究。同时我们也希望科研界广大同僚们能够将已发表的数据集提交到微生物组数据库存储微生物数据分析云平台,以促进我们持续改进和更新。
平台目前支持的生物信息分析流程共7个:
流程名称
功能描述
16S rRNA-QIIME2-Deblur-基础流程
基于QIIME2和Deblur算法搭建的用于16S rRNA基因测序数据分析流程
16S rRNA-QIIME2-DADA2-基础流程
基于QIIME2和DADA2算法搭建的用于16S rRNA基因测序数据分析流程
ITS-QIIME2-Deblur-基础流程
基于QIIME2和Deblur算法搭建的用于ITS测序数据分析流程
ITS-QIIME2-DADA2-基础流程
基于QIIME2和DADA2算法搭建的用于ITS测序数据分析流程
18S rRNA-QIIME2-Deblur-基础流程
基于QIIME2和Deblur算法搭建的用于18S rRNA基因测序数据分析流程
18S rRNA-QIIME2-DADA2-基础流程
基于QIIME2和DADA2算法搭建的用于18S rRNA基因测序数据分析流程
功能基因-QIIME2-DADA2-基础流程
基于QIIME2和DADA2算法搭建的用于功能基因测序数据分析流程,目前已经测试pmoA、nifH和phoD基因。
平台目前支持的生物信息分析模块共5个:
模块名称
功能描述
Picrust2功能预测
Picrust2 KEGG功能预测
元素循环预测
FAPROTAX微生物生物地球化学循环功能预测
FunGuild功能预测
FunGuild真菌(ITS)功能预测
FrameBot去移码
检测功能基因测序数据中的移码错误
BLASTP注释
基于Diamond的NR,以及基于BLASTP的pmoA和nifH物种注释
平台目前支持的实时统计分析应用共30个:
分类
名称
变化趋势分析
小提琴图
箱线图
平均值柱状图(单柱子)
平均值柱状图(多柱子)
平均值散点图(单点)
平均值散点图(多点)
平均值折线图(单线)
平均值折线图(多线)
组间差异检验
来源【首席数据官】,更多内容/合作请关注「辉声辉语」公众号,送10G营销资料!
版权声明:本文内容来源互联网整理,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 jkhui22@126.com举报,一经查实,本站将立刻删除。