近年来,科学研究揭示了人体微生物群落在免疫、代谢乃至大脑功能中的核心作用 。为了探索微生物与健康的深层联系,研究范式已迈向融合基因组、转录组、代谢组等多维数据的“多组学”时代 。然而,这种前沿方法在带来海量信息的同时,也让研究者普遍陷入“数据泥潭”:不同来源的数据如同散落的拼图,整合困难重重;复杂的分析流程则像一道高墙,阻碍了探索的步伐 。

2025年9月8日,福建福耀科技大学生命与健康科学学院,广东省科学院微生物研究所、华南应用微生物国家重点实验室谢黎炜研究员团队与南方医科大学生物信息系余光创教授团队合作,在国际顶尖期刊SCIENCE CHINA-Life Sciences上在线发表了题为《EasyMultiProfiler: An Efficient Multi-Omics Data Integration and Analysis Workflow for Microbiome Research》的研究论文。

该研究成功应对了微生物多组学研究中长期存在的挑战,系统性地解决了四大核心问题:数据格式不统一、组学数据整合与管理复杂、分析方法实施困难以和结果复现性差。为此开发的 EasyMultiProfiler 工具为科研人员提供了一种标准化、高效且用户友好的分析范式。该工具专为 R 平台设计,支持微生物组、转录组和代谢组数据等多组学数据的下游分析,涵盖从数据导入、处理到可视化全流程,通过优化操作界面和强化分析能力,帮助用户更高效地解读多组学数据并挖掘生物学洞见。
亮点一:构建标准化分析框架,实现多源数据的无缝整合
EasyMultiProfiler分析框架充分兼容当前多组学数据分析生态,支持多种主流多组学数据格式的一键导入功能,大幅降低数据准备门槛。在数据架构上,本工具采用创新双层容器设计:在多组学整合层面,以MultiAssayExperiment为基础容器,高效管理不同来源数据(如微生物组、转录组、代谢组)之间的复杂关联与样本对应关系;在单组学分析层面,则基于SummarizedExperiment扩展构建EMPT容器,不仅保留原有结构优势,还可完整保存原始数据、分析过程、参数及结果,显著提升分析的可追溯性与可重复性。该双层容器设计兼顾多组学整合与单维度深入分析的需求,为微生物多组学研究提供灵活、高效且用户友好的数据管理解决方案。

亮点二:革命性的“自然语言式”分析流程,大幅降低技术门槛
该工作流程最引人注目的突破在于其“自然语言式”的设计。用户无需编写复杂的代码,只需像组织一句话一样,通过管道符,即可将数据提取、准备、支持、分析和可视化这五大功能模块自由串联。这种架构使研究人员能够像搭积木一样灵活构建分析流程,能够让分析人员将更多精力集中在科学问题的探索上,而非耗费在繁琐的数据处理和算法实现过程中。让不具备深厚生物信息学背景的临床医生和研究者也能轻松驾驭复杂的多组学分析。

亮点三:符合直觉的组学联合分析范式,解决数据对接困境
在微生物多组学整合分析中,传统方法往往需要进行繁琐的异构数据合并与格式转换,流程复杂且容易导致信息丢失。为解决这一痛点,本分析流程基于S3编程范式对“+”运算符进行重载,实现了多组学数据整合的范式创新。研究人员只需对两个单组学容器执行“+”操作,系统即可自动完成组学数据容器间的对接与标准化处理,满足后续联合分析的要求。该设计极大简化了操作流程,同时保证了数据整合的严谨性与可重复性,使研究者能够专注于多组学关联机制的挖掘,而无需投入大量时间在数据预处理环节。整合后的数据可直接支持多组学网络构建、跨组学关联分析等多种方法,为深入解析微生物-宿主互作机制提供了强有力的技术支撑。

亮点四:强大的过滤函数,支持原始数据及分析结果的智能提取
本流程采用数据容器化设计,在确保原始数据安全性的同时提供了灵活的数据操作机制。为满足实际分析需求,我们特别开发了EMP_filter这一核心功能模块,它支持基于表型数据和特征注释的多维度筛选: 1)支持大型队列研究中样本的快速筛;2)可针对不同组学特征(如差异显著的微生物物种、关键基因或代谢物)进行便捷筛选。该设计实现了"保护性操作"的创新平衡 - 用户可直接在数据容器内完成各类筛选操作,既避免了原始数据的篡改风险,又摆脱了传统表格手动操作的繁琐流程,显著提升了分析效率和操作便捷性。

总而言之,EasyMultiProfiler的发布是微生物多组学研究领域的一项关键技术革新。该工具构建出一个流线型的分析框架,使多组学分析可以像自然语言般串联,像诗歌一样优雅,避免了传统分析的繁琐操作,显著提高了分析效率,降低了分析人员多组学分析的门槛,为系统性地从海量数据中挖掘新的生物学见解提供了强大的引擎。
本研究的通讯作者是广东省科学院微生物研究所、华南应用微生物国家重点实验室,福建福耀科技大学生命与健康科学学院谢黎炜研究员,南方医科大学基础医学院生物信息系余光创教授。第一作者刘秉东博士是南方医科大学珠江医院博士后。
论文链接:https://www.sciengine.com/SCLS/doi/10.1007/s11427-025-3035-0
在线教程:http://easymultiprofiler.xielab.net/ch/
GitHub仓库地址:https://github.com/liubingdong/EasyMultiProfiler