西交利物浦大学团队打造全球首个正交验证的RNA修饰一致化数据库

当前位置：首页 > 原创 > 正文

从“各说各话”到“统一语言”

发布时间：来源：神州学人

　　神州学人网讯 在生命科学研究中，“RNA修饰”就像基因表达的“隐形开关”，控制着细胞何时、以何种方式制造蛋白质。其中最常见的一种叫m6A（N6-甲基腺苷），它影响着RNA的稳定性和蛋白质合成效率，被认为与细胞功能乃至疾病发生密切相关。

　　长期以来，这个领域一直存在一个“烦恼”：不同实验室得到的结果经常对不上。同一个基因、同一个核苷酸位点，在一篇论文里被标成“有修饰”，在另一篇论文里却显示“没有”。这种结果前后不一致的情况，让科研人员很难判断究竟哪些修饰是真实的、能重复验证的。而这一混乱状况终于有望改变。

统一标准：让全球数据“对齐”

　　近日，西交利物浦大学理学院生物科学与生物信息学系魏震博士团队，联合利物浦大学研究者，在国际权威期刊《核酸研究》（Nucleic Acids Research）上发表最新成果，推出了全球首个整合多种m6A检测技术并通过交叉验证的数据库——m6AConquer。

　　魏震形象地说：“过去研究者各说各话，现在终于有了一个能‘对齐’所有数据的共同坐标系。”

　　简单来说，m6AConquer整合了来自十种实验技术和数百个公开数据集的m6A测序结果，并通过引入“正交验证”的算法，筛选出了能够在多种采用不同生化原理的m6A检测技术中重复验证的修饰位点。这意味着，研究者终于有了一个可靠、统一、可验证的数据基准。

m6AConquer: 在十种m6A修饰检测技术上实现一致量化和正交验证的数据分享平台

一台“RNA修饰真伪检测仪”

　　在生动的比喻下，m6AConquer可以被看作一台“RNA修饰真伪检测仪”。它帮助科研人员区分哪些信号是可重复的生物学标记，哪些只是偶然的实验噪音。

　　研究团队借鉴了国际著名的ENCODE人类基因组计划的统计框架，采用IDR模型衡量不同检测方法之间的结果一致性。最终，他们识别出了超过13.5万个高置信度的m6A修饰位点（IDR<0.05），这些位点在不同的正交实验技术之间表现出统计显著的可重复性。

　　魏震解释：“这项分析首次在该领域中建立了严谨的真实标准（ground truth）数据集，让不同m6A检测方法的性能评估成为可能。科研人员可以直接利用这些经过多平台验证的修饰位点作为统一参考，不再需要为技术差异反复调整。这样不仅提高了研究的一致性和可重复性，也为后续算法开发与疾病机理研究提供了可靠的参照系。”

使用被正交验证的m6A位点作为真实标准（ground truth）来准确评估不同m6A检测方法的性能

从“能信”到“能用”：科研的基础设施

　　除了确保数据的可靠性，魏博士团队还关注“可用性”——如何让这些数据更容易被科学家使用。

　　m6AConquer建立了一个标准化的数据共享框架，把原本分散、复杂的多组学原始数据重新整理为“分析就绪”的矩阵化格式。这就像把散落在不同国家的字典整合成同一种语言版本，研究人员无需再花大量时间清洗、对齐数据，就能直接开展比较、建模和验证，大幅提升科研效率与可复现性。

m6AConquer构建的多组学数据分享框架（Multi-Omics Data-Sharing Framework)

连接基因变异与疾病机制的新窗口

　　更令人兴奋的是，m6AConquer不仅整合了修饰数据，还将RNA修饰与基因变异、基因表达和疾病风险相结合。研究团队发现了6000多个与高置信度m6A位点修饰水平显著相关的基因变异（m6A-QTL），揭示了遗传差异如何影响RNA修饰，从而改变基因的调控方式。其中一些变异位于精神疾病、抑郁症等复杂疾病的风险区域，为科学家理解这些疾病的分子机制提供了新的切入点。魏震解释道：“这意味着我们不仅能看到RNA修饰的‘结果’，还开始理解它背后的‘原因’。有些基因突变可能正是通过影响RNA修饰水平，间接改变了疾病风险。”

　　魏震表示，m6AConquer不仅是一个数据资源，更是连接遗传变异、RNA修饰与疾病发生的桥梁。同时，它也为未来利用高置信度数据开展人工智能建模、RNA修饰预测和药物靶点研究奠定了坚实基础。“我们希望这一开放资源能够成为推动表观转录组学从‘数据整合’走向‘机制理解’的重要一步。”

　　目前，m6AConquer数据库和所有分析工具已在网站 rnamd.org/m6aconquer免费向全球科研人员开放。（供稿/西交利物浦大学）

责任编辑：贾文颖

文章中观点仅代表作者个人观点，不代表本网站的观点和看法。

神州学人杂志及神州学人网原创文章转载说明：如需转载，务必注明出处，违者本网将依法追究。