古DNA研究是以分子生物学技术为基础发展起来的一个跨学科领域,通过结合考古学、历史学、语言学和古生物学等知识,能够分析古代生物的谱系、分子演化理论、人类的起源和迁徙、动植物的家养和驯化过程等。近十年来,随着高通量测序技术的突破,该领域已积累涵盖不同时空维度的大量古基因组数据,在人群迁徙、人群混合以及适应性进化等科学问题的研究上取得突破性进展。然而,传统古DNA分析流程依赖于专业编程技能,较高的技术门槛限制了考古学、历史学等人文社科学者的参与。为突破这一研究瓶颈,王传超教授团队设计并开发了一个集古DNA数据管理、分析,以及结果可视化于一体的在线数据库和在线数据分析平台——ADGAP,支持数据检索、群体遗传分析以及结果可视化功能,并免费提供Web服务(https://adgap.online/home),论文发表在中科院一区期刊Journal of Genetics and Genomics上。

ADGAP平台整合了Allen Ancient DNA Resource(AADR)数据库,提供以下核心功能:(1)集成了全面的群体遗传学分析工具,包括主成分分析、ADMIXTURE分析、f3/f4统计、qpWave分析和qpAdm建模,输出内容包含计算结果和可视化图表;(2)支持SNPs的基本信息及其在群体中等位基因频率的查询,结果以包含时间信息的交互式地图的形式,进行可视化展示;(3)基于AADR数据库个体元数据,构建交互式大规模数据表格,支持古DNA资源的便捷浏览与筛选;(4)提供动态交互的在线图表浏览功能,便于用户进行探索性的数据分析;(5)平台利用大语言模型和检索增强生成技术,开发了一个拥有专属知识库的网站问答助手,显著的提升了用户的使用体验。
ADGAP平台采用前后端分离的项目架构,前端基于Vue.js构建动态交互界面,后端以Flask框架为核心,通过符合RESTful API规范的接口提供高效数据服务。计算密集型任务则由Celery和Redis异步处理,确保高并发场景下的稳定性。平台的可靠性和实用性通过山东青蓝府遗址的案例分析得到了充分的验证。该分析案例展示了平台在解析人群迁徙与演化历史方面的强大潜力,证明其能够为研究者提供高效、可靠的分析支持,帮助揭示复杂的群体历史。

本研究开发了一款基于Web的古DNA数据分析平台,通过友好的图形界面,使研究人员能够便捷地浏览古DNA资源并通过简单的操作完成群体遗传学分析,绕过了对高级计算技能的需求,为推动古DNA研究的普及以及促进群体遗传学与考古学的交叉研究,提供了重要的支持。
厦门大学人工智能研究院硕士研究生陈彦伟和生命科学学院博士研究生徐煜为该论文共同第一作者,王传超教授为通讯作者,朱孔阳博士(现为维也纳大学博士后)亦对本文做出重要贡献。本工作得到国家杰出青年基金、国家重点研发计划、国家社科基金重大项目和国家自然科学基金面上项目等资助。