中国科学院古脊椎动物与古人类研究所朱敏院士团队秉持"以科学问题引领数据库建设"的理念,在建设DeepBone数据库过程中,不断深化数据挖掘和分析方法的创新实践,努力将每一阶段的数据积累转化为科学发现。近日,团队在《地球科学》(Geosciences)发表最新研究成果“A Decade of Vertebrate Palaeontology Research in the UK: Bibliometric and Topic Modelling Analysis”,这是团队在《历史生物学》(Historical Biology)发表全球古脊椎动物学发展态势研究后的又一重要进展。这一研究是从全球到区域的研究视角转换,不仅展现了研究的系统性和连续性,也提供了基于DeepBone数据库的又一案例。
英国是现代古脊椎动物学的发源地。19世纪以来,从William Buckland首次科学命名恐龙(1824年),到Richard Owen创造"Dinosaur"术语(1842年),再到Charles Darwin的《物种起源》(1859年)奠定进化论基础,英国科学家在该领域做出了一系列开创性贡献。更重要的是,英国建立了世界上最早的古生物学研究体系,包括系统的化石采集、研究方法的标准化和专业机构的建设。得益于独特的地质条件,英国拥有从泥盆纪到新生代的完整化石记录。此外,以英国自然历史博物馆、牛津大学和布里斯托大学为代表的研究机构网络,构建了连接欧美古生物研究的重要桥梁,为英国在全球研究网络中的核心地位奠定了坚实基础。
基于DeepBone数据库的系统分析揭示了英国古脊椎动物学研究的多个重要特征。过去十年间,英国共发表2,884篇相关研究论文,占全球研究总量的18.07%,在研究产出上保持稳定增长。在国际合作方面,英国与105个国家建立了紧密的研究网络,其中与美国(合作论文占国际合作总量的38.06%)、德国(24.02%)、法国(15.64%)的合作最为深入。约6.60%的研究发表在顶级期刊上,彰显其研究的国际影响力。机构分析显示,以英国自然历史博物馆(22.81%)、布里斯托大学(16.77%)和牛津大学(16.20%)为代表的研究机构网络紧密协作,形成了强大的研究合力。
得益于DeepBone数据库文献资料的积累和向量化改造,本研究创新性地采用全文LDA(潜在狄利克雷分析)主题建模分析,相比此前仅使用摘要的分析方法,能更全面地把握研究主题。研究定量分析识别出英国古脊椎动物学七大研究主题,尽管一些主题在研究内容上存在交叉,但它们各自聚焦于不同的研究角度和方法,反映了该领域研究的多样性和复杂性。这七大主题分别是:比较解剖学与系统学研究,传统古人类学与分子古人类学研究,演化生物学研究,地层学研究,牙齿和骨骼形态学研究,骨骼、肌肉的运动功能学研究,哺乳动物的演化。分析结果表明,英国古脊椎动物学正经历着显著的研究范式转变,从传统的形态研究发展为融合分子生物学、计算机断层扫描等现代技术的综合研究。特别是在跨学科交叉创新方面,英国研究机构通过融合分子生物学、计算机科学和地质学等领域,展现出强大的整合能力。这些发现不仅展示了英国在保持传统优势基础上的创新发展,也为其他国家和地区的学科发展提供了重要参考。
这项研究是朱敏院士团队在建设DeepBone数据库过程中不断探索数据价值的重要成果。从最初的文献收录,到全球视野的态势分析,再到区域深度研究,团队始终带着科学问题开展数据库建设工作。团队将DeepBone定位为科学发现项目,而非单纯的工程项目。在数据库建设过程中不断进行科学探索,形成了数据库构建与科学发现相互促进的良性循环。这种创新模式不仅推动了古脊椎动物学研究方法的创新,也为学科数据库建设提供了融合工程建设与科学发现的新思路。
本研究得到国家自然科学基金经费和中国科学院古脊椎动物与古人类研究所重点部署项目的资助。
文章链接: https://doi.org/10.3390/geosciences14110314
图1.2014–2023年英国研究人员描述的古脊椎动物新属种标本产地的全球分布
图2.2014-2023年英国古脊椎动物学领域国际合作网络
图3.2014–2023年英国脊椎动物古生物学的主题建模结果
通过潜在狄利克雷分析(Latent Dirichlet Allocation, LDA)识别的七大主要研究主题的距离图