免费开放!生命科学领域成熟、社区驱动的标准化软件注册

📅 2026/7/2 13:54:32 👁️ 阅读次数 📝 编程学习
免费开放!生命科学领域成熟、社区驱动的标准化软件注册

摘要

计算方法是生命科学研究的核心支撑。随着软件工具与数据库的快速增长、类型多元化,研究者难以针对特定任务高效查找、比对和复用相关方法。bio.tools是个社区驱动的软件注册库,旨在提升研究软件的可见度,通过结构化、可互操作、易获取的元数据体系,简化研究者对接软件生态的流程。

该平台采用EDAM本体及其他受控词表对工具进行标准化标注,支持用户按研究主题、分析操作、输入输出数据类型与数据格式进行多维度检索筛选。bio.tools提供信息完善的工具详情页以支持交互式探索,同时提供文档完备的REST API,支持工具检索、信息获取与注册库统计数据的程序化调用。

依托数千名社区成员的共同贡献,结合半自动化文献挖掘技术保障内容时效性,该注册库目前已收录近3.3万条标注完善的工具条目。近期升级内容包括:引入机器辅助评分机制以优化人工审核优先级、统一标准体系与软件架构。此外,bio.tools已成为核心的上游元数据数据源,被ELIXIR研究软件生态系统及众多外部服务复用,支撑数据同步、交叉关联与各类下游服务。

veits@bmb.sdu.dk

#研究软件注册库 #biotools #EDAM本体 #FAIR原则 #文献挖掘 #生命科学软件生态

网络服务功能说明

应用程序接口

表1核心接口端点与典型使用场景

涵盖工具列表查询、通用检索、属性筛选、单工具详情获取等场景,标注各接口的请求方法、路径、功能说明与身份验证要求。

输出展示模块

表2bio.tools注册库当前内容统计数据

数据汇总自官方/api/stats接口,涵盖工具类型分布、各类EDAM标注总量等核心指标。

结果与讨论

使用场景A:基于本体概念的工具发现

图1 bio.tools工具展示形式概览

上方为场景A检索得到的工具列表;左下方为列表首位工具MAFFT的详情页面;右下方为该工具在OpenEBench中的基准测试信息,以及TeSS平台中的配套培训资源。点击主题或任意功能属性标签,可跳转查看同主题、同功能标注的其他工具。

使用场景D:融入研究软件生态系统,实现多资源联动

图2 bio.tools在研究软件生态系统中的定位及跨服务关联

标注了各平台接入的bio.tools标识符数量:Galaxy 502个、debian-med 357个、Bioconda 1784个、Biocontainers 1134个;RSEc Atlas、EBI Search、NIAID数据生态全量收录;ToolFinder收录526个。

数据

官方服务地址

https://bio.tools

平台源代码(采用GPLv3开源协议)

https://github.com/bio-tools/biotoolsRegistry

使用帮助与官方教程

https://biotools.readthedocs.io/en/latest

编目配套工具资源

文献挖掘、大语言模型评分与平台上传全流程封装

https://github.com/bio-tools/BiotoolsLLMAnnotate

Pub2Tools文献转工具条目

https://github.com/Bio-tools/pub2tools

EDAMmap本体自动映射

https://github.com/Edamontology/edammap

注册库统计可视化页面

https://bio.tools/stats

接口开发文档

https://biotools.readthedocs.io/en/latest/api_reference.html

4个核心代码仓库已在Zenodo平台完成永久归档

https://doi.org/10.5281/zenodo.19662200

详细总结

思维导图

参考

Nucleic Acids Res. 2026 Jun 27:gkag420. doi: 10.1093/nar/gkag420.

bio.tools: an expanded web service for research software in the life sciences

注:AI辅助创作,如有不当欢迎指出。内容仅供参考,不构成任何建议。