生物医药版“小龙虾”来了!
私人专属药物研发助手!
生物医药版“小龙虾”,真的来了。不过,这次不是一个全新的模型,而是一个你可能早就听说过的项目——OpenBioMed。
这个由清华大学AIR与水木分子联合推进的开源项目,其实已经存在了一段时间,从 BioMedGPT 到 MolFM,再到后来的多模态生物模型体系,它一直在不断迭代。最近在看Github的时候,发现OpenBioMed彻底升级了,一口气发布了45个针对生物医药研发的Skills,不仅可以直接部署到claude Code,还能在飞书、微信等平台直接使用。
这看起来像是一次普通更新,但如果你最近在关注 AI Agent,就会意识到——这一步,意义完全不一样。因为它不再只是一个“能做预测的模型”,而是开始变成一个——可以自动调用工具、组合能力、执行科研流程的系统。
接下来小编就以如何部署安装测试,为大家带来该Skills的实测分析!
(OpenBioMed Skills交流群)
45个Skills功能介绍
OpenBioMed 提供了45个专业的生物医药领域Skills,以下是完整列表
- 药物相关Skills (11个)
- 蛋白质相关Skills13个
- 单细胞相关Skills11个
- 空间组学Skills2个
- 分子/生物相关Skills7个
- 基础设施相关4个
测试实例
(代码为背后逻辑,实操并未涉及代码输入)
【测试环境准备——激活环境】
- source /root/miniconda3/etc/profile.d/conda.sh
- conda activate OpenBioMed
测试一:BBBP(血脑屏障穿透性预测)
测试代码:
import os
os.environ['dataset_name'] = 'BBBP'
import torch
from open_biomed.core.pipeline import InferencePipeline
from open_biomed.data import Molecule
pipeline = InferencePipeline(
task='molecule_property_prediction',
model='graphmvp',
model_ckpt='./checkpoints/server/graphmvp-BBBP.ckpt',
additional_config='./configs/dataset/bbbp.yaml',
device='cuda:0'
)
mol = Molecule.from_smiles('CC(=O)OC1=CC=CC=C1C(=O)O') # Aspirin
result = pipeline.run(molecule=mol)
print(result[1][0]) # 输出: 0.1882
Agent运行界面👇
推理界面👇
飞书小龙虾运行界面
测试二:SIDER(副作用预测)
测试代码:
import os
os.environ['dataset_name'] = 'SIDER'
import torch
from open_biomed.core.pipeline import InferencePipeline
from open_biomed.data import Molecule
pipeline = InferencePipeline(
task='molecule_property_prediction',
model='graphmvp',
model_ckpt='./checkpoints/server/graphmvp-SIDER.ckpt',
additional_config='./configs/dataset/sider.yaml',
device='cuda:0'
)
mol = Molecule.from_smiles('CC(=O)OC1=CC=CC=C1C(=O)O') # Aspirin
result = pipeline.run(molecule=mol)
print(result[1][0])
Agent运行界面👇
推理界面👇
结果展示👇
风险等级定义——HIGH:概率 > 0.7、MODERATE:概率 0.4-0.7、LOW:概率 < 0.4
飞书小龙虾运行界面
科研流程自动化
所以,OpenBioMed这次真正重要的,并不是那45个skills本身。而是它在回答一个更本质的问题——当模型已经足够多,科研接下来该如何被重新组织?
过去,我们习惯把AI看成一个“更聪明的预测工具”——做结构预测、做分子生成、做单细胞分析。
但现在,这些能力,开始被拆解、被封装、被标准化,变成可以被调用的“技能”。而科研,也开始从“一个一个模型叠加”,变成一个可以被自动组合和执行的流程系统。从这个角度看,OpenBioMed更像一个信号。AI在生物领域的竞争,正在从“谁的模型更强”,转向“谁能把科研流程真正自动化”。
附录——环境创建
创建conda环境
- conda create -n OpenBioMed python=3.9
- conda activate OpenBioMed
2.2 安装依赖
PyTorch 及相关库:
pip install torch==1.13.1+cu117 torchvision==0.14.1+cu117 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu117
(安装过程中可能会遇到torch和系统cuda版本不适配的问题,小编建议可以先禁用cuda,直接用cpu推理)
PyG 相关库:
pip install pyg_lib torch_scatter torch_sparse torch_cluster torch_spline_conv -f https://data.pyg.org/whl/torch-1.13.1+cu117.html
其他依赖:
pip install pytorch_lightning==2.0.8 peft==0.9.0 accelerate==1.3.0 --no-deps
pip install -r requirements.txt
pip install -e .
安装注意事项
- PyG依赖: PyG (PyTorch Geometric) 的安装需要与PyTorch版本匹配
- CUDA版本: 确保CUDA版本与PyTorch版本兼容(本文使用cu117)
- OpenBabel: 未安装OpenBabel会导致MolCRAFT模型无法解码生成的分子