飞书实测!生物医药版“小龙虾”来了!清华AIR×水木分子!私人专属药物研发助手!

0 阅读3分钟

image.png

生物医药版“小龙虾”来了!

私人专属药物研发助手!

生物医药版“小龙虾”,真的来了。不过,这次不是一个全新的模型,而是一个你可能早就听说过的项目——OpenBioMed。

image.png

github.com/PharMolix/O…

这个由清华大学AIR与水木分子联合推进的开源项目,其实已经存在了一段时间,从 BioMedGPT 到 MolFM,再到后来的多模态生物模型体系,它一直在不断迭代。最近在看Github的时候,发现OpenBioMed彻底升级了,一口气发布了45个针对生物医药研发的Skills,不仅可以直接部署到claude Code,还能在飞书、微信等平台直接使用。

image.png

这看起来像是一次普通更新,但如果你最近在关注 AI Agent,就会意识到——这一步,意义完全不一样。因为它不再只是一个“能做预测的模型”,而是开始变成一个——可以自动调用工具、组合能力、执行科研流程的系统。

接下来小编就以如何部署安装测试,为大家带来该Skills的实测分析!

779f4f0c9afa10fbb96c04063b1a3489.jpg

(OpenBioMed Skills交流群)

45个Skills功能介绍

OpenBioMed 提供了45个专业的生物医药领域Skills,以下是完整列表

  1. 药物相关Skills (11个)

image.png

  1. 蛋白质相关Skills13个

image.png

  1. 单细胞相关Skills11个

image.png

  1. 空间组学Skills2个

image.png

  1. 分子/生物相关Skills7个

image.png

  1. 基础设施相关4个

image.png

测试实例

(代码为背后逻辑,实操并未涉及代码输入)

【测试环境准备——激活环境】

  1. source /root/miniconda3/etc/profile.d/conda.sh
  2. conda activate OpenBioMed

测试一:BBBP(血脑屏障穿透性预测)

测试代码:

import os
os.environ['dataset_name'] = 'BBBP'
import torch
from open_biomed.core.pipeline import InferencePipeline
from open_biomed.data import Molecule
pipeline = InferencePipeline(
    task='molecule_property_prediction',
    model='graphmvp',
    model_ckpt='./checkpoints/server/graphmvp-BBBP.ckpt',
    additional_config='./configs/dataset/bbbp.yaml',
    device='cuda:0'
)
mol = Molecule.from_smiles('CC(=O)OC1=CC=CC=C1C(=O)O')  # Aspirin
result = pipeline.run(molecule=mol)
print(result[1][0])  # 输出: 0.1882

Agent运行界面👇 image.png

推理界面👇 image.png image.png image.png

飞书小龙虾运行界面

测试二:SIDER(副作用预测)

测试代码:

import os
os.environ['dataset_name'] = 'SIDER'
import torch
from open_biomed.core.pipeline import InferencePipeline
from open_biomed.data import Molecule
pipeline = InferencePipeline(
    task='molecule_property_prediction',
    model='graphmvp',
    model_ckpt='./checkpoints/server/graphmvp-SIDER.ckpt',
    additional_config='./configs/dataset/sider.yaml',
    device='cuda:0'
)
mol = Molecule.from_smiles('CC(=O)OC1=CC=CC=C1C(=O)O')  # Aspirin
result = pipeline.run(molecule=mol)
print(result[1][0])

Agent运行界面👇 image.png

推理界面👇 image.png

结果展示👇 image.png 风险等级定义——HIGH:概率 > 0.7、MODERATE:概率 0.4-0.7、LOW:概率 < 0.4

飞书小龙虾运行界面

科研流程自动化

所以,OpenBioMed这次真正重要的,并不是那45个skills本身。而是它在回答一个更本质的问题——当模型已经足够多,科研接下来该如何被重新组织?

过去,我们习惯把AI看成一个“更聪明的预测工具”——做结构预测、做分子生成、做单细胞分析。

但现在,这些能力,开始被拆解、被封装、被标准化,变成可以被调用的“技能”。而科研,也开始从“一个一个模型叠加”,变成一个可以被自动组合和执行的流程系统。从这个角度看,OpenBioMed更像一个信号。AI在生物领域的竞争,正在从“谁的模型更强”,转向“谁能把科研流程真正自动化”。

附录——环境创建

创建conda环境

  1. conda create -n OpenBioMed python=3.9
  2. conda activate OpenBioMed

2.2 安装依赖

PyTorch 及相关库:

pip install torch==1.13.1+cu117 torchvision==0.14.1+cu117 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu117

(安装过程中可能会遇到torch和系统cuda版本不适配的问题,小编建议可以先禁用cuda,直接用cpu推理)

PyG 相关库:

pip install pyg_lib torch_scatter torch_sparse torch_cluster torch_spline_conv -f https://data.pyg.org/whl/torch-1.13.1+cu117.html

其他依赖:

pip install pytorch_lightning==2.0.8 peft==0.9.0 accelerate==1.3.0 --no-deps
pip install -r requirements.txt
pip install -e .

安装注意事项

  1. PyG依赖: PyG (PyTorch Geometric) 的安装需要与PyTorch版本匹配
  2. CUDA版本: 确保CUDA版本与PyTorch版本兼容(本文使用cu117)
  3. OpenBabel: 未安装OpenBabel会导致MolCRAFT模型无法解码生成的分子