大语言模型在生物物理序列优化中的评估与挑战

31 阅读1分钟

通用模型与专用求解器:评估大语言模型在高度约束的生物物理序列优化任务中的表现

尽管大语言模型(LLMs)在生物分子优化问题中展现出潜力,但它们计算成本高昂且难以满足精确约束。另一方面,专用求解器(如LaMBO-2)虽能提供高效性和细粒度控制,但需要更多领域专业知识。由于实验室验证成本高昂且合成基准不足,比较这些方法具有挑战性。

为此,我们引入了Ehrlich函数——一个能够捕捉生物物理序列优化问题几何结构的合成测试套件。实验发现,仅通过提示,现成的大语言模型难以优化Ehrlich函数。

作为回应,我们提出了LLOME(基于边际期望的语言模型优化),这是一种用于在线黑盒优化的双层优化例程。结合新颖的偏好学习损失函数,LLOME不仅能够学习解决部分Ehrlich函数,甚至在中等难度的Ehrlich变体上表现与LaMBO-2相当或更优。

然而,大语言模型也表现出一定的似然-奖励失准,且在缺乏显式奖励时表现不佳。结果表明,大语言模型偶尔能带来显著优势,但专用求解器仍具竞争力且开销更低。


注释:本文取代了arXiv:2407.00236v1,且与arXiv:2407.00236存在文本重叠。