近日,恩和科技在《bioRxiv》发布Biology Protocol Language(BPL)及其生成管线BPL-COGEN,首次为生物实验协议建立了一套形式化的语言体系,打通了Physical AI进入物理世界的标准接口。

BPL是专为生物实验协议设计的可编译、可验证的形式化语言。BPL-COGEN把自然语言协议自动翻译为BPL程序,由一个300亿参数微调大语言模型与确定性编译器构成“生成—验证—修复”闭环。
在基于300篇《Nature Protocols》论文的基准测试中,BPL-COGEN实现95.1%的首轮一致性,通过2轮编译-仿真闭环将正确率推进至98.6%。目前,相关代码已在GitLab完全开源(MIT License)。
AI已会“思考”,但还不会“动手”
当前,AI已经能在数字世界生成假设与设计实验。材料科学领域已经出现自主驱动的Self-driving Lab。但在生物学领域,无论上游AI多么强大,其输出最终仍须被翻译为物理操作,而这一过程,至今仍依赖自然语言文本
这是一个半导体和软件行业几十年前就已跨越的问题。半导体设计通过Verilog和VHDL完成了从自然语言向硬件描述语言的跃迁,软件工程通过类型化语言确立了可验证的稳定性。生物学一直缺少与之对应的、具备编译器验证能力的底层语言,这正是当前AI驱动实验设计与可复现物理执行之间的速率限制环节。
代价是清晰的。《Nature》在2016年针对1,576名研究者的调查显示,超过70%的人无法复现他人实验,超过一半的人无法复现自己的实验(Baker, *Nature*, 2016)。恩和团队的论文进一步将问题归纳为三个维度:
协议精确度。典型指令中常隐藏浓度、时间、体积等多处未明分支点。几十条此类指令叠加,使实验可复现性完全依赖于人员的经验补全。
协议验证。自然语言缺乏在执行前模拟物理一致性的机制,内部逻辑错误往往只能靠人工判断甚至“实验失败”才能察觉。
跨平台可迁移性。一项跨四个实验室的合成生物学研究发现,名义一致的协议在不同实验室间产生了两倍以上的转化效率差异(Beal et al., 2016, 2020),根源不在生物本身,而在执行上下文的隐性差别。
科学的累积,源于方法可被复现与忠实传递。若协议无法被无歧义表达与跨环境复用,AI 生成的实验设计就无法稳定落地。
BPL设计: AI负责生成,BPL-COGEN负责仿真与验证
BPL用形式化规范取代自然语言的歧义。在这套类型系统下,所有隐性参数都必须显式声明;任何违反物理规律的操作(如“将固态粉末加入空容器后取上清液”)将在编译阶段直接被拦截,从而避免了错误流入真实实验台。
为配合这一语言体系,团队构建了BPL-COGEN自动化编译器。它将一个300亿参数微调大语言模型与确定性编译器耦合在“生成—验证—修复”的闭环机制中:自然语言SOP被归一化,转换为BPL,根据编译器诊断反复修正,直到所有物理、量纲、状态约束全部满足。LLM负责理解科学家的意图,编译器负责验证物理世界的约束。

(b)Bounded agentic workflow: (1) SOP input with optional lab catalog, (2) BPL-Nano-30B code generation, (3) three-gate compiler validation (parse, semantic, and plan/validate gates), (4) diagnostic-guided repair loop (max 3 attempts), and (5) output artifact generation. (c) BPL compiler architecture: six-layer compilation pipeline.
实验验证:多维度证实三大难题的解决
团队从三个层面对BPL-COGEN进行系统性验证。
大规模文本评测。在300篇Nature Protocols论文上,BPL-COGEN实现95.1%的首轮一致性。经2轮编译-仿真闭环达98.6%的迭代正确率。
(a) LLM validation scores across processed variants. Overall score, experiment match, protocol validity, and phase completeness all remained high (mean: 95.1). This panel establishes that BPL outputs are not only structurally regularized, but also remain faithful to the underlying experiment. |
(b) Compilation success rate by attempt number: 82.3% of protocols compile on the first attempt; the repair loop resolves an additional 16.3%, leaving only 1.4% unresolved after three attempts |
分子生物学验证。同一份BPL源码同时编译至手动操作与自动化设备两种执行上下文,均产生可复现的实验结果。证明了协议在执行模态上的可迁移性。

GFP fluorescence measurement of cell cultures with IPTG induction. Medium: negative control without cells.
分析化学迁移验证。在不同设备上下文之间迁移后,类胡萝卜素的表征获得了可比的分析结果,验证了协议的设备无关可迁移性。

(b) HPLC chromatogram (C18, 4.6 × 250 mm, 5 μm; 32 min). (c) UHPLC chromatogram (Kinetex C18, 2.1 × 50 mm, 1.7 μm; 2.1 min). All five compounds (retinol, retinal, retinyl acetate, lycopene, β-carotene) achieved baseline resolution with preserved elution order.
这三项验证共同确认:BPL与BPL-COGEN同时解决了长期困扰行业的协议精确度、可验证性、跨平台可迁移性三大核心难题。
在SAION物理AI平台中的定位
BPL是恩和SAION物理AI平台“认知—控制—执行”三层架构中执行层的标准接口。向下,它下发指令到生物铸造厂的自动化设备与人类操作员;向上,它回流结构化的实验执行数据,驱动认知层与控制层的持续进化。
结合此前SAION AI平台在文献阅读到质粒设计与湿实验组装的100%正确率、质粒构建90%成功率,BPL的引入使物理AI闭环的执行层首次具备了可验证、可迁移的标准协议基础。
在AI+生物制造全球图景中的意义
生物制造领域AI技术的核心价值,在于能否真实推动兑现数千万元乃至数亿元的经济效益。当AI真正驱动产业链、产品、订单的经济价值兑现时,它在产业中才获得存在的意义。BPL的提出,是恩和把“AI 兑现产业价值”落到执行层的具体动作。
据相关机构预测,至2035年全球生物制造市场规模将达到约6万亿美元。纵观工业史,所有制造业从“作坊”走向“工业化”的关键点,都伴随着形式化协议标准的建立。作为首 个具备“编译时物理验证 + 跨平台可迁移”双能力的工程级方案,BPL为这一万亿级赛道的标准化推进提供了关键基础设施。
正如研究团队在论文中所指出的:BPL-COGEN提供了生物领域物理具身AI所需的关键基础。只有当AI能够以一种可被验证的语言“说清楚自己想做什么”,自主实验室代理才在工程上成为可能。生物制造的工程边界,正被重新定义。
论文原文:Song, R., Fu, Y., Zhao, Z., Yu, J., Yuan, Q., & Chen, C. T. (2026). Towards autonomous biology: Compiler-Verified Protocols as a Foundation for Real World AI Execution. bioRxiv, 2026-05.
【免责声明】:本文不构成任何投资建议。市场有风险,投资需谨慎。
如有任何疑问,请联系(editor@zero2ipo.com.cn)投资界处理。







