从文献自动提取、全流程智能体到物理现实检验

ReactionSeek 框架利用大语言模型(LLM)和巧妙的提示工程,实现了化学文献信息的自动化、高精度提取。 “Prompt-to-Pill”框架则构建了一个由中央 AI 协调的智能体团队,试图将从分子设计到虚拟临床试验的漫长流程整合成一条自动化流水线。最后,一种嵌套学习框架通过引入物理学的“现实检验”,成功地让生成式 AI 设计出可合成且在湿实验中有效的全新药物分子。

AI 药物发现
大语言模型
AI 智能体
计算化学
Author
Published

Friday, the 29th of August, 2025

目录

  1. ReactionSeek 框架通过巧妙的提示工程,让通用大语言模型(LLM)能以超过 95% 的准确率,从化学文献中自动提取反应物、产率、溶剂等关键信息,解决了化学数据化的核心瓶颈。
  2. 「Prompt-to-Pill」框架利用一个中央协调的 AI 智能体群,试图将从分子设计到虚拟临床试验的漫长、割裂的流程,整合成一条自动化流水线。
  3. 通过一个嵌套学习循环,该框架让一个富有创造力的生成式 AI,接受一个严谨的、基于物理学的「事实核查员」的持续指导,最终成功地设计出了全新的、可合成的、且在湿实验中真正有效的药物分子。

1. ReactionSeek:用大模型自动「阅读」有机合成文献

有机化学领域,积累了上百年的知识财富。但这些财富,绝大部分都「锁」在了一篇篇的学术论文和专利里,以非结构化的文本、图片和表格形式存在。

一个药物化学家想知道,「这个特定的 Suzuki 偶联反应,用什么催化剂和配体,在什么溶剂里,收率最高?」他可能需要花上几天时间,去手动翻阅几十篇文献,把关键信息一条条地抄录到表格里。这个过程,枯燥、低效,而且极易出错。

如果我们能让 AI 自动地去「阅读」所有文献,把里面的关键信息都提取出来,变成一个结构化的、可供机器查询和分析的大型数据库,那将会极大地加速化学研究的进程。

ReactionSeek 框架,就是朝着这个目标迈出的坚实一步。

如何教 LLM「读懂」化学天书?

让一个通用的大模型(比如 GLM-4)去读懂充满专业术语和隐晦表达的化学实验部分,挑战巨大。过去,我们可能需要用大量的标注数据去对模型进行微调,成本很高。

ReactionSeek 主要依赖于一套精心设计的「提示工程」(Prompt Engineering)。

给 AI 下达指令时,不是简单地说「去读这篇文章」,而是给了它一个非常详细的「阅读理解指南」。这个指南会告诉它:

通过这种方式,即使不用专门的微调,通用大模型也能被「引导」着,去高效、准确地完成化学信息的提取任务。

不仅能读「字」,还能识「图」

一篇化学文献,信息量最大的往往是那个画着反应路线的「Scheme」。ReactionSeek 还包含了一个图像挖掘模块。它能识别出反应流程图里的各个分子,并判断出哪个是反应物,哪个是产物,哪个是催化剂。这「读图」和「读字」能力的结合,让信息提取变得更完整、更准确。

从「数据化」到「知识化」

当 ReactionSeek 把百年经典期刊Organic Syntheses里的三千多篇文章都「读」了一遍,并把结果存入数据库后,神奇的事情发生了。
1. SynChat 诞生 :他们基于这个数据库,开发了一个叫 SynChat 的聊天机器人。现在,化学家不再需要去写 SQL 查询语句,可以直接用大白话问它:「我想知道用 XX 催化剂做 XX 反应的例子,请给我一个详细的实验步骤。」
2. 发现历史趋势 :他们对整个数据库进行分析,清晰地揭示了不对称催化和金属催化剂使用在过去几十年里的历史变迁。这证明了,当零散的知识被汇聚成结构化的数据后,我们就能站在一个更高的维度,去发现过去难以察觉的宏观规律。

ReactionSeek 为我们提供了一个强大且可扩展的框架,它正在把化学从一个依赖人工经验的「手艺活」,推向一个由数据和 AI 驱动的新时代。

📜Paper: https://doi.org/10.26434/chemrxiv-2025-t110q
💻Code: https://github.com/DeepSynthesis/ReactionSeek.git

2. Prompt-to-Pill: AI 智能体能包办新药研发吗?

对于 AI 制药,我们已经见过了各种各样的「点解决方案」:有的能帮你生成新分子,有的能预测 ADMET,还有的能分析临床数据。大家各管一摊,干得都不错。但这篇名为「Prompt-to-Pill」的工作,不想只做一个工具,它想做一条完整的流水线,或者说,一个由 AI 驱动的虚拟制药公司。

你看这张流程图,整个体系被分成了临床前和临床两个大阶段,每个阶段里都塞满了各司其职的 AI 智能体(Agent)。这就像一个项目团队,有专门负责化学合成的,有专门负责药理毒理的,还有专门负责临床开发的。而整个项目的灵魂,是一个叫「Orchestrator」的中央协调 LLM。

这个「Orchestrator」很有意思。它就像一个经验丰富的项目经理。当研究者输入一个指令,比如「为 DPP4 靶点开发一款新药」,这个项目经理就开始分配任务。它会对「分子生成」智能体说:「嘿,给我设计一些有潜力的新骨架。」然后,它会把生成出来的分子丢给「ADMET 筛选」和「分子对接」这两个智能体,让它们评估一下这些候选化合物的成药性和靶点结合能力。

这个过程不是单向的。如果一个分子 ADMET 预测很差,或者对接分数很低,「Orchestrator」会拿到这个反馈,然后告诉「分子生成」智能体:「这个方向不行,换个思路,比如优化一下那个杂环部分,降低脂溶性试试。」这种迭代循环,正是真实药物化学家每天在做的事情。

这套系统没有停留在临床前。当一个候选分子看起来足够有前途时,「Orchestrator」会把它推向「临床」阶段。然后,「临床试验设计」智能体会开始干活,规划一期、二期、三期的方案。甚至还有一个「患者招募」智能体,用来在虚拟的患者群体中寻找合适的受试者。

研究者用 DPP4 靶点把整个流程跑了一遍,算是一次不错的概念验证。选择一个数据充分、机理明确的靶点是明智的,可以最大程度地检验流程本身是否跑得通。

当然这终究是一个高度复杂的模拟。AI 设计的临床方案,真的能应对真实世界里患者的复杂性和变数吗?那个「虚拟患者」,是基于真实世界数据的数字孪生,还是仅仅是参数化的统计模型?这里的细节,决定了这套系统究竟是一个高级的模拟沙盘,还是一个真正能指导决策的工具。

作者们自己也很清楚这点,他们提到了「推理透明度」和评估标准的问题。没错,如果这个 AI 项目经理最后给出了一个「Go/No-Go」的决策,我们必须能打开它的「大脑」,看看它做出这个判断的依据是什么。我们不能只因为它叫「AI」就盲目相信。

「Prompt-to-Pill」还不是一个能直接把想法变成药片的魔法机器。它更像一个蓝图,展示了未来药物研发工作流的一种可能性。它把过去分散的计算工具,用一个智能协调核心串联了起来。它不会取代科学家,但它可能会彻底改变科学家的工作方式——从亲自执行每一个实验和计算,转变为监督和指导一个由 AI 智能体组成的虚拟团队。

📜Title: Prompt-to-Pill: Multi-Agent Drug Discovery and Clinical Simulation Pipeline
📜Paper: https://www.biorxiv.org/content/10.1101/2025.08.12.669861v1

3. AI 药物设计:物理学的现实检验

我们已经快被那些能生成漂亮分子图片的生成式模型给淹没了。它们中的大多数,都像是一个灵感无限、但完全不懂工程学的建筑师。他能给你画出一些悬浮在空中、有着莫比乌斯环楼梯的、美轮美奂的建筑草图。你问他这东西怎么造?他说不知道。你问他这东西会不会塌?他说没想过。

搞药的人每天都在跟物理和化学的残酷现实打交道。我们需要的,不是一个艺术家,我们需要的是一个能画出既漂亮、又稳固、而且施工队还知道怎么盖的图纸的、真正的建筑工程师。

这篇发表在Communications Chemistry上的研究,设计的这套工作流程,承认 AI 既是天才,也是白痴。所以,他们设计了一套「嵌套」的主动学习循环,给这个天才白痴,配了一个严厉的、只相信物理定律的「监工」。

内循环:AI 的「头脑风暴」

在内循环里,AI(一个变分自编码器)可以尽情地放飞自我。它的任务,是生成海量的、多样化的、看起来像个药的分子。同时,这个循环里,还有一些比较「便宜」的过滤器,用来检查这些分子是不是至少在理论上,有条合理的合成路线。这就像是建筑师在画草图的阶段,旁边有个初级工程师,负责提醒他:「嘿,这个悬臂梁可能有点太长了,我们最好还是加根柱子。」

外循环:物理学的「最终审判」

内循环里那些最优秀的「草图」,会被提交到外循环。这里,就是「监工」登场的地方。这个「监工」,就是那些我们又爱又恨的、计算上无比昂贵、但也无比接近「地面真实」的物理学模拟方法——比如 PELE 模拟和绝对结合自由能(ABFE)计算。

这个步骤,就像是把建筑师的草图,直接拿去做风洞测试和结构力学分析。它会毫不留情地告诉你,这个设计,在真实的物理世界里,到底行不行。这个「审判」的结果,会作为最关键的「奖励」或「惩罚」信号,反馈给那个还在内循环里画草图的 AI。

这种分层、嵌套的结构,是一种在创造性和现实性之间做出的、非常权衡。你没有用昂贵的物理模拟,去扼杀 AI 的每一个「奇思妙想」。你只是用它,来为那些最顶尖的想法,进行最终的「现实检验」。

那么,这套系统的表现如何?

这才是这篇论文没有止步于报告一些漂亮的计算指标。他们真的,把 AI 设计的分子,给了出来。

他们把这个流程,应用到了 CDK2 这个我们都很熟悉的激酶靶点上。AI 为他们设计了一批全新的分子。他们挑选了其中的 9 个,在实验室里把它们合成了出来。结果,9 个里面,有 8 个,在体外实验中,显示出了对 CDK2 的抑制活性。其中最好的一个,IC50 值达到了纳摩尔级别。

他们还把这个流程,用在了 KRAS 这个出了名难搞的靶点上。虽然这次他们没有去合成,但in silico的验证结果,也同样很有希望。

📜Title: Optimizing Drug Design by Merging Generative AI with a Physics-Based Active Learning Framework
📜Paper: https://www.nature.com/articles/s42004-025-01635-7
💻Code: https://github.com/IFilella/ALGen-1

Back to top