Chemsmart：告别计算化学的「手工作 - 作坊」

Chemsmart 是一个开源的「瑞士军刀」工具包，旨在将计算化学中繁琐的手动流程自动化，让科学家专注于科学思考，而非文件格式转换。
这个新框架为 AI 生成模型引入物理学「家教」，通过强化学习奖励化学上稳定、真实的分子，引导 AI 超越简单的形态模仿。
DrugReasoner 是一款能预测新药获批概率的 AI。它通过对比已知的成功与失败药物来解释预测过程，如同化学家一般推理，从而揭示了预测模型的内部逻辑。
结合已知分子片段信息指导并修正传统对接，新流程提升了药物分子结合姿态预测的准确性，展现了数据与物理结合的优势。
DRUGFLOW 学习「好分子」的完整分布，如同绘制一张完整的藏宝图，由此实现了更真实、可控的分子生成。

1. Chemsmart：告别计算化学的「手工作坊」

亲手操作过量子化学计算的人都清楚：工作的大部分内容是处理繁琐的数据，如同一个数据勤杂工，真正用于思考深奥化学问题的时间很少。

研究者的日常工作流通常如下：用一个软件绘制分子，保存为特定格式；为了计算，再将其转换为另一种格式。接着，需要手动编写输入文件，仔细设定参数，然后提交到计算集群，在等待中频繁检查任务状态。计算结束后，还要从庞大的输出文件中，通过手动或自编脚本提取能量、坐标等关键数据。最后，将这些数据导入可视化软件，生成报告所需的图片。

流程中的每一步都伴随着重复劳动、格式不兼容和人为失误的风险。尽管我们拥有 Gaussian、ORCA 这类强大的计算引擎，却始终在手动为它们「加燃料、清积碳」。

Chemsmart：计算化学的「项目管家」

Chemsmart 工具包的目标是成为管理整个研究流程的「项目管家」，解决研究中的实际痛点。

作为一个开源 Python 工具包，Chemsmart 的设计思路是：将计算化学中最繁琐的手动操作自动化。

它的工作方式如下：

首先，它定义了一个核心的Molecule对象，可以将其理解为一个「通用文件格式」。不同化学软件产生的分子和数据，都能先转换为这个标准对象，从而解决格式不兼容问题，如同为所有软件配备了万能翻译器。

其次，它将完整的计算流程拆分为独立的模块化任务，例如「几何优化」、「过渡态搜索」和「热力学分析」。使用者可以像搭建乐高积木一样，将这些模块组合起来，构建全自动化的工作流。

使用者只需下达指令，例如：「优化这个分子，计算其频率，并生成 PyMOL 可视化文件。」接下来的工作便可完全交给它。Chemsmart 会自动准备输入文件、提交任务、监控进程、解析结果，并将所有文件整理归档。

Chemsmart 带来的改变

研究者得以从重复、缺乏创造性的劳动中解脱，专注于化学问题本身。

对于新手，Chemsmart 降低了入门门槛。使用者无需记忆各种软件晦涩的输入参数，只需调用几个简单的 Python 函数。

对于资深研究者，它提升了工作效率和可重复性。对上百个分子执行标准化的计算流程成为可能，这对构效关系等研究至关重要。

Chemsmart 的所有代码均已开源，并采用模块化设计。因此，它既能作为独立工具使用，也能作为 Python 库，无缝集成到更复杂的定制化分析流程中。

Chemsmart 是一个经验丰富的工程师为解决日常痛点而打造的实用工具箱。对于一线研究者，一个称手的工具箱，其价值有时会超过一个遥远的理论。

📜Title: Chemsmart: Chemistry Simulation and Modeling Automation Toolkit for High-Efficiency Computational Chemistry Workflows
📜Paper: https://arxiv.org/abs/2508.20042v1

2. AI 生成分子：终于学会了物理

与 3D 分子生成模型打过交道的人都清楚一个现实：这些 AI 是顶级的艺术家，却是末流的工程师。

你给它一个任务，它能「画」出一些结构新颖、看起来很美的分子。但把这些「艺术品」放到物理学的放大镜下，问题就来了。键长不对，键角扭曲，原子之间挤得像早高峰的地铁。这些分子在真实世界里根本站不住脚。

我们一直想要一个能懂物理的 AI 工程师。新提出的 RLPF 框架，正是朝这个方向迈出的坚实一步。

给 AI 请个物理家教

研究者没有去构建一个看过更多数据的、更复杂的 AI。他们另辟蹊径，为 AI 引入了一位物理学「家教」和一套「奖惩机制」。

这个家教是力场，奖惩机制则是强化学习（Reinforcement Learning, RL）。

它的工作方式如下：

扩散模型生成分子的过程并非一步到位。它像雕塑家从一团模糊的「原子云」开始，逐步刻画细节。

RLPF 框架在雕塑家每刻一刀后，都让旁边的物理学「家教」评估一次。

家教（力场）会判断，这一刀是让整个结构的内部应力变大还是变小？是让它更稳定，还是更接近散架？

如果这一步让分子变得更稳定、更符合物理规律，AI 就得到一个「奖励」，并记住这是个好操作。

如果这一步让分子变得更不稳定，AI 就受到一个「惩罚」，并学会避免这条路。

经过这种持续的物理反馈与奖惩循环，AI 在创作的每一步都必须思考物理后果，超越了单纯模仿训练数据中分子形态的局限。

效果如何？

经过「家教」调教的 AI，生成的分子质量上了一个台阶。

在 QM9 标准数据集上，它生成的分子中，物理稳定性的比例从 82% 提升到了 93% 以上。

这个「家教」框架具备通用性，能指导 EDM、GeoLDM、UniGEM 等不同的扩散模型。它是一个普适的、可即插即用的「增强模块」。

这项工作跳出了比拼模型参数的范式，代表了一种根本性的思路转变。它将物理学知识注入到 AI 的生成过程中。

📜Title: Guiding Diffusion Models with Reinforcement Learning for Stable Molecule Generation
📜Paper: https://arxiv.org/abs/2508.16521
💻Code: https://github.com/ZhijianZhou/RLPF/tree/verl_diffusion

3. DrugReasoner：能解释自己的 AI 预测

药物发现领域充斥着各类 AI 预测模型，它们可以预测分子的溶解度、毒性或结合亲和力。但很少有人敢将数亿美元的临床试验，完全押注于一个 AI 模型给出的数字。

因为这些模型大多是黑箱。

当一个模型给出 0.87 的成药性得分，却无法解释原因时，它就像一个只报数字的算命先生。决策者无法判断预测是基于严谨计算还是随机猜测，这种无法解释的结果，应用价值有限。

DrugReasoner 的设计正是为了解决这个痛点。

AI 学会了「举一反三」

研究者训练 AI 掌握了化学家的一项核心技能：比较。

当输入一个新设计的候选药物时，DrugReasoner 会检索知识库，找出结构最相似的已知药物。随后，它将这些相似药物分为两组：一组是已成功上市的，另一组是在临床试验中失败的。

最后，它生成一份推理报告，例如：

「此分子有 73% 的概率获批。其 A 部分结构与某成功抗癌药相似，该结构通常成药性良好。但其 B 部分结构与某因肝毒性失败的分子类似，这会降低其获批概率。」

这种解释方式提供了可用于决策的清晰信息。

结果怎么样？

在包含大量真实药物分子的数据集上测试，DrugReasoner 的预测准确率（AUC 为 0.73）与传统的机器学习方法（如 XGBoost）相当，并优于另一新近发布的模型 ChemAP。

这表明，模型在提供可解释性的同时，并未牺牲预测准确性。

预测新药能否获批，受科学、商业、运气等多种变量影响。在此背景下，AUC 0.73 是一个可靠的成绩，但并非完美无缺。

研究者承认，为防止模型通过记忆 SMILES 字符串「作弊」，训练时未提供分子的 SMILES 表示。这或许限制了模型对精细化学结构的理解，但也证明了该推理方法在信息受限的情况下依然有效。

📜Title: DrugReasoner: Interpretable Drug Approval Prediction with a Reasoning-augmented Language Model
📜Paper: https://arxiv.org/abs/2508.18579
💻Code: https://github.com/mohammad-gh009/DrugReasoner

4. Polaris 挑战赛：用碎片知识提升对接精度

一线从事结构药物设计的研究者对分子对接软件的感情很复杂。它的速度快，能在一夜之间筛选百万级分子库。但它的打分函数又常不可靠。软件会生成大量看似理想的结合姿态并给出高分，但实验验证的结果却往往不符。

对接软件就像一个速度飞快但鲁莽的侦察兵，能迅速勘察整个战场，却也常把稻草人误报为敌人。研究者需要的是一副「敌我识别」眼镜。Polaris 挑战赛的一篇论文展示了这样一副眼镜。

别再让 AI 瞎猜了，给它一本「小抄」

研究者的思路并非重造对接引擎，而是改进打分环节。他们认为 Vina 等工具在生成多样化姿态方面已足够好，短板在于打分。

他们使用的「小抄」是数据库中成千上万个小分子片段的晶体结构。

这些片段如同「路标」，通过实验数据标示出蛋白质口袋中哪些区域疏水、哪些位置适合形成氢键。

新流程首先使用 VinaGPU 生成大量可能的结合姿态。随后，AI 利用「小抄」进行批改：检查分子中的基团是否与已知片段的「路标」位置匹配。若匹配则加分，反之则减分。

流程还以更主动的方式利用这份「小抄」：约束对接。如同考前提示，它能引导对接程序从初始阶段就朝正确的方向搜索。

如果没有小抄怎么办？

当缺乏可参考的片段数据时，流程会启用后备方案：MM/GBSA重打分。

这种基于物理学的传统计算方法虽然比 Vina 的打分函数慢，但通常更准确。

整个流程构成一个层层递进的过滤器：用最快的方法海选，用数据驱动的知识精选，最后用物理学方法复核。

这东西真的靠谱吗？

研究者将该流程应用于新冠病毒（SARS-CoV-2）及其近亲中东呼吸综合征冠状病毒（MERS-CoV）的蛋白酶。

结果显示，对超过一半的分子，该流程成功预测出与晶体结构误差在 2 埃以内的结合姿态。这在真实世界靶点上是一个可靠的成绩。

他们还证明，从 SARS-CoV-2 片段数据中学到的知识，可以成功迁移并用于 MERS-CoV 的预测。

这项工作提供了一个可部署的工程解决方案，旨在解决日常研究中的实际问题。计算药物发现的未来，在于巧妙地组合数据、物理学原理与化学直觉，而非依赖单一工具。

📜Title: Polaris Challenge: Data-driven Priors to Improve Docking for Pose Prediction
📜Paper: https://doi.org/10.26434/chemrxiv-2025-fv3c3

5. DRUGFLOW：AI 学会了画「藏宝图」

它学习整个「好分子」的分布，如同绘制一张完整的藏宝图，以此取代只标记单个宝藏点的旧方法。
它内置了不确定性检测、蛋白质柔性等化学家需要的功能，让 AI 从艺术家向工程师转变。

与生成式 AI 打过交道的人都清楚，AI 是顶级的艺术家，却是二流的化学家。给它一个蛋白质口袋，它能「画」出结构新颖、看似完美的分子。但这些分子大多只是在统计上「貌似」已知药物，AI 并未真正理解一个分子「好」在何处。

就像一个只会临摹梵高画作的画匠，他能画出星空，却不懂其深意。

DRUGFLOW 的目标，就是教 AI 去学天文学。

从「画快照」到「绘地图」

这项工作的核心思路发生了转变。一个好药物本身就坐落在广阔「化学空间」里，是一片能量低、性质好的区域。因此，AI 的任务是学会绘制出这片区域的完整「地图」，取代以往生成单张「快照」的做法。

DRUGFLOW 通过结合两种数学工具——连续流匹配（Continuous Flow Matching），可想象为用平滑曲线描绘地形；以及离散马尔可夫桥（Discrete Markov Bridges），可想象为在关键地标间建立逐步路径——来学习蛋白质口袋里所有「好分子」的完整分布。

学会绘制地图后，AI 便从模仿的画匠，转变为能指出山峰与盆地的地理学家。

AI 终于长了点「脑子」

拥有全局观后，AI 便能实现一些过去难以企及的功能。

首先是不确定性。DRUGFLOW 内置了「不靠谱探测器」。当它生成的分子落在地图上未曾探索的区域，它会直接提示：「我不确定这个分子是否可靠。」这种知道自己「不知道」的能力，能避免合成 AI 幻想出的分子。

其次是尺寸自适应。生成分子时，它会动态调整大小，主动删除可能与蛋白质口袋产生空间位阻的原子。就像装修工把沙发塞进门前，会先拆掉沙发腿。

最后是蛋白质柔性。升级版 FLEXFLOW 在生成配体分子的同时，能同步调整蛋白质口袋的氨基酸侧链朝向。真实世界里，蛋白质口袋并非坚硬的模具，而像一只柔软的手套。FLEXFLOW 如同一个真正的设计师，在设计手的同时，能让手套自适应手的形状。

📜Title: Multi-Domain Distribution Learning for De Novo Drug Design
📜Paper: https://arxiv.org/abs/2508.17815

目录