
跟着生物检测、扰动实验与筹画建摹本事连续训诲,人命科学商量的精度与界限正在飞快擢升。然则,与高速增长的数据分娩能力比拟,科研体系在常识整合与科学推理层面的智能化能力却彰着滞后。海量有用信息散布在论文、数据库与实验收尾之中,依赖东谈主工梳理不仅效能低,也难以跨领域干系已有论断,导致很多仍是被考证的发现无法实时升沉为新的商量念念路或临床有规划。
这种「常识碎屑化」问题,在「老药新用」领域尤为典型。不管是达拉非尼自后被发现具有耳保护作用,如故氯胺酮拓展出新的挽救价值,都资历了数年乃至数十年的升沉滞后,反应出现时科研经过在常识发现与整合上的瓶颈。
连年来,大言语模子(LLM)凭借海量语料教练所酿成的检索、归纳与逻辑推理能力,初始在人命科学商量中展现后劲。讨好微调、检索增强生成(RAG)以及多智能体合作等本事后,这类模子仍是未必在文件分析、药物展望、科学假定生成等单项任务中达到甚而跳动东谈主工水平。然则,现存 AI 器具大多仍停留在科研经过的局部要津,难以真确贯通「假定生成—实验遐想—数据分析—收尾迭代」的竣工链条,因此尚不行已毕真确道理上的闭环智能科研。
针对这一问题,来自好意思国旧金山 FutureHouse、英国牛津大学以及好意思国福特汉姆大学的纠合团队提议了 Robin 生物学多智能体系统。这是首个同期交融科学假定生成与实验数据分析能力、并已毕运动闭环责任流的生物医学智能系统。
Robin 通过文件检索智能体与数据分析智能体的协同配合,未必半自主完成疾病机制理解、候选药物筛选、实验复盘以及假定迭代。商量团队以干性年齿有关性黄斑变性(dAMD)这一挽救技巧匮乏、临床需求遑急的疾病为应用场景,考证了 Robin 在智能化药物筛选中的能力,为东谈主工智能驱动的新药研发与老药新用提供了新的实验范式。
有关商量效能以「A multi-agent system for automating scientific discovery」为题,已发表于 Nature。
乐鱼体育官方网站商量亮点:
* Robin 系统初度将文件假定生成与生物实验数据分析整合为运动闭环责任流
* Robin 可适配多学科科研发现,在挽救药物研发领域仅需输入主见疾病称呼,系统即可自动筛选疾病重要病理机制、匹配体外实验模子、提议候选药物、完成实验数据分析并迭代更新候选分子
* 以 dAMD 为商量范例,Robin 初度提议 ROCK 扼制剂通过增强 RPE 吞吃功能挽救干性黄斑变性的全新计谋

放哨论文:
https://www.nature.com/articles/s41586-026-10652-y
数据集:隐敝公开文件、生信基准与实验数据
该商量构建了由公开文件数据、通用生物信息学基准数据以及自主实验数据构成的三层数据体系,隐敝文件文本、生物信息学分析任务、细胞检测与转录组测序等多种类型,基本囊括了 AI 药物研发经过中的中枢数据场景。
率先,商量东谈主员整合了 551 篇与 dAMD 有关的中英文科研文件,当作系统进行科学假定生成的常识基础。其中包括 151 篇疾病机制商量,以及 400 篇对于视网膜色素上皮细胞吞吃功能过头疾病干系的商量论文。这部分文件不仅用于疾病机制梳理,也为体外实验模子筛选与老药新用候选药物生成提供表面依据,是 Robin 开展常识挖掘的中枢着手。
其次,商量东谈主员经受通用生物信息学基准数据集 BixBench,对系统的数据分析能力进行量化评测。商量从中筛选出 170 谈与药物研发有关的测试题,涵盖转录组分析、基因组学、功能富集分析、序列分析以及统计检修等多种任务类型。悉数试题均配套轨范化数据包、轨范谜底与过问项,可用于系统评估智能体在着实生信场景中的适配能力与厚实性。
此外,商量东谈主员还构建了自主实验数据集,为模子迭代与实验考证提供着实因循。数据包括 ARPE-19 细胞与东谈主原代视网膜色素上皮干细胞的流式细胞术检测收尾、多组药物责罚后的 RNA-seq 转录组数据,以及细胞毒性、免疫细胞化学染色、VEGF 酶联免疫吸附实验等收尾。其中,东谈主源细胞样底本自纽约成见成就眼库,均为 60 岁以上、无眼部疾病供体着手的视网膜色素上皮干细胞,从而保证了实验数据的着实性与临床参考价值。
Robin:面向生物医学科学发现的多智能体系统
Robin 基于 Aviary 框架并运行于 Jupyter Notebook 环境中,与传统仅实施单一任务的科研 AI 器具不同,其初度已毕了「科学假定生成—实验分析—收尾反馈—假定迭代」的运动闭环责任流,可半自主完成疾病机制商量、候选药物筛选以及实验数据理解等竣工科研经过。

Robin 系统架构与责任流
系统经受「三智能体」中枢架构,由两个文件智能体与一个数据分析智能体协同构成。
其中,两个文件智能体 Crow 与 Falcon 主要致密文件常识挖掘与科学假定生成,均基于 OpenAI o4-mini 模子运行。Crow 致密疾病有关文件检索、病理机制梳理、实验模子筛选以及候选药物初步挖掘,未必系统整合碎屑化商量并索要重要科学论断;Falcon 则承担深度考证与优化任务,对 Crow 提议的候选有规划进一步分析其药理机制、表面依据与潜在局限,并蜕变文件中的乖张援用,从而裁汰大模子「幻觉」问题。
第三个中枢模块 Finch 则是成心面向生物实验数据的分析智能体。与传统依赖固定分析剧本的器具不同,Finch 经受生成式推理形状,可把柄实验数据特征实时生成并实施 Python 或 R 代码,自相宜完成流式细胞术分析、RNA-seq 各异抒发分析以及基因功能富集等任务。这意味着系统不再局限于预界说分析经过,而未必像商量东谈主员一样动态调节分析计谋。
为了裁汰大模子在数据分析中的当场性,Robin 进一步遐想了「多轨迹分析+共鸣整合」机制。系统可同期启动 8 条零丁的 Finch 分析轨迹,每条轨迹零丁完成代码生成、数据分析与收尾输出,最终再通过元分析形状整合多轨迹论断,2026世界杯押注app官方版从而减少单轮分析波动与参数各异带来的偏差,擢升收尾厚实性。
在评估机制上,Robin 还引入了双层大模子评审体系。系统以 Anthropic 的 Claude 3.7 Sonnet 当作中枢评审模子,并讨好 Google Gemini 2.5 Pro 对王人领域群众偏好,通过两两比较与锦标赛排序形状,对候选机制、实验模子和药物有规划进行层级评估。当待评估有规划较少时经受全量配对,数目较大时则进行当场抽样对比,并诈欺布拉德利—特里—卢斯模子完成权重排序,在保证评估精度的同期已矣筹画资本。
此外,为确保分析过程的可复现性,悉数 Finch 任务均运行于零丁 Docker 容器环境中,并预装竣工的生物信息学器具链。商量团队还通过多轮 Prompt 工程优化与责任流简化,将复杂的原始经过压缩为厚实、易用的 Jupyter 责任流,使系统在科研场景中的可操作性进一步擢升。
Robin 发现利帕舒地尔擢升吞吃能力 1.89 倍
该商量以 dAMD 为中枢应用场景,围绕 Robin 的假定生成能力、数据分析能力、架构有用性以及着实药物研发效能遐想了多组考确认验。
中枢实验聚焦于候选药物筛选与作用机制考证。Robin 率先通过文件分析梳理出 10 项 dAMD 重要致病机制,并将「增强视网膜色素上皮细胞吞吃功能」细目为中枢挽救所在。在首轮筛选中,系统提议 30 种候选药物,商量东谈主员从中及第艾塞那肽、芬戈莫德、Y-27632 等药物开展实验,并以已知有用药物 MFGE8 当作阳性对照。

吞吃实验经过暗意图
随后,Robin 进一步自主提议转录组测序实验有规划,并由 Finch 完成数据分析。收尾发现,Y-27632 未必通过调控肌动卵白骨架、自噬通路以及脂质转运重要基因ABCA1,已毕视网膜色素上皮细胞的转录组重编程,揭示了此前未被明确意志的作用机制。
为了进一步擢升药物筛选的临床有关性,商量随后开展第二轮药物迭代实验。Robin 新增 10 种候选药物,并发现已上市青光眼药物利帕舒地尔的效果优于 Y-27632,可将细胞吞吃能力擢升约 1.89 倍。商量团队随后经受更接近着实生理环境的东谈主原代视网膜色素上皮干细胞进行复筛,收尾再次考证了利帕舒地尔与 Y-27632 的剂量依赖性效果,同期浮现利帕舒地尔不存在彰着细胞毒性,具备较高的临床升沉后劲。

Y-27632 责罚视网膜色素上皮细胞的转录组测序分析
值得扎眼的是,Robin 还荒谬发现日夜节拍调控药物 KL001 相同具备增强吞吃功能的后劲,为 dAMD 挽救提供了全新的商量所在。后续转录组考证进一步确认,利帕舒地尔未必厚实上调 ABCA1 抒发,从而明确了其中枢作用通路。

利帕舒地尔与 KL001 增强视网膜色素上皮细胞吞吃功能
在与通用 AI 科研系统的竞品对比中,商量团队经受换取领导调用 OpenAI Deep Research Agent,其生成的 17 种候选药物均未发扬出吞吃增强活性,也未识别出 ROCK 扼制这一核神思制,进一步突显了 Robin 在生物医学细分场景中的适配上风。
此外,在 BixBench 基准测试中,Finch 智能体合座准确率达到 22.8±1.7%,权贵高于纯大言语模子的 1.6±1.2%。其中,生物统计任务准确率达到 47.9±1.5%,基础流式细胞术分析准确率达到 100%,RNA-seq 分析准确率达到 86%。收尾标明,成心遐想的科研智能体框架未必权贵擢升通用大模子在生物数据分析中的骨子能力,但复杂、多措施生信任务仍存在进一步优化空间。
在效能与资本方面,Robin 相同展现出彰着上风。商量统计浮现,系统单次竣工科研责任流平均资本仅约 10.76 好意思元;同期,Robin 未必在 30 分钟内完成 551 篇文件的整合分析,而换取责任量的东谈主工责罚通常需要跳动 800 小时。合座来看,系统单轮竣工科研经过耗时不及 2 小时,比拟传统东谈主工科研经过,效能擢升约 200 倍。
写在终末
Robin 的道理并不局限于发现了几个潜在候选药物。更繁多的是2026世界杯押注app官方版,它初度展示了东谈主工智能在人命科学中从「援手器具」向「半自主科研系统」演进的可能性。固然,这类系统距离真确道理上的「自主科学家」仍有距离。复杂实验遐想、跨范例生物机制清楚以及收尾可说明性等问题,依然高度依赖领域群众参与。但 Robin 的出现至少说明,AI 仍是不再仅仅匡助科研东谈主员「提高效能」的器具,而正在冉冉具备参与科学发现本人的能力。