Anthropic与OpenAI同日发力AI4S：巨头竞赛从模型能力转向生态圈地

2026/07/02 10:11阅读量 4

6月30日，Anthropic发布科研智能体工作台Claude Science，OpenAI推出基因组学评测基准GeneBench-Pro，两者均认为AI4S瓶颈在于模型端到端能力不足而非模型强度。Google DeepMind也以AlphaFold等专有资产整合平台加入竞争。三家巨头分别通过工程化工作流、标准定义和基础模型壁垒争夺AI4S基础设施，市场仍处开放竞争期。

6月30日，Anthropic和OpenAI在AI4S赛道几乎同时发布新动作，标志着巨头竞争从模型能力比拼转向生态位与工作流整合。

事件概述

Anthropic 推出科研智能体工作台 Claude Science，不依赖新模型，通过整合现有能力辅助科研流程。其技术本质是：通过MCP协议调用外部垂直模型（如scGPT处理单细胞数据、DNABERT解析基因序列等）执行具体计算，Claude自身负责自然语言理解、任务拆解和结果解读。工作台连接60多个科学数据库，预建了基因组学、蛋白质结构和化学等工具包。
OpenAI 发布 GeneBench-Pro，一套覆盖基因组学、定量生物学等10个领域的评测基准，包含129道模拟真实科研工作流的题目，评分严格（全部决策正确才算通过）。结果显示，最强模型GPT-5.6 Sol在Max推理设置下通过率仅28.7%，Claude Opus 4.8通过率16.0%。OpenAI将模型能识别问题但不调整行动的现象命名为“notice-act gap”。同时，OpenAI此前已推出专做生物推理微调的模型 GPT-Rosalind，以研究预览版向美国合格企业开放。
Google DeepMind 凭借 AlphaFold、AlphaGenome 等专有基础科学模型，与 Gemini for Science 平台整合30多个生命科学数据库，构建模型即平台的生态。

核心信息

为何此时集中入局？

通用大模型在生命科学存在三重结构性短板：难以理解生物原始数据特殊结构；生物学现象无法简单套用文本tokenization规则（如基因表达的随机性）；数据中存在大量未知缺失值。科研成本高昂（单道题人工专家费数千美元），且数据合规要求严苛，使得传统堆算力路径难以为继，工程化整合和生态卡位成为突破口。

三巨头打法差异

Anthropic（走宽）：通过订阅普及化（Pro/Max/Team/Enterprise用户均可使用），并推出3万美元credits资助50个博士后和研究生项目（截止7月15日），培养青年科学家使用习惯。风险在于若模型突破提前到来，可能沦为纯工具组合。
OpenAI（走窄）：标准公开（GeneBench-Pro允许更多人使用），但模型封闭（GPT-Rosalind需安全审查），通过企业门禁建立门槛。风险在于自封裁判身份可能不被科学界广泛接受。
Google DeepMind（走深）：靠专有资产（AlphaFold等）构筑壁垒，模型即平台，生态相对封闭但核心能力垄断。

市场现状

头部客户尚未被锁定：制药巨头Novo Nordisk同时出现在Anthropic（Claude Science案例客户）和OpenAI（Rosalind早期合作伙伴）的名单中，说明市场仍处于开放竞争期。

值得关注

AI4S终局不会由单一巨头决定，科学家在数据主权、学术独立性和研究效率之间的取舍将影响最终格局。当前三大玩家均聚焦工程化与生态卡位，而非单纯追求模型参数量提升。

阅读原文详情