Anthropic与OpenAI同日发力AI4S:巨头竞赛从模型能力转向生态圈地

2026/07/02 10:11阅读量 4

6月30日,Anthropic发布科研智能体工作台Claude Science,OpenAI推出基因组学评测基准GeneBench-Pro,两者均认为AI4S瓶颈在于模型端到端能力不足而非模型强度。Google DeepMind也以AlphaFold等专有资产整合平台加入竞争。三家巨头分别通过工程化工作流、标准定义和基础模型壁垒争夺AI4S基础设施,市场仍处开放竞争期。

6月30日,Anthropic和OpenAI在AI4S赛道几乎同时发布新动作,标志着巨头竞争从模型能力比拼转向生态位与工作流整合。

事件概述

  • Anthropic 推出科研智能体工作台 Claude Science,不依赖新模型,通过整合现有能力辅助科研流程。其技术本质是:通过MCP协议调用外部垂直模型(如scGPT处理单细胞数据、DNABERT解析基因序列等)执行具体计算,Claude自身负责自然语言理解、任务拆解和结果解读。工作台连接60多个科学数据库,预建了基因组学、蛋白质结构和化学等工具包。
  • OpenAI 发布 GeneBench-Pro,一套覆盖基因组学、定量生物学等10个领域的评测基准,包含129道模拟真实科研工作流的题目,评分严格(全部决策正确才算通过)。结果显示,最强模型GPT-5.6 Sol在Max推理设置下通过率仅28.7%,Claude Opus 4.8通过率16.0%。OpenAI将模型能识别问题但不调整行动的现象命名为“notice-act gap”。同时,OpenAI此前已推出专做生物推理微调的模型 GPT-Rosalind,以研究预览版向美国合格企业开放。
  • Google DeepMind 凭借 AlphaFold、AlphaGenome 等专有基础科学模型,与 Gemini for Science 平台整合30多个生命科学数据库,构建模型即平台的生态。

核心信息

为何此时集中入局?

通用大模型在生命科学存在三重结构性短板:难以理解生物原始数据特殊结构;生物学现象无法简单套用文本tokenization规则(如基因表达的随机性);数据中存在大量未知缺失值。科研成本高昂(单道题人工专家费数千美元),且数据合规要求严苛,使得传统堆算力路径难以为继,工程化整合和生态卡位成为突破口。

三巨头打法差异

  • Anthropic(走宽):通过订阅普及化(Pro/Max/Team/Enterprise用户均可使用),并推出3万美元credits资助50个博士后和研究生项目(截止7月15日),培养青年科学家使用习惯。风险在于若模型突破提前到来,可能沦为纯工具组合。
  • OpenAI(走窄):标准公开(GeneBench-Pro允许更多人使用),但模型封闭(GPT-Rosalind需安全审查),通过企业门禁建立门槛。风险在于自封裁判身份可能不被科学界广泛接受。
  • Google DeepMind(走深):靠专有资产(AlphaFold等)构筑壁垒,模型即平台,生态相对封闭但核心能力垄断。

市场现状

头部客户尚未被锁定:制药巨头Novo Nordisk同时出现在Anthropic(Claude Science案例客户)和OpenAI(Rosalind早期合作伙伴)的名单中,说明市场仍处于开放竞争期。

值得关注

AI4S终局不会由单一巨头决定,科学家在数据主权、学术独立性和研究效率之间的取舍将影响最终格局。当前三大玩家均聚焦工程化与生态卡位,而非单纯追求模型参数量提升。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。