Databricks 将 GPT-5.5 引入企业级智能体工作流,OfficeQA Pro 准确率突破 50%

2026/05/15 08:00阅读量 2

OpenAI 与 Databricks 合作,将 GPT-5.5 模型集成到企业智能体工作流中。该模型在 Databricks 的复杂企业文档基准测试 OfficeQA Pro 上达到当前最优水平,准确率首次超过 50%,相较 GPT-5.4 错误率降低 46%。主要提升体现在对扫描 PDF、老旧文档的解析能力和多步骤任务编排效率。

事件概述

Databricks 已将 OpenAI 的 GPT-5.5 模型集成到其企业智能体工作流中。模型在其自研的 OfficeQA Pro 基准上取得了当前最优(SOTA)成绩,这是首个准确率突破 50% 的模型。

核心信息

  • 基准测试表现:OfficeQA Pro 评估模型在处理扫描 PDF、遗留文件、长上下文文档等工作流时的解析、检索和基于事实的推理能力。在智能体测试环境下,GPT-5.5 相比 GPT-5.4 错误率下降 46%,准确率达到 50% 以上。
  • 关键改进点
    • 解析能力大幅提升:对老旧文档和扫描 PDF 的数字提取错误显著减少。Databricks 研究工程师 Arnav Singhvi 表示,GPT-5.5 在解析这类文档上实现了“阶梯式跃升”。
    • 任务编排更高效:GPT-5.5 减少了不必要的搜索绕路,能够更可靠地检索相关上下文并完成复杂工作流,无需额外监督。
  • 部署方式:Databricks 通过 AI Unity Gateway 提供 GPT-5.5,客户可在 AgentBricks 和 Agent Supervisor API 构建的工作流中使用该模型编排解析、检索和专用智能体的执行。

值得关注

GPT-5.5 在处理企业级非结构化文档(如扫描件、遗留格式)方面的显著提升,可能加速智能体在合规、审计、知识管理等场景的落地。其“阶梯式”进步表明模型在面向实际生产环境的数据提取与推理上取得了实质性突破。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。