亚马逊云科技王晓野:Token贵的真正原因与Agent落地的五大鸿沟

2026/05/31 18:03阅读量 2

在2026中国AIGC产业峰会上,亚马逊云科技技术总监王晓野指出,87%的企业已宣称大规模部署AI,但真正从中获得生产价值的仅10%。他认为Token成本高企的核心并非单价贵,而是输入了大量无用信息,并剖析了企业级Agent从Demo走向生产需跨越的五层鸿沟:算力、模型、数据与知识、Agent平台、Agent应用。

事件概述

在2026中国AIGC产业峰会上,亚马逊云科技技术总监王晓野从工程视角分享了企业级Agent落地的真实挑战。他提供了一组关键数据:87%的企业宣称已大规模部署AI,但仅10%真正获得了生产价值。他将个人“养龙虾”式实验与企业级部署做了区分——让几千个Agent在分布式环境中安全、可信、稳定运行,是另一个维度的工程复杂度。

核心观点

  • Token贵的真正原因:Token单价并非核心问题,而是调用模型时喂入了太多无关信息(如数千个skills堆砌、未优化的记忆提取),导致Token使用量爆炸。
  • AI不只是大模型:模型之外的Harness(驾驭模型的生产级工程能力)同样关键,包括安全、稳定、权限、观测等。
  • 数据平台需服务AI Agent:传统数据平台面向人类,现在必须满足Agent的调用方式,包括记忆的共享与隔离、生命周期管理、全链路可观测性。

五层架构与产品对应

王晓野提出了企业级Agent落地的五层能力,并介绍了亚马逊云科技对应的产品方案:

  1. 算力层:通过自研芯片(Graviton、Trainium)提供面向场景的最优性价比,而非通用芯片。
  2. 模型层:Amazon Bedrock提供多模型选择,包括中国模型(智谱GLM、MiniMax),并强调企业数据隐私保护。
  3. 数据与知识层:构建AI-ready数据平台,支持向量能力(如S3 Vectors)、开放数据架构(Iceberg、S3 Tables)、记忆生命周期管理。
  4. Agent平台层:Amazon Bedrock AgentCore(Harness)提供Runtime、Memory、Code Interpreter、Identity、Gateway、Policy、Observability等模块,支持开放集成(LangChain、CrewAI)和与OpenAI合作的Managed Agent。
  5. 应用层:Working Agent(如Quick)已在实际工作场景中发挥作用,通过个性化知识图谱打破传统工作边界,并平衡员工便利性与企业管控需求。

值得关注的关键结论

  • 个人与企业养Agent是两码事:个人可随时拔电源重启,企业需考虑自动扩展、安全、可信、不中断。
  • 记忆管理至关重要:Agent的长期记忆若包含错误、老旧或矛盾知识,将影响决策;企业需要实现记忆的共享与隔离并存。
  • 从2028年起,超过15%的企业日常工作决策将由Agent自主完成,数字员工雇佣比例在2026-2028年预计达82%。
  • 亚马逊云科技与OpenAI联合发布的Managed Agent和Codex在Bedrock上可用,为企业提供更直接的前沿模型与最佳实践Harness组合。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。