Rapidflare Agent Harness 四代演化:从简单RAG到精细路由的历程

2026/06/08 16:00阅读量 3

Rapidflare 分享了其 AI agent harness 的四个代际:Spark、Flame、Blaze 和 Forge。文章详细介绍了前两代(2023-2025 年初)的技术演进:Spark 基于单一 RAG pipeline,追求紧凑和低成本但检索泛化不足;Flame 采用 classify-then-route,针对七种查询类型构建专用 pipeline,显著提升准确性但面临对话连续性差、类型扩展成本高等问题。第三、四代(Blaze 和 Forge)仅提及名称和发展方向,未展开。

Rapidflare 自 2023 年末起,共推出了四代 agent harness,内部代号依次为 Spark、Flame、Blaze 和 Forge。每一代都在知识范围、能力集和用户体验上实现阶跃式提升。

第一代:Spark(2023 末 ~ 2024 中)

Spark 是一条简单的检索增强生成(RAG)pipeline,包含四个阶段:Query Rewriter/Enricher(基于对话历史改写、补充缩写和零件号)、Retrieval + Rerank(混合向量+关键词检索,经交叉编码器重排)、Context Formatter(逻辑化组织上下文)、Answer Generator(LLM 生成引用来源的答案)。

优点: 每个回答均严格基于检索段落;成本低、速度快、可预测。
局限: 单一检索 pipeline 无法兼顾规格查询、竞品对比等不同查询的差异;现成的重排器仅能按段落间相关性排序,未与原始查询目标对齐;缺乏应对客户个性化需求的扩展点。

第二代:Flame(2024 中 ~ 2025 初)

Flame 采用 classify-then-route 设计,训练一个查询分类器将问题归入七种领域特有类型,为每种类型构建独立的静态上下文工程 pipeline。每个 pipeline 可定制提示词、检索器、重排器和输出生成器,并与前端 UI 绑定(如对比表格、产品卡片)。

七种路由:

  • products_spec:规格提取与单位归一化
  • products_lookup:按规格参数筛选目录
  • products_comparison:多零件全规格对比并生成差异表
  • products_by_usecase:基于应用场景推理需求并推荐
  • keyword_lookup:术语/词汇匹配与定义
  • general_qa:通用检索增强生成
  • agent_capability:自我描述能力边界

优点: 在技术销售场景(对比、规格搜索、选型)上准确率大幅提升;各 pipeline 独立迭代、互不干扰;UX 可控。
局限: 对话常跨多个类型,但强制分类-路由打断了连续性;增加新查询类型需要新建完整 pipeline,维护负担快速增长。

第三代 Blaze 与第四代 Forge

文中仅指出 Blaze 和 Forge 分别在后续时期推出,其中 Forge 是最新且最强大的 harness,但未提供具体技术细节。全文重点放在前两代的实践经验与教训上。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。