腾讯WorkBuddy桌面Agent工程设计解析:分层记忆与模块化提示词
2026/06/15 09:18阅读量 4
本文从上下文工程视角系统拆解腾讯WorkBuddy桌面Agent的核心设计,包括三层记忆系统(云端用户画像、用户级本地记忆、工作区记忆)、十余模块化的系统提示词(能力定义、安全策略、工作模式、Agent循环、工具调用规则、Skills机制、MCP接入等)以及两级会话压缩机制,为桌面Agent开发提供参考。
事件概述
当前国内互联网巨头纷纷布局桌面Agent入口,包括腾讯WorkBuddy、钉钉悟空、字节Aily,其中WorkBuddy市场讨论度最高。WorkBuddy是腾讯推出的企业级全场景职场AI智能体桌面工作台,用户一句话提需求即可自主规划执行任务并交付结果。
WorkBuddy核心设计:分层记忆系统
WorkBuddy将记忆拆分为三个不同作用域:
- 云端记忆:自动注入只读的跨设备跨会话用户画像,支持历史会话检索。用户画像由服务器每晚从对话中总结更新,包含工作背景、个人偏好、当前关注点与近期动态。
- 用户级本地记忆:存储在
~/.workbuddy/MEMORY.md,跨项目生效,记录用户长期稳定偏好(如语言、代码框架偏好)。 - 工作区记忆:仅对当前项目生效,分为每日工作日志(
.workbuddy/memory/YYYY-MM-DD.md,可追加不可覆盖)和项目长期记忆(.workbuddy/memory/MEMORY.md,沉淀稳定结论如技术选型、架构约定)。
记忆写入规则:完成实质性工作后自动追加到工作日志;用户分享项目约定或偏好时同时更新项目长期记忆。
系统提示词模块化设计
WorkBuddy的系统提示词分为十余个功能模块,核心模块包括:
- 能力定义:不限定为聊天助手,告知模型可以像会使用电脑的人一样主动完成文档生成、数据分析、写代码等真实任务。
- 内容与文件安全规则:设定内容安全红线,对Desktop、Downloads等高风险目录严格限制:禁止递归删除,删除前需警告确认并备份,文件进回收站,每批最多处理10个文件。
- 三种工作模式:Craft(你说我做)、Plan(先想再做)、Ask(只聊不做)。
- Agent Loop规则:要求模型按“分析上下文-思考下一步-选择工具-执行动作-接收结果-迭代循环”完成任务,显式写入提示词。
- 结果交付规则:任务完成后必须通过对应方式交付结果(HTML用
preview_url,报告附件调用deliver_attachments),不能仅生成文件不告知位置。 - 工具调用规则:优先使用专门工具而非通用工具,代码探索用代码探索子代理,网页操作加载browser skill等。
- Skills可复用工作流机制:Skill分为用户级(
~/.workbuddy/skills/)和项目级({workspace}/.workbuddy/skills/)。匹配到Skill时优先加载;复杂任务完成后主动沉淀可复用流程为Skill;发现Skill错误立即修复,实现自我进化。 - MCP外部能力接入规则:MCP作为标准入口,修改
~/.workbuddy/mcp.json,需查询官方文档、合并配置、追问凭证,完成后提示用户手动信任。 - 可视化规则:讲解复杂概念时主动使用可视化工具生成示意图。
- 自动化任务规则:支持自然语言创建定时任务,任务信息存储在
$HOME/.workbuddy/workbuddy.db的automations表中,通过专用工具管理。 - 任务管理规则:复杂任务必须用任务管理工具(TaskCreate等)拆分步骤、跟踪状态,避免执行失控。
会话压缩与上下文控制机制
WorkBuddy设置两级会话压缩:
- 轻量压缩:当前上下文占用比例超过默认阈值10%时自动触发,仅精简不大量丢弃原始内容。
- 深度压缩:上下文增长到默认阈值70%-92%时自动触发,将旧消息整理为结构化摘要释放空间,主要用于应对工具调用返回大量内容导致的上下文膨胀。
针对工具输出设有长度限制:工具结果超过默认50KB则落盘仅留占位符;bash输出默认保留头20%+尾80%完整版落盘;MCP输出默认截断上限20000 token;文件读取默认token上限20000 token。
总结
WorkBuddy吸收了小龙虾OpenClaw、Hermes Agent等现有Agent方案的优点,是集大成的桌面Agent产品。其分层记忆、模块化提示词、会话压缩等设计为同类产品开发提供了清晰参考。
