无问芯穹发布InfiniClaw Box:实现全模态数据本地脱敏与端云协同推理
2026/04/10 19:18阅读量 2
无问芯穹推出InfiniClaw Box,首创“本地脱敏 - 云端处理 - 本地回填”的三段式架构,解决多模态数据隐私上云风险。该设备支持文本、语音、视频等全模态数据的本地安全脱敏,确保原始敏感信息不出域,同时调用云端大模型完成复杂推理。产品通过算子优化在国产端侧芯片上实现显著性能提升,并开放生态接口以适配多种硬件场景。
事件概述
无问芯穹正式发布 InfiniClaw Box,旨在解决 OpenClaw(类人形智能体)及通用 AI 应用在端侧落地时的隐私安全与算力瓶颈问题。该产品主打“全模态安全脱敏”与“端云一体”能力,实现了数据不出盒的前提下享受云端大模型的高阶智能。
核心机制:三段式安全脱敏推理
InfiniClaw Box 独创了“本地脱敏 - 云端处理 - 本地回填”的端到端闭环架构,具体流程如下:
- 智能脱敏阶段:用户输入的文本、图像、音频、视频等多模态数据,首先由本地多模态大模型进行语义特征提取,结合预定义的安全知识库与模板,自动识别并替换姓名、身份证号、财务数据等敏感信息,生成脱敏后的通用请求。
- 云端处理阶段:完全脱敏的请求被发送至无问芯穹大模型服务平台,低成本调用 GLM-5、Kimi-K2.5、MiniMax-M2.5、Step-3.5 等行业头部大模型进行复杂推理、知识检索或内容生成。此过程中,云端无法接触任何原始隐私数据。
- 本地回填阶段:云端返回的结果在本地进入“隐私重构引擎”,在不泄露隐私的前提下,精准定位并自动回填被替换的敏感信息,确保输出结果的语义完整性与上下文一致性。
技术特性与性能优化
- 全模态适配:突破传统方案仅支持文本的限制,支持家庭摄像头、智能门锁、麦克风等多种信源接入,实现文本、图像、语音、视频的跨模态协同处理。
- 硬件算子优化:针对主流端侧芯片(如 NPU、GPU),通过主控智能体主导的深度算子融合、张量布局寻优及显存复用策略,使 Attention 和 gemm 等核心算子加速 10% 至 40%。
- 生态兼容:已与爱芯元智、AMD、此芯科技等企业合作,支持多样化终端硬件配置,提供标准化开放接口,便于外设即插即用及垂类场景扩展。
应用场景与价值
- 内置专业技能:产品内置 80 余个面向政务处理、投资研报、智慧办公等场景的专业 Skills(技能),降低企业级应用门槛。
- Token 成本优化:依托企业级 Token 工厂,兼顾多专业场景需求与高性价比消耗。
- 安全边界:真正实现了“数据不出盒、能力不打折”,为金融、医疗、政企等对隐私要求极高的行业提供了本地化 AI 解决方案。
