Chance AI:视觉智能体挑战对话范式,MMMU-Pro 评测全球第一

2026/04/10 09:06阅读量 25

成立于2025年的初创公司Chance AI推出Visual Agent(视觉智能体),试图以摄像头为核心交互入口,让AI从“回答问题”进化为“看懂世界”。其产品在权威多模态基准MMMU-Pro中取得86.07分,位居世界第一,并已在Art Central等场景实现实时视觉交互。创始人曾熙拥有字节、OPPO及一加背景,计划未来深入北美学生群体,并探索软硬一体的商业路径。

事件概述

Chance AI 是一家成立于 2025 年的早期项目公司,由前字节跳动 Flow 部门、OPPO 及 OnePlus 产品负责人曾熙创立。该公司致力于解决主流 AI 依赖文本输入框的交互局限,提出以“视觉”为核心的认知路径,通过 Visual Agent(视觉智能体)让用户直接拍摄现实世界,获取实时推理与反馈。

核心技术与产品表现

  • 评测成绩:在衡量多模态模型视觉推理能力的权威基准 MMMU-Pro 中,Chance AI 的 Visual Agent 获得 86.07 分,排名全球第一。
  • Live 模式:刚推出的实时视觉交互系统,整合了知识检索、内容对比、上下文理解及多能力调度,具备实时响应能力,区别于传统的静态识别。
  • 应用场景:涵盖艺术品解读、穿搭分析、卡牌/潮玩版本识别、皮肤状态检测、菜单翻译、植物识别及宠物观察等。目前约 70%-80% 的使用场景由用户自发挖掘,而非团队预设。
  • 行业突破:2026 年 3 月成为 Art Central 官方 AI 合作伙伴,首次将 AI 引入国际大型艺术展会的“观看过程”,观众可实时与 AI 交流艺术品信息。

运营数据与增长策略

  • 用户规模:全球总下载量超 20 万,月活跃用户(MAU)维持在 4 万至 6 万之间。
  • 增长来源:几乎零市场投放,增长完全依赖自然传播,核心用户群体为 25 岁以下的年轻人。
  • 未来规划:2026 年重点目标是在北美学生群体中进行社群化扩张,深入挖掘真实使用场景。

商业模式与硬件战略

  • 变现方向
    2. 硬件授权:向缺乏模型层打磨能力的硬件厂商提供软件授权服务。
  • 硬件路线:创始人坚持“软硬一体”理念,认为未来的随身 AI 硬件应是一颗能包揽所有视觉信息的摄像头。若供应链成熟,公司将亲自切入硬件制造,但核心本质仍是视觉推理能力而非单纯硬件销售。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。