谷歌Gemini 3.5 Flash表现不及预期,体验问题波及全系产品
2026/05/27 12:38阅读量 2
谷歌新发布的Gemini 3.5 Flash模型仅速度达标,实际任务成本高昂且输出啰嗦,综合推理与记忆能力较弱。该模型已嵌入绝大多数谷歌产品,导致搜索AI Overview等出现异常。谷歌计划于6月推出定位旗舰的Gemini 3.5 Pro以弥补短板,同时其TPU硬件业务增长强劲,成为公司另一重要叙事。
事件概述
谷歌于近期发布Gemini 3.5 Flash模型,但市场反馈普遍不佳。该模型虽速度快,但在成本、推理能力、记忆准确率等方面存在显著缺陷,且因被嵌入几乎所有谷歌核心产品,其不良用户体验已扩散至搜索、聊天等全产品线。谷歌目前寄希望于尚未发布的Gemini 3.5 Pro来扭转局面,同时其云业务与TPU硬件增长亮眼。
核心信息
- 成本虚高:尽管单位token价格低于竞品,但完成任务所需对话轮次(平均49轮,约为竞品2倍以上)导致总成本是上一代Gemini 3 Flash的5.5倍,甚至超过GPT-5.5 medium。
- 输出啰嗦:模型在多步骤任务中Token消耗可达预期三倍,并且谷歌改为基于计算资源的配额规则后,用户无法预估算力消耗。
- 能力不均衡:Gemini 3.5 Flash在Agent和工具调用类测试中表现头部,但综合推理与长上下文记忆成绩较差。1M token上下文准确率仅26.6%,编程指数得分45.0(低于Gemini 3.1 Pro的56.5)。
- 产品层面“污染”:Gemini作为谷歌全产品连接层,Flash的缺陷直接导致搜索AI Overview出现异常(如将“disregard”“stop”等普通词汇误判为指令)。目前该任务需等待6月推出的Gemini 3.5 Pro解决。
- 云与TPU业务强劲:谷歌2026年Q1云收入同比增长63%,未完成订单达4620亿美元。最新发布第八代TPU(训练专用TPU 8t与推理专用TPU 8i),Anthropic等厂商已大规模采购。
值得关注
- Gemini 3.5 Pro的最终表现将是谷歌AI业务的关键节点。若Pro表现达标,Flash可被视为过渡策略;若Pro同样不佳,谷歌AI产品线将面临全面危机。
- TPU硬件业务正成为谷歌新的增长叙事,即便基座模型表现欠佳,其云计算硬件基础设施仍能吸引Anthropic等外部大客户。
