谷歌Gemini 3.5 Flash表现不及预期，体验问题波及全系产品

2026/05/27 12:38阅读量 2

谷歌新发布的Gemini 3.5 Flash模型仅速度达标，实际任务成本高昂且输出啰嗦，综合推理与记忆能力较弱。该模型已嵌入绝大多数谷歌产品，导致搜索AI Overview等出现异常。谷歌计划于6月推出定位旗舰的Gemini 3.5 Pro以弥补短板，同时其TPU硬件业务增长强劲，成为公司另一重要叙事。

事件概述

谷歌于近期发布Gemini 3.5 Flash模型，但市场反馈普遍不佳。该模型虽速度快，但在成本、推理能力、记忆准确率等方面存在显著缺陷，且因被嵌入几乎所有谷歌核心产品，其不良用户体验已扩散至搜索、聊天等全产品线。谷歌目前寄希望于尚未发布的Gemini 3.5 Pro来扭转局面，同时其云业务与TPU硬件增长亮眼。

核心信息

成本虚高：尽管单位token价格低于竞品，但完成任务所需对话轮次（平均49轮，约为竞品2倍以上）导致总成本是上一代Gemini 3 Flash的5.5倍，甚至超过GPT-5.5 medium。
输出啰嗦：模型在多步骤任务中Token消耗可达预期三倍，并且谷歌改为基于计算资源的配额规则后，用户无法预估算力消耗。
能力不均衡：Gemini 3.5 Flash在Agent和工具调用类测试中表现头部，但综合推理与长上下文记忆成绩较差。1M token上下文准确率仅26.6%，编程指数得分45.0（低于Gemini 3.1 Pro的56.5）。
产品层面“污染”：Gemini作为谷歌全产品连接层，Flash的缺陷直接导致搜索AI Overview出现异常（如将“disregard”“stop”等普通词汇误判为指令）。目前该任务需等待6月推出的Gemini 3.5 Pro解决。
云与TPU业务强劲：谷歌2026年Q1云收入同比增长63%，未完成订单达4620亿美元。最新发布第八代TPU（训练专用TPU 8t与推理专用TPU 8i），Anthropic等厂商已大规模采购。

值得关注

Gemini 3.5 Pro的最终表现将是谷歌AI业务的关键节点。若Pro表现达标，Flash可被视为过渡策略；若Pro同样不佳，谷歌AI产品线将面临全面危机。
TPU硬件业务正成为谷歌新的增长叙事，即便基座模型表现欠佳，其云计算硬件基础设施仍能吸引Anthropic等外部大客户。

阅读原文详情

事件概述

核心信息

值得关注

准备好启动您的定制项目了吗？