Google DeepMind 为 Gemini 3.5 Flash 引入计算机操作能力

2026/06/25 00:30阅读量 3

Google DeepMind 宣布在 Gemini 3.5 Flash 模型中新增计算机使用功能，意味着模型可直接操控计算机界面执行任务，但具体技术细节尚未披露。

Google DeepMind 官方宣布，其最新推出的 Gemini 3.5 Flash 模型已集成“计算机使用（computer use）”能力。该功能允许模型像人类一样操作计算机界面（例如移动鼠标、点击按钮、输入文本等），从而直接完成需要人机交互的复杂任务。目前关于该功能的具体实现方式、支持的操作系统范围及调用限制等信息尚未公布。此举标志着多模态 AI 从“理解内容”向“主动执行操作”的进一步延伸。