Google DeepMind 为 Gemini 3.5 Flash 引入计算机操作能力

2026/06/25 00:30阅读量 3

Google DeepMind 宣布在 Gemini 3.5 Flash 模型中新增计算机使用功能,意味着模型可直接操控计算机界面执行任务,但具体技术细节尚未披露。

Google DeepMind 官方宣布,其最新推出的 Gemini 3.5 Flash 模型已集成“计算机使用(computer use)”能力。该功能允许模型像人类一样操作计算机界面(例如移动鼠标、点击按钮、输入文本等),从而直接完成需要人机交互的复杂任务。目前关于该功能的具体实现方式、支持的操作系统范围及调用限制等信息尚未公布。此举标志着多模态 AI 从“理解内容”向“主动执行操作”的进一步延伸。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。