谷歌发布“全模态”Gemini Omni,用自然对话革新视频创作

2026/05/20 16:12阅读量 3

谷歌推出全模态模型Gemini Omni,主打通过自然对话交互进行视频创作,意在降低视频制作门槛并改变创作流程。

谷歌宣布推出名为 Gemini Omni 的全模态模型,该模型支持文本、图像、音频等多模态输入输出,并强调用户可通过自然对话指令直接驱动视频创作。这一思路旨在简化视频制作流程,使创作者无需专业工具即可完成创意表达。目前具体功能细节及应用落地尚待进一步披露。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。