火猫 AI

谷歌发布“全模态”Gemini Omni，用自然对话革新视频创作

2026/05/20 16:12阅读量 3

谷歌推出全模态模型Gemini Omni，主打通过自然对话交互进行视频创作，意在降低视频制作门槛并改变创作流程。

谷歌宣布推出名为 Gemini Omni 的全模态模型，该模型支持文本、图像、音频等多模态输入输出，并强调用户可通过自然对话指令直接驱动视频创作。这一思路旨在简化视频制作流程，使创作者无需专业工具即可完成创意表达。目前具体功能细节及应用落地尚待进一步披露。

准备好启动您的定制项目了吗？

现在咨询，即可获得免费的业务梳理与技术架构建议方案。