VSSFlow:统一视频驱动音效与语音生成

2026/02/06 00:00阅读量 3

一个模型同时做视频配环境音和口型同步语音 打破音效生成与语音合成的割裂 共享音频先验,端到端联合训练更高效

暂无可展示正文

来源:Apple Machine Learning Research
返回列表

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。