声音克隆功能可基于用户提供的音频(通过mp3_url
指定),结合生成的文字内容(text
)以及用户本轮对话输入内容(BOT_USER_INPUT
),利用相关技术克隆出特定的声音,并输出克隆声音后的音频链接等信息。该功能为音频内容创作、个性化语音生成等场景提供了便利,能让生成的语音更具定制化与独特性,满足不同用户对声音风格的需求。
从工作流图可知,流程以 “开始” 节点为起点,输入BOT_USER_INPUT
(用户本轮对话输入内容)、mp3_url
(音频内容链接)和text
(生成的文字内容)。首先,这些输入参数传递至 “voice_clone” 节点,该节点借助获取的api_token
(用于身份验证等),对输入的音频、文字等信息进行处理,执行声音克隆操作。之后,“voice_clone” 节点输出message
(操作相关提示信息)和audio_url
(克隆声音后的音频链接)。最后,“结束” 节点接收这些输出内容,并以返回变量的形式将结果输出,供用户查看与使用。
- 参数准备
- 获取 api_token:访问https://www.51aigc.cc/#/userInfo?user_id=267716,进入个人中心获取
api_token
,该 token 用于后续声音克隆操作的身份验证等。
- 准备 mp3_url:确定要用于声音克隆的音频内容,获取其对应的
mp3_url
链接,确保该链接可正常访问,能获取到音频数据。
- 准备 text:确定需要生成语音的文字内容,将其作为
text
参数,文字内容需清晰明确,以便生成准确的克隆语音。
- 准备 BOT_USER_INPUT:整理好用户本轮对话输入内容,作为
BOT_USER_INPUT
参数,该内容可辅助声音克隆的相关处理。
- 配置工作流
- 在工作流平台的 “开始” 节点,分别填入准备好的
BOT_USER_INPUT
、mp3_url
、text
参数。
- 在 “voice_clone” 节点,填入获取到的
api_token
,并确认其他相关参数(如speaker
、language
等,若有设置需求)已正确配置,确保节点能正常接收和处理输入数据。
- 检查 “开始”“voice_clone”“结束” 等节点的连接,确保数据能在节点间顺畅传递。
- 启动工作流
- 点击工作流界面的 “试运行” 按钮,触发工作流运行。
- 可通过平台提供的日志或运行状态提示,查看工作流的运行进度,如 “声音克隆中” 等状态提示。
- 查看运行结果
- 工作流运行结束后,在 “结束” 节点的输出区域,查看
message
(了解操作是否成功等信息)和audio_url
(克隆声音后的音频链接)。
- 点击
audio_url
,即可访问并播放克隆声音后的音频,验证声音克隆效果,若有需要,可基于该音频开展后续的音频创作等工作。