武当休闲山庄 - 稳定,和谐,人性化的中文社区

查看完整版本: [-- 普通人也能成为音频剪辑师，Meta 推出 AI 模型 Voicebox --]

武当休闲山庄 -> 数码讨论 -> 普通人也能成为音频剪辑师，Meta 推出 AI 模型 Voicebox [打印本页]

登录 -> 注册 -> 回复主题 -> 发表主题

huozm32831

2023-06-17 20:18

Meta 继推出 ImageBind 之后，于今天再次推出了全新的生成式 AI 模型 Voicebox。该模型帮助创作者执行音频编辑、采样和风格化等语音生成任务，即便是普通用户也能轻松上手。

Meta 在介绍 Voicebox 模型时表示，视障人士可以听到好友的回复信息、普通用户可以用自己的语调、语气来说外语。

AI 模型本身可以生成高质量的音频剪辑，消除汽车喇叭等不必要的背景噪音，同时保留音频的内容和风格，同时使用多种语言，以六种语言生成语音。该模型的未来发展包括在元宇宙游戏中为视觉助理或非玩家角色提供自然的声音。

Meta 还比较了 Voicebox 和 Vall-E、YourTTS 等其它音频 AI 模型，表明 Voicebox 更先进，在比较单词错误率和样式相似性时优于两种模型。

查看完整版本: [-- 普通人也能成为音频剪辑师，Meta 推出 AI 模型 Voicebox --] [-- top --]

Powered by www.wdsz.net v8.7.1 Code ©2005-2018www.wdsz.net
Gzip enabled