切换到宽版

统计排行

★金币如何兑换成道行★

申请山庄VIP享受视觉大餐！

如何不发帖就快速得到金币和道行

道券兑换,奖券兑换,勋章购买

1387阅读
0回复

[智能应用]普通人也能成为音频剪辑师，Meta 推出 AI 模型 Voicebox [复制链接]

上一主题下一主题查看指定楼层

查看指定楼层

在线huozm32831

UID: 329002

精华: 1097
职务: 超级斑竹
级别: 玉清道君

发帖: 116552

金币: 6524

道行: 19524

原创: 29523

奖券: 18205

斑龄: 202

道券: 10562

获奖: 0

座驾

设备: EOS—7D

摄影级: 专家级认证

在线时间: 24900(小时)
注册时间: 2007-11-29
最后登录: 2025-12-13

只看楼主倒序阅读使用道具楼主发表于: 2023-06-17

Meta 继推出 ImageBind 之后，于今天再次推出了全新的生成式 AI 模型 Voicebox。该模型帮助创作者执行音频编辑、采样和风格化等语音生成任务，即便是普通用户也能轻松上手。

Meta 在介绍 Voicebox 模型时表示，视障人士可以听到好友的回复信息、普通用户可以用自己的语调、语气来说外语。

AI 模型本身可以生成高质量的音频剪辑，消除汽车喇叭等不必要的背景噪音，同时保留音频的内容和风格，同时使用多种语言，以六种语言生成语音。该模型的未来发展包括在元宇宙游戏中为视觉助理或非玩家角色提供自然的声音。

Meta 还比较了 Voicebox 和 Vall-E、YourTTS 等其它音频 AI 模型，表明 Voicebox 更先进，在比较单词错误率和样式相似性时优于两种模型。

山庄提示：道行不够，道券不够？---☆点此充值☆

分享到 淘江湖新浪 QQ微博 QQ空间开心人人豆瓣网易微博百度鲜果白社会飞信