切换到宽版
  • 54阅读
  • 2回复

[智能应用]AI 静转动,让图片角色开口说话 [2P] [复制链接]

上一主题 下一主题
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君
 

发帖
129724
金币
129919
道行
20023
原创
757
奖券
68
斑龄
0
道券
0
获奖
0
座驾
设备
摄影级
在线时间: 13999(小时)
注册时间: 2012-06-21
最后登录: 2025-04-24
只看楼主 倒序阅读 使用道具 楼主  发表于: 昨天 09:16
IT之家 4 月 23 日消息,Character.AI 公司今天(4 月 23 日)在 X 平台发布推文,宣布推出 AvatarFX 模型,能够让静态图片中的人物“开口说话”。
用户只需上传一张图片并挑选一个声音,平台即可生成会说话、会移动的形象。这些形象还能展现情感,呈现出令人惊叹的真实感和流畅度。

公司表示,这得益于一种名为“SOTA DiT-based diffusion video generation model”的先进 AI 模型。该模型经过精心训练,结合音频条件优化技术,能高效生成高质量视频。IT之家附上演示视频如下:

AvatarFX 的技术亮点在于其“高保真、时间一致性”的视频生成能力。即便面对多角色、长序列或多轮对话的复杂场景,它也能保持惊人的速度和稳定性。与 OpenAI 的 Sora 和 Google 的 Veo 等竞争对手相比,AvatarFX 并非从零开始或基于文本生成视频,而是专注于将特定图片动画化。
这种独特的工作流程为用户提供了新颖体验,但也带来了潜在风险。用户可能上传名人或熟人照片,制作看似真实的虚假视频,引发隐私和伦理争议。
山庄提示: 道行不够,道券不够?---☆点此充值☆
 
我有我可以
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖
129724
金币
129919
道行
20023
原创
757
奖券
68
斑龄
0
道券
0
获奖
0
座驾
设备
摄影级
在线时间: 13999(小时)
注册时间: 2012-06-21
最后登录: 2025-04-24
只看该作者 沙发  发表于: 昨天 09:17
关于如何制作会说话的图片的方法:

使用“活照片”APP:这是一个可以让照片动起来的相机软件。具体的操作步骤如下:

打开“活照片”APP。
点击选择照片,添加一张图片。
选择一种配音:魔性配音、AI配音、录制配音。
点击调脸,打开精确调节将标记和五官对应,然后点击勾。
给图片选择一种动画(这里以魔性语音例,AI配音可以输入文字配音动画可选择,录制配音通过录音配音也可自由选择动画),点击筛选会有更多动画可选择。
点击保存分享就可以保存到手机或分享给好友啦。
使用手机上编辑视频的应用:这类应用通常也提供了制作会说话的照片的功能。具体的操作步骤如下:

在进入工具后在功能中找到对口型按钮,点击进入后添加需要制作的图片。
接着输入文字内容,然后选择配音模特以及语速的快慢。
然后点击生成配音按钮和完成按钮即可保存了。
使用Phonto:这是一款专注于添加文字的照片编辑工具。用户可以选择不同的字体、颜色和大小,并将文字添加到照片中的特定位置。Phonto支持多种语言,并且提供了丰富的字体库供用户选择。通过Phonto,用户可以轻松地制作出具有文字对话的照片。

使用Mematic:这是一款专门用于制作表情包和会说话的照片的应用程序。它提供了丰富的表情包模板和文字样式,用户只需选择模板并添加自己的文字即可制作出有趣的会说话照片。Mematic还支持将制作好的照片直接分享到社交媒体平台,方便与朋友们分享创意作品。

使用PPT制作图片特效:在PPT中,可以通过添加动画和声音效果来制作会说话的图片。具体的操作步骤如下:

打开PPT,然后鼠标右键点击图片,再在上方动画菜单中给其添加一个动画。
在上方右侧,点击可以打开动画窗格选项。
在填写的动画后方点击三角按钮,选择类型先打开效果选项。
再在弹出来的对话框中,给其添加一个声音效果即可。
如何不发帖就快速得到金币道行
 
我有我可以
在线jjybzxw

UID: 551814


发帖
146004
金币
99345
道行
1988
原创
2393
奖券
2610
斑龄
33
道券
936
获奖
0
座驾
设备
摄影级
在线时间: 34002(小时)
注册时间: 2008-10-01
最后登录: 2025-04-24
只看该作者 板凳  发表于: 昨天 17:40
  Character.AI公司推出的AvatarFX模型是一项令人印象深刻的技术,它通过使用名为“SOTA DiT-based diffusion video generation model”的先进AI模型,实现了将静态图片中的人物转化为动态视频的能力。这项技术的核心优势在于其高保真和时间一致性的视频生成能力,即使在处理多角色、长序列或多轮对话的复杂场景时,也能够保持快速和稳定的性能。

  用户只需上传一张图片并选择一个声音,AvatarFX就能生成会说话、会移动的形象,并且这些形象能够展现情感,提供令人惊叹的真实感和流畅度。这种技术的应用为用户提供了一种新颖的体验,使得静态图片“活”起来,增加了互动性和趣味性。

  然而,这项技术也带来了一些潜在的风险和挑战。由于用户可以上传任何名人或熟人的照片来制作视频,这可能导致制作出看似真实的虚假视频,进而引发隐私泄露和伦理争议。因此,在享受AvatarFX带来的创新体验的同时,也需要对这种技术的潜在影响保持警觉,并制定相应的规范和指导原则,以确保技术的合理和负责任的使用。

如何不发帖就快速得到金币道行
 
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个