武当休闲山庄

在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖: 188354

金币: 689971

道行: 20100

原创: 769

奖券: 545

斑龄: 0

道券: 30

获奖: 0

座驾

设备

摄影级

在线时间: 23959(小时)
注册时间: 2012-06-21
最后登录: 2026-06-15

只看楼主倒序阅读楼主发表于: 2025-04-23

IT之家 4 月 23 日消息，Character.AI 公司今天（4 月 23 日）在 X 平台发布推文，宣布推出 AvatarFX 模型，能够让静态图片中的人物“开口说话”。
用户只需上传一张图片并挑选一个声音，平台即可生成会说话、会移动的形象。这些形象还能展现情感，呈现出令人惊叹的真实感和流畅度。

公司表示，这得益于一种名为“SOTA DiT-based diffusion video generation model”的先进 AI 模型。该模型经过精心训练，结合音频条件优化技术，能高效生成高质量视频。IT之家附上演示视频如下：

AvatarFX 的技术亮点在于其“高保真、时间一致性”的视频生成能力。即便面对多角色、长序列或多轮对话的复杂场景，它也能保持惊人的速度和稳定性。与 OpenAI 的 Sora 和 Google 的 Veo 等竞争对手相比，AvatarFX 并非从零开始或基于文本生成视频，而是专注于将特定图片动画化。
这种独特的工作流程为用户提供了新颖体验，但也带来了潜在风险。用户可能上传名人或熟人照片，制作看似真实的虚假视频，引发隐私和伦理争议。

山庄提示：道行不够，道券不够？---☆点此充值☆

我有我可以

在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖: 188354

金币: 689971

道行: 20100

原创: 769

奖券: 545

斑龄: 0

道券: 30

获奖: 0

座驾

设备

摄影级

在线时间: 23959(小时)
注册时间: 2012-06-21
最后登录: 2026-06-15

只看该作者沙发发表于: 2025-04-23

申请VIP---在山庄畅通无阻还送FTP单独下载账号!

关于如何制作会说话的图片的方法：

使用“活照片”APP：这是一个可以让照片动起来的相机软件。具体的操作步骤如下：

打开“活照片”APP。
点击选择照片，添加一张图片。
选择一种配音：魔性配音、AI配音、录制配音。
点击调脸，打开精确调节将标记和五官对应，然后点击勾。
给图片选择一种动画（这里以魔性语音例，AI配音可以输入文字配音动画可选择，录制配音通过录音配音也可自由选择动画），点击筛选会有更多动画可选择。
点击保存分享就可以保存到手机或分享给好友啦。
使用手机上编辑视频的应用：这类应用通常也提供了制作会说话的照片的功能。具体的操作步骤如下：

在进入工具后在功能中找到对口型按钮，点击进入后添加需要制作的图片。
接着输入文字内容，然后选择配音模特以及语速的快慢。
然后点击生成配音按钮和完成按钮即可保存了。
使用Phonto：这是一款专注于添加文字的照片编辑工具。用户可以选择不同的字体、颜色和大小，并将文字添加到照片中的特定位置。Phonto支持多种语言，并且提供了丰富的字体库供用户选择。通过Phonto，用户可以轻松地制作出具有文字对话的照片。

使用Mematic：这是一款专门用于制作表情包和会说话的照片的应用程序。它提供了丰富的表情包模板和文字样式，用户只需选择模板并添加自己的文字即可制作出有趣的会说话照片。Mematic还支持将制作好的照片直接分享到社交媒体平台，方便与朋友们分享创意作品。

使用PPT制作图片特效：在PPT中，可以通过添加动画和声音效果来制作会说话的图片。具体的操作步骤如下：

打开PPT，然后鼠标右键点击图片，再在上方动画菜单中给其添加一个动画。
在上方右侧，点击可以打开动画窗格选项。
在填写的动画后方点击三角按钮，选择类型先打开效果选项。
再在弹出来的对话框中，给其添加一个声音效果即可。

如何不发帖就快速得到金币和道行

我有我可以

在线jjybzxw

UID: 551814

精华: 0
职务: 超级斑竹
级别: 得道成仙

发帖: 257394

金币: 988418

道行: 2006

原创: 2473

奖券: 3665

斑龄: 46

道券: 1615

获奖: 0

座驾

设备

摄影级

在线时间: 53353(小时)
注册时间: 2008-10-01
最后登录: 2026-06-15

只看该作者板凳发表于: 2025-04-23

　　Character.AI公司推出的AvatarFX模型是一项令人印象深刻的技术，它通过使用名为“SOTA DiT-based diffusion video generation model”的先进AI模型，实现了将静态图片中的人物转化为动态视频的能力。这项技术的核心优势在于其高保真和时间一致性的视频生成能力，即使在处理多角色、长序列或多轮对话的复杂场景时，也能够保持快速和稳定的性能。

　　用户只需上传一张图片并选择一个声音，AvatarFX就能生成会说话、会移动的形象，并且这些形象能够展现情感，提供令人惊叹的真实感和流畅度。这种技术的应用为用户提供了一种新颖的体验，使得静态图片“活”起来，增加了互动性和趣味性。

　　然而，这项技术也带来了一些潜在的风险和挑战。由于用户可以上传任何名人或熟人的照片来制作视频，这可能导致制作出看似真实的虚假视频，进而引发隐私泄露和伦理争议。因此，在享受AvatarFX带来的创新体验的同时，也需要对这种技术的潜在影响保持警觉，并制定相应的规范和指导原则，以确保技术的合理和负责任的使用。