1746阅读
0回复

[智能应用]根据文字生成图像普遍担心人工智能生成的媒体被滥用 [复制链接]

上一主题下一主题查看指定楼层

在线huozm32831

UID: 329002

精华: 1097
职务: 超级斑竹
级别: 玉清道君

发帖: 120650

金币: 7330

道行: 19524

原创: 29758

奖券: 18590

斑龄: 207

道券: 10971

获奖: 0

座驾

设备: EOS—7D

摄影级: 专家级认证

在线时间: 26733(小时)
注册时间: 2007-11-29
最后登录: 2026-05-04

只看楼主倒序阅读楼主发表于: 2021-01-08

— 本帖被兵马大元帅执行加亮操作(2021-03-20) —

总部位于旧金山的研究公司OpenAI开发了一种名叫DALL-E的新系统，该系统可根据简短的文字说明生成图像。OpenAI此前曾开发突破性的人工智能语言生成器GPT-3。

OpenAI在一篇博文中表示，DALL-E一名融合了艺术家萨尔瓦多·达利(Salvador Dalí)和皮克斯(Pixar)电影中的机器人男主角瓦力(Wall-E)这两个名字，DALL-E展示了为“各种概念”生成图像的能力。在其众多示例图片中，有一幅是一把形似鳄梨的扶手椅。

神经网络（一种可以识别模式的机器学习）生成图像并不新鲜。依赖于一对神经网络——一个创建内容，另一个评估该内容与期望的输出内容有多大差距——的生成对抗网络(GANs)，已被用于生成真实的人类、猫、出租屋和零食的图像。

但DALL-E值得一提的是它能够基于文本输入生成图像。该系统基于文本生成系统GPT-3，GPT-3已被用于编写诗歌、新闻文章和文字冒险游戏。

利用由成对的文本和图像组成的训练数据集，DALL-E系统可以根据提示生成新图像。它的作品包括一个穿着芭蕾舞裙遛狗的小萝卜，一个由豪猪组成的立方体。它还展示了用多种艺术风格生成图像的能力。

OpenAI还推出了一款名叫Clip的图像识别系统，与各种主要针对某一种任务的现有系统相比，Clip通用性更高。它是通过网上公开的一对对文本和图像进行训练的。

不过这项技术还需要改进。OpenAI指出，DALL-E目前还不能稳定地数到3以上，碰到多义词（比如glasses）有时会犯迷糊。研究人员还发现，不同措辞的文本说明可能产生不同的结果。

还有更深层次的问题有待解决。OpenAI表示：“我们意识到，涉及生成模型的技术有可能产生重大、广泛的社会影响。”它补充称，未来可能进行的步骤包括研究对专业人士的经济影响、生成结果的偏见以及该技术的长期伦理挑战。

长期以来，人们一直担心人工智能生成的媒体被滥用，例如利用神经网络生成虚假视频、音频和图像，服务于各种不道德的目的——从散布政治谣言到欺诈。

共1条评分，金币+10

兵马大元帅

金币 +10

验证通过，感谢支持

2021-01-23

山庄提示：道行不够，道券不够？---☆点此充值☆

发帖回复

返回列表


	关闭您还没有登录，快捷通道只有在登录后才能使用。立即登录还没有帐号？赶紧注册一个


	关闭选中1篇全选

帖子

[智能应用]根据文字生成图像 普遍担心人工智能生成的媒体被滥用 [复制链接]

[智能应用]根据文字生成图像普遍担心人工智能生成的媒体被滥用 [复制链接]