huozm32831 |
2024-06-18 20:23 |
人工智能擅长很多事情,比如发现数据中的规律,创建逼真的图像,并将数千个单词浓缩成几个段落,但它写出优秀的喜剧剧本和段子吗? 新的研究表明,它可以,但只是在非常有限的范围内。这是一个有趣的发现,暗示了人工智能在一定程度上可以帮助完成创造性工作,但也仅限于一定程度上。 彼得·米罗夫斯基(Piotr Mirowski)是谷歌 DeepMind 的研究人员。在业余时间,他也是一名即兴喜剧演员。他和其他 DeepMind 研究人员研究了在工作中使用人工智能的专业喜剧演员的经历。 他们结合调查和焦点小组,旨在衡量人工智能在不同任务中的有用性。 他们发现,尽管 OpenAI 和谷歌的流行人工智能模型在简单的任务上很有效,比如构建独白或制作粗略的初稿,但它们很难制作出原创、刺激或有趣的内容。 本月早些时候,他们在巴西里约举行的 ACM FAccT 会议上介绍了他们的发现,但为了避免演员们的声誉受到损害,他们没有透露参与者的名字(并非所有喜剧演员都希望观众知道他们使用了人工智能)。 研究人员要求 20 名已经在艺术创作过程中使用人工智能的专业喜剧演员使用大型语言模型,如 ChatGPT 或谷歌 Gemini(或 Bard),来生成他们觉得在喜剧表演情景下很合适的内容。 他们可以用它来帮助创造新的笑话,或者重新打磨现有的喜剧素材。 实验结果好坏参半。虽然喜剧演员们表示,他们在很大程度上喜欢使用人工智能模型来写笑话,但他们对由此产生的素材并未感到特别自豪。
(来源:STEPHANIE ARNETT/MIT TECHNOLOGY REVIEW | ENVATO) 他们中的一些人说,人工智能可以用来在空白的纸上打草稿,帮助他们快速生成一些东西。 一位参与者将其比作“一个刚刚经历头脑风暴的初稿,我知道我必须不断迭代和改进它”。 许多喜剧演员还指出了大型语言模型为喜剧小品(comedy sketch)生成结构的能力,而他们需要负责充实细节。 然而,大型语言模型生成的喜剧素材的质量还有很多不足之处。喜剧演员们认为模型的笑话十分平淡、普通和无聊。一位参与者将其比作“20 世纪 50 年代的游轮喜剧素材,但没有那么种族主义”。 其他人则认为付出的努力与回报不成正比。一位喜剧演员说:“不管我怎么提示,它都只能给出一种非常拘谨的、线性的喜剧策略。” 人工智能无法生成高质量的喜剧素材并不奇怪。OpenAI 和谷歌用来阻止模型产生暴力或种族主义内容的安全过滤器也阻碍了它们生成喜剧中常见的素材,如带有冒犯性或性暗示的笑话和黑色幽默。 因此,大型语言模型只能依赖那些被认为是“更安全的”内容和信息,包括大量文档、书籍、博客文章和其他类型的互联网训练数据。 米罗夫斯基说:“如果你制作的东西对每个人都有广泛的吸引力,它最终会成为没有人喜欢的东西。” 实验还暴露了大型语言模型的偏见。几位参与者发现,模型不会从亚洲女性的角度创作喜剧独白,但可以从白人男性的角度创作。他们认为,这一现象强化了现状,同时也抹杀了少数群体及其观点。 事实上,阻止大型语言模型产生有趣内容的不仅仅是安全护栏和有限的训练数据。 专门研究人工智能和创造力的美国哥伦比亚大学计算机科学研究员图欣·查克拉博蒂(Tuhin Chakrabarty)表示,幽默在很大程度上依赖于令人惊讶和不协调的包袱,这与这些模型的工作方式不一致。 他补充说:“创造性写作需要脑洞大开,而大型语言模型只能模仿它。” 他没有参与这项研究。 他说:“喜剧,或任何一种优秀的作品,都会放长线(埋伏笔),最终目的是回归主题或给观众带来惊喜。大型语言模型很难做到这一点,因为它们只是一次预测一个单词。” “我在自己的研究中做了很多尝试,试图让人工智能变得好玩、令人惊讶、有趣或有创意,但它根本不起作用。”其表示。 科琳·拉文(Colleen Lavin)是一名开发者和喜剧演员,她参与了这项研究。 2023 年,为了在爱丁堡艺穗节上表演一个单口喜剧(stand-up),她训练了一个机器学习模型来识别笑声,并在发现她没有得到足够多的笑声时“质问”她。 虽然她使用生成式人工智能为自己的节目制作宣传材料或检查自己的语法,但她在使用它来生成笑话方面划清了界限。 她说:“我每天的工作充斥着技术,而写作与此无关,它仿佛是神圣而不可侵犯的。为什么我要把我真正喜欢的东西外包给机器?” 查克拉博蒂说,虽然有人工智能辅助的喜剧演员可能工作得更快,但他们的想法不会是原创的,因为他们会受到模型训练数据的限制。 他说:“我认为,人们无论如何都会用这些工具来写剧本和广告。但真正的创意和喜剧写作是基于经验和氛围,而不是算法。” |
|