huozm32831 |
2022-10-13 11:32 |
毫不夸张,现在无论我们走到哪都很难逃过上面这个声音。虽然其在努力模仿人类的节奏语调,但还是能一耳朵就能听出来正在解说电影的,不是人,而是AI。
输入文案,自动合成语音,AI已成当下短视频批量化生产的标配。而在语音之外,影像亦是AI的主攻方向。
先是AI作画火出圈,抖音平台上,#AI作画的话题播放量达1.7亿次,#AI绘画的播放量更是高达11.8亿次。然后是文本生成视频,AI的内容生成能力再上一个台阶,Meta、Google近日陆续发布了由AI生成的短视频,百家号、TikTok等内容平台同样押注AI,更新相关辅助创作功能。
国庆期间《人民日报》官方账号还专门发布了一条AI绘画版《我的祖国》MV,全网网友喜闻乐见。
从语音到静态画面再到动态影像,至此,AIGC(人工智能生成内容)对短视频完成了全面渗透。
考虑到AI的进化速度,昨天还只会咿呀学语,今天就能凭空生成真实世界并不存在的视频画面,担忧自然随之而来。镜头交给AI,创作者何去何从、平台怎样应对?
AI对短视频的“入侵”,牵扯出一系列值得讨论的问题。
用户爱看,不容小觑的AIGC
截至2022年中,中国短视频用户达到9.62亿,占整体网民的91.5%。在这样一个短视频大盘里,AI生成的内容的群众基础如何?
视频平台上近期兴起的一类内容可以作为参考。
选一首大众熟悉的歌曲,让AI根据歌词生成画面,组合起来便是一支由AI执导的MV。比如《漠河舞厅》《孤勇者》《杀死那个石家庄人》《波西米亚狂想曲》等,都能找到相关的AI作画视频。
而且,此类视频的关注度也相当可观。以B站上《杀死那个石家庄人》相关视频为例,画面由名为“Midjourney”的AI绘画程序所作,9月30日发布,十余天时间其播放量累计达103.4万,点赞量4.4万。
“学了五六年美术,画功不如AI输入词条几十秒就出的画”,在看过视频之后,网友“奶酪”给出评价,“画不完美,可学习能力让人惊叹。”而且,在好奇心的驱使下,奶酪开始在各个平台搜索相关内容。
切换到AI视角,感受算法模型对世界的认知,这其实正是AIGC赢得广泛关注的直接原因。
AI创作的静态画面已然火爆至此,若进一步升级为短视频,对用户的吸引可以想象。
而从静向动,从二维升级三维恰是AIGC发展的大势所在,Meta和Google近期的动作就是风向标,二者先后发布了根据文本生成视频的最新研究成果。
从Google发布的样片来看,AI不仅可以理解文字并生成高清动态影像,如骑马、冲咖啡等,还能在文字故事的基础上以影像呈现一段完整的长镜头,时长可达2分钟以上。
基于AI已经初步具备创作短视频能力的事实,有业内人士评论称,“随着AI对于短视频的‘入侵’与日俱深,短视频平台的内容池里除传统的UGC(专业生产内容)、PGC(用户生产内容)以外,AIGC将占到更多比例,且流量号召力不容小觑。”
Gartner相关报告中也明确指出,预计到2023年,将有20%的内容被生成式AI所创建。2025年,生成性AI所创造的数据将占到所有已生产数据的10%,当下该比例不足1%。
同为创作者,AI与人类同台竞技
在同一条赛道里争夺用户的注意力,AI与创作者之间的竞争关系显现。Meta、Google的AI模型生成视频的消息一出,“抢饭碗”的言论便甚嚣尘上。
事实上,AI与人类之间的爱恨纠缠,并不是新鲜话题。聚焦到内容创作领域,不久前网友刚进行过一次大规模辩论,起因为国外的一场艺术博览会把头奖颁给了AI绘画的作品,引来人类艺术家全体不服。
在深圳经营MCN机构的彭磊,公司运营着多个短视频平台账号,他认为,“对AI的反感可以理解,但是AI来抢饭碗、短视频行业要变天的说法站不住脚。这种非黑即白的认知大概率是错的,之前也有过验证。”
举个例子,在短视频火起来之前,图文媒体时代,AI技术被引入写作,当时市场也一度悲观地预判文字工作者将被取代。事实证明,担心是多余的。
“短视频行业绕不开AI,字幕、配音都是,接下来也会长期共存。大家使用技术目的是提高效率,可有些功能便利的代价就是影响作品整体观感。比如配音,AI永远是在模仿人类,对作品有要求的创作者来说一般是避开AI配音,因为它和真人差距明显,工业化痕迹太重”,彭磊表示。
另一位做影视解说的博主表达了相同观点,“按需使用,AI配音优势在于快速批量复制,以量取胜。真正的优质作品基本不会允许自己精心写的文案以那种机器声线读出来,以质取胜。”
因此,“AI技术在降低内容生产的门槛,放低了下限,上限依然靠的是人类创作者。”
这便是AIGC固有的局限性,AI作画、AI生成视频同样难以绕过。
以AI作画为例,在欣赏了多幅画作之后,奶酪发现,“AI作画初看惊叹,却非常容易造成审美疲劳,看多了感觉每一幅都在重复。”
在专业人士的解释里,之所以会有上述感觉,原因很简单,所有的AI作画都是在人类已经创造的画风、技巧之上通过模型计算得出。而且,机器更多只是表层理解,无法参透深意,就是常说的“没有灵魂”。
所以,当AIGC的新鲜感光环消散,观众的视线焦点回归内容本身,AI作画、AI生成视频将被重新审视。到时再说“抢饭碗”的话题,或许会得到不同的答案。
从辅助创作到原创生成,平台的机遇与挑战
行业新技术的出现,除了直接影响到用户、创作者群体,平台方作为舞台的搭建者,自然也在密切关注。
第一阶段是「助手阶段」,AIGC辅助人类进行内容生产;第二阶段是「协作阶段」,AIGC以虚实并存的虚拟人形态出现,形成人机共生的局面;第三阶段是「原创阶段」,AIGC将独立完成内容创作。
参照李彦宏所讲的AIGC的三个发展阶段,纵观当前内容平台的布局,无论图文还是短视频平台,其服务能力大多停留在第一阶段,即使用AI相关的技术帮助创作者进行更高效率的写作、拍视频。
如抖音官方剪辑软件剪映提供的语音识别转字幕、文字生成语音等,B站官方剪辑软件必剪推出的智能抠图等AI功能。
有业内人士进一步补充,“包括拍短视频时会用到的漫画风、迪士尼风、变老这些特效滤镜,也都和AI技术有结合。不过这些还没有达到独立生成视频的高度,是介于辅助创作和原创生成之间,跟ZAO换脸APP一样,借助生成类网络完成。”
随着AIGC技术发展,内容平台的服务能力将迎来升级。
以创作者的图文转视频需求为例,剪映为此推出“图文成片”功能,输入一段文字,软件智能匹配图片素材、添加字幕、旁白和音乐,自动生成视频。百家号等内容平台也提供了相关的解决方案。
身处创作一线的彭磊认为:“现在的转视频,工作时间上确实可以把一条视频的制作缩短到分钟级,可成片效果并不理想。单纯是从素材库选图、选视频拼凑实现。体验都是一样的鸡肋,经常可以遇到问题就是,本来完整的一句话,中间如果有停顿,系统可能就会根据前后句找来两段完全没关联的素材拼在一起。”
正所谓能用起来的技术才是好技术,现阶段内容平台的服务能力尚存在较大进步空间,AIGC技术的发展正是解决之道。
而另一方面,AIGC的大面积上线,必然会给平台内容生态带来新的管理挑战。
此前,AI技术在短视频领域的滥用已有不少前车之鉴。原因在于AIGC有一个非常显著的特点——以假乱真。
最典型的,市面上有很多开放性的AI换脸工具,创作者使用软件对视频内容进行加工,轻易就能达到移花接木的效果。此前抖音有人疑似使用AI换脸变身俄罗斯美女,吸粉近200万后遭到平台封禁;B站上AI换脸更是创作者鬼畜整活的最常用手段,平台则会在相关视频下方给出警醒提示。
目前最前沿的AI作画、AI生成视频,其无中生有的特性,无疑放大了内容造假的风险。
国外热度颇高的文本绘画程序Stable Diffusion就遇到了这样的麻烦,由于开发者不对生成内容加以审核过滤,用户可以生成各种图片,为欺诈、侵犯他人肖像、盗版抄袭等提供了可乘之机。
对于抖音、快手、B站等平台来说,如何加强对此类视频进行“无害化处理”,显然不比治理AI换脸来得轻松。这就意味着,在将新技术用好之前,平台不可避免会经历一段阵痛期。
AIGC的明天,不止于短视频
有人期待技术为己所用,有人担心被AIGC抢了饭碗,更有甚者预言短视频将要变天......
而在真正爆发之前,一切其实都还是未知数。但可以确定,AIGC对内容领域的渗透还在继续,AIGC产业仍将快速扩张。
如果把AIGC的概念继续放宽,在AI作画、AI生成视频等内容生产之外,业内通常还会把虚拟数字人也视作AIGC的另一核心载体。
鉴于虚拟数字人的极高热度,AIGC的发展空间更加值得肯定。
当前短视频平台上的虚拟人队伍正在不断壮大,形象各异的他们已在短视频创作群体中占据一席之地。数据显示,平台上相关视频的播放总量早已破亿。
而有关虚拟人的另一个客观事实则告诉我们,短视频只是其应用场景之一。VC数千亿的投入,阿里、百度、字节、华为等科技互联网公司共同出手,更大概率上瞄准的是虚拟人在短视频之外的广阔天地。
由点及面,AIGC在向短视频全面渗透,但其未来的应用价值绝不止于此。放眼整个AI领域,AIGC所涵盖的生成性AI技术被认定为AI领域过去10年最有前景的进展。
无可厚非的是,面对前沿技术所代表的未知,大家在期待的同时总是伴有本能的恐惧。
几百年前火车问世,引擎轰鸣驱动人类社会进入高速时代,却也上演了人拉火车的闹剧;几年前5G商用之际,对于5G辐射过大的质疑不绝于耳,现国内三大运营商的5G套餐用户已接近10亿;再到方兴未艾的AIGC,各方不同的态度其实都在情理之中。
作为从业者以及创作者,彭磊对AI生成视频以及AIGC市场持有乐观态度,“最直观的一点,AI生成视频可以从根源上解决创作者的素材困扰。找不到合适素材时,直接程序生成,如果平台放开版权归属,甚至都不用考虑版权纠纷,放在现在的创作环境里是完全不敢想的。” |
|