ChatGPT的出现及其展现出的强大能力,无疑宣告了强人工智能技术时代的到来,这让所有人感到措手不及。回顾人工智能历史,我们认为,以GPT为代表的新一代大模型具备了五个全新能力,将最终塑造和影响新一代的商业生态。
第一,世界认知。
ChatGPT之所以强大,很大一个原因在于其打破了过往简单的数据对比与匹配方式,通过大模型预训练的方式,把海量语料,如历史书籍、维基百科,以及互联网上的资源信息文本或数据,不断地训练、学习和模拟,最后通过人类反馈学习等方式完成了从学习到知识储备,再到优化与个性化问答的过程。ChatGPT几乎封装了全世界所有的知识,完成了对人类公开知识的整合,抽象出了对这个世界的认知。
从技术角度,ChatGPT理解这个世界是怎么运作的,甚至形成了自己的逻辑推理能力,使得它能够很好地完成通用型任务。进一步讲,如果把这种通用的认知和行业垂直领域的知识做一些融合,通过微调,让其成为行业模型,就能够更加适应于特定行业的一些数据和任务。同时,ChatGPT的学习能力极强,可以用于探索科技前沿,发现新知识,解决人类面临的挑战,如气候变化和治愈癌症等。
第二,开放创意。
ChatGPT具有强大的智能工作能力,不仅能够写诗绘画、写代码、写文案,甚至能独立完成一篇学术论文。它不仅能够帮助搜索和整理信息,还能加以分析,并输出多模态内容和进行开放的艺术创作(包括生成文本、图片和视频的混合交付等),这极大提高了人类获取信息、生成信息和创造信息的能力。如Midjourney和Dall-E在过去一年不断迭代,完全没有绘画经验的人通过输入自然语言提示词,就能完成一幅想象中的作品,甚至可以做到多模态间的相互转化,用一段描述生成图片和视频,等等。可想而知,这对于游戏制作、广告创意、内容产业的插画师、原画师、影视制作的冲击是巨大的。
再比如,过去没有办法写好小说的普通人,在ChatGPT的加持下都有可能完整高效地表达自己,把自己的故事形成一部有意思的作品。总而言之,ChatGPT能够“放大”人类开放创意的能力。
第三,全新的产品交互。
大模型通过基于世界认知的自然语言对话实现了新一代产品交互,有望颠覆以往的电脑、智能手机和搜索引擎成为下一代信息、商品和服务的入口,真正实现自然语言用户界面(LUI, Language as User Interface)。过去四代信息科技的交互界面(DOS系统、Windows鼠标互动、搜索引擎打字、智能手机滑屏)都需要“人适应机器”,而大模型的交互真正做到了“机器适应人”,这个变革有划时代的意义。
语言是人与生俱来的交流方式,人类思维中最复杂的活动过程,也是人类与其他生物的根本区别。以往所有的人工智能交互无法直接理解人类语言,而ChatGPT第一次让算法让机器能够去通过自然语言来适应人的要求。ChatGPT目前已经表现出对人类复杂语言的理解能力,并且能够联系上下文把握关键意思和逻辑,进而执行各种命令、完成多种任务和反馈。
新一代产品交互有可能引起用户需求的入口迁移,从搜索引擎和智能手机转向大模型入口,而在完成入口之争后,必然也会发生生态之争。ChatGPT已经开放了API接口体系“插件Plugin”,如同手机应用商店它可以链接最新信息和服务,有望成为GPT平台并建立自己的生态,从而进一步巩固自身下一代平台入口地位,让更多的用户与信息、商品、服务之间实现自由调用。
过去,浏览器、搜索、应用商店是互联网行业最早形成的三大入口。而以ChatGPT为代表的生成式人工智能集信息获取(信息支持)、智能服务(服务支持)、聊天机器人(情感支持)、创作工具(生产支持)等功能于一体。它就像一个个人助理,不仅可以通过人类自然语言直接交流,而且还能在聊天中提供完整确定的答案以回答任何提示,能够让用户在其平台上完成其最终目的,并赋能人类行动,如搜索、发现、旅行计划、餐厅预订、礼品购物、创作研究等等。
这种产品交互的革命、入口的变化代表着一种范式的迁移,会造就一批新的企业、新的生态,也会冲击线下物理场景中的交互方式。
第四,个性陪伴。
ChatGPT基于Transformer的模型结构,有长期上下文记忆,结合对话机器人这一交互模式,可以衍生许多“个性陪伴”的实际应用,在教育、医疗、客服等专业服务领域会产生深远的影响。比如ChatGPT可以陪伴孩子聊天,辅助孩子个性化学习,未来可能每个人都会有一个AI陪伴他/她长大。ChatGPT还可以化身为虚拟好友,还能定制人格,让人们在孤独、困惑或需要陪伴时,有一个可以倾诉的对象。与传统的聊天机器人不同,ChatGPT具有更高的智能水平和自然语言处理能力,它可以理解人类的情感和需求,并及时作出相应的回应,或者作为朋友、导师,为人提供实用的建议和支持。这些个性陪伴能力未来在个性诊疗、养老看护、教育培训、家庭机器人等领域都有很大的拓展空间。
第五,技术普惠。
ChatGPT是一个自动化的聊天机器人,用户可以随时随地利用它来寻求问题的解答,无需具备任何特殊的技术知识。无门槛,意味着任何人都能够轻松使用它来获得所需的信息。它可以翻译一切,不只是语言的翻译,还可以是视频、图片、语音与文字之间的自由转换,不同计算机编程语言之间的转换,等等。
另外,它可以弥补数字鸿沟,使更多的人获得技术平等的机会,跨越鸿沟。过去,只有通过长期的知识积累、技术培训,懂得技术的人才能使用新产品新服务,而ChatGPT通过提供轻松访问技术知识的途径,尤其对那些不熟悉技术的人,可以帮助他们跨越难关。
此外,ChatGPT可能会作为一个具有公共底座性质的万能模型快速普及,无论是农村地区、发展中国家还是现代化城市,无论是年轻人还是老年人,ChatGPT都能够便捷地为其提供信息服务,助力他们更好地使用现代技术。这些信息服务还可能为用户提供更好的就业机会和经济机遇。未来,随着技术的持续发展,大模型的普及和无门槛使用将会更加重要。
综上所述,以ChatGPT为代表的大模型产品具备了以上五个独特的技术能力,也会衍生出全新的商业生态。我们可以把它们看成一个能够放大人类能力的“放大器”工具,让其帮助我们以更高效的方式完成工作。在可预见的未来,随着大模型的商业化落地与生态的不断演化,模型的成本开始从边际走向固定,大面积进入社会劳动领域是一种必然。随着它的大规模应用,势必会对劳动力市场、教育体系、社会经济,甚至全球劳动分工造成颠覆性改变,对人类行动、思维乃至社会、历史发展等产生重大且不可逆的影响。
ChatGPT的惊艳能力一方面让人们感到兴奋,另一方面也让人们越来越担忧。2023年3月22日,生命未来研究所(Future of Life)向全社会发布了一封《暂停大型人工智能研究》的公开信,呼吁所有人工智能实验室立即暂停比GPT-4更强大的人工智能系统的训练。在他们看来,当下的AI不再风险可控了。只有确定它们的影响是积极的,并且风险是可控的,才能继续开发更强大的人工智能。很快,公开信就引发了舆论的轩然大波。
与此同时,意大利成为全球第一个因隐私考虑,禁用ChatGPT的国家。随后,4月11日,中美两国几乎同时发布了关于AI政策监管的征求意见稿。就连OpenAI CEO(首席执行官)山姆·阿尔特曼(Sam Altman)也发文表示,通用人工智能可能带来严重的滥用、重大事故和社会混乱的风险,希望通过制定一些原则和激励措施来确保它的好处最大化,并控制它的潜在风险。他还于5月18日参加了美国国会听证会,呼吁加强对人工智能的技术监管。
大家为何害怕?他们担忧的是什么?根据我们的观察以及对过去一些关键事实的梳理,可能集中在以下几点:大模型的涌现能力,让人们担忧AI会失控;如何阻止虚假信息传播?如何应对对劳动力市场的冲击?如何保护知识产权、数据安全与隐私?如何解决技术的飞速发展可能会加剧的数字鸿沟、贫富差距等社会问题?