2025年,大模型继续狂飙。我们目睹了AI无处不在,一种深刻的转变也正在发生。
大模型告别了盲目堆砌参数的“大力出奇迹”,转而追求极致性价比;GPT不再一骑绝尘,任何大模型在榜单上的领先优势不超过3个月;行业不再迷信“万能模型”,技术深度渗透后的价值导向植入人心。AI突破数字世界的边界,“伸手”触碰物理世界。
当我们为AI的突飞猛进欢呼时,也需要清醒地审视前路。“AI泡沫”论调甚嚣尘上,真正的技术融合远比想象复杂,从技术突破到产业深耕,其间横亘着数据、可靠性、投资回报等诸多沟壑。
上海人工智能实验室领军科学家欧阳万里日前在接受澎湃科技专访时表示,都说人工智能进入了“下半场”,实际上通用人工智能(AGI)还未到来,未来几年能否到来仍不确定。即使未来一年仍能实现线性增长,这已相当不易,但仍达不到工业场景需求。
短板在于,大模型看不到工业场景的数据,无法理解那些场景数据背后蕴藏的工业逻辑。通专融合能够更好地理解数据,通专融合之下的语言模型能够与科学数据交互对齐,理解并表达DNA和蛋白序列中的信息,支撑人工智能形成自主的科学发现。
数据是模型取得更好效果的基石之一,模型设计同样重要,必须两条腿走路。欧阳万里畅想,“未来可以期待模型学习的新方法,不见得Transfomer就是最好的模式。”
以下是对话实录:
大模型开发齐头并进,工业场景大门难叩开
澎湃科技:如何评价这一年来国内外AI的发展?
欧阳万里(上海人工智能实验室领军科学家):大模型的研发在持续推进,GPT不再一骑绝尘。几家公司循环地说自己是当前世界上最好的模型,这说明大模型开发正处于齐头并进阶段。中国走开源路线,国外走闭源路线,目前来看,国外的闭源模型比中国的开源模型在性能上可能要好。
大家都说人工智能进入了“下半场”,其实AGI还没有到来,未来几年能否到来也还不确定。在这样的情况下,怎么落地到场景中这件事还没有得到彻底解决。即使接下来一年还像过去一年那样实现线性增长,但应该仍然达不到实际应用需求,这是目前存在的问题。
澎湃科技:大模型落地的短板在哪里?
欧阳万里:大模型在一些应用场景已经做得很好了,我们看到了很多案例,在写论文、写稿、文生图、文生视频、文生3D方面已经做得很棒了。大家希望一个语言模型解决几乎任何问题,这个目标目前还没有实现。很多科学工程场景也不是语言模型能解决的,语言模型并不理解DNA序列、气象数据。
大模型看不到那些场景的数据,无法理解那些场景背后的工业逻辑,所以做不好。就像写代码,大模型能写好普通代码,特别擅长深度学习代码,但不是所有代码它都能写好,比如操作系统代码在网上没公开,所以大模型写不好这些专业领域的代码。
澎湃科技:如何解决这个问题?
欧阳万里:需要场景数据。现在用大量数据训练模型解决场景问题,模型的基础能力在逐步上升,但不见得解决了所有场景需求。为了落地场景,大模型需要给大模型提供大量场景数据。
澎湃科技:为什么说国外闭源模型的能力更好?
欧阳万里:通常业界会说,第一名是闭源,第二名就开源。一方面,开源就是别人可以站在你的肩膀上,把自己闭源的技术加进去,得到的模型天然就比开源模型本身好。另一方面,像谷歌这样的公司在数据方面可能也有特殊能力,获得了一些原来大家没有获得的数据,也可能找到了另一条通向Scaling law(尺度定律)的路。
澎湃科技:中美人工智能生态区别在哪?
欧阳万里:海外人工智能大模型比中国更容易挣到钱,这是非常大的区别。国内一方面不那么接受付费服务,另一方面做研究的人在付费海外的模型。
AI产生创新科研想法,推动数据共享是关键
澎湃科技:AI for Science为什么越来越受到重视?
欧阳万里:主要是大家看到AI对于科学研究在降本增效、加速实验、提升创新高度方面的潜力。OpenAI提出要做OpenAI for Science,谷歌开发了很多AI for Science的工具。在提出创新的科研想法方面,我们发现它能够产生一些人类没有想到过的idea,比如我们当时让我们的语言模型阅读2023年或以前的论文,它提出来的idea跟2024年发表在《科学》或《自然》杂志上的idea是相似的。究其原因,一方面,语言模型会产生幻觉,很可能就是因为这些幻觉产生了创新的idea。另一方面,语言模型会学习怎么提出idea,它总结过去的知识,寻找过去的问题,再提出解决这些问题的路线方式。
澎湃科技:你们现在的工作是提升大模型本身能力,还是探索模型的应用?
欧阳万里:两条路都在走。在模型的科学能力方面上海人工智能实验室有了较多进展,它能够以通专融合的方式更好地理解科学数据,语言模型和科学数据能够交互对齐。比如从大量气象数据里找到一些气象现象,并且用语言文字表达出来;能够理解并表达DNA和蛋白序列中的信息。
在模型应用方面,实验室希望人工智能形成自主的科学发现,能够产生自己的科学想法、自己做实验、做验证评估,再重新进行实验迭代。但现在还没有完善的对应工具,我们要去打造这个工具。其次,我们要去解决某一科学问题时,相应的场景数据偏少,各个实验室、科研机构有数据,但实际上很多数据是不公开共享的,中国的数据多,但形成的数据集少,这也是中美AI的一大区别。
澎湃科技:现在有没有什么好方法可以收集数据?
欧阳万里:我们也在推动数据的共享开放。一直在推进,只是中间遇到的难点还挺多,需要政府和研究机构协同推进,科研院校提供的数据要做好验证,证实数据是有用的。
澎湃科技:是否可以说,数据是目前模型能力提升最重要的问题?
欧阳万里:不能这么说。数据是模型取得更好效果的一个基石,除了数据以外,模型设计方面也很重要,要两条腿走路。
澎湃科技:接下来模型范式还会有大变化吗?
欧阳万里:未来可以期待模型学习的新方法,不见得现在的Transfomer就是最好的模式。
澎湃科技:怎么看待AI投资泡沫这件事?
欧阳万里:现在已经没有“百模大战”了,说明对于大语言模型的投资热情是在下降的。但现在AI的投资确实很大,导致支出和收入不成正比,这是目前存在的问题。但为什么现在还有很多厂商愿意投资AI?这要从背后来看,有些投资意图是防守型的,有些是进攻型的。
初创企业都希望用语言模型打出一片市场,这是进攻型的。大厂是防守型的,它并不需要一个模型为它打出一片天,它的市场已经足够大,它只要证明自己能够做得好,所以用户可以来用它的服务。比如谷歌也是防守型的,它希望用户使用Gemini来稳住自己基于搜索销售广告的搜索市场。对谷歌这样的大厂而言,它负担得起AI,但有些企业负担不起就只能退出,不再参与。