切换到宽版
  • 13阅读
  • 2回复

[智能应用]场景数据短缺,AI落地退回老路? [复制链接]

上一主题 下一主题
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君
 

发帖
165365
金币
471917
道行
20030
原创
766
奖券
350
斑龄
0
道券
30
获奖
0
座驾
设备
摄影级
在线时间: 20248(小时)
注册时间: 2012-06-21
最后登录: 2025-12-29
只看楼主 正序阅读 使用道具 楼主  发表于: 5小时前
2025年,大模型继续狂飙。我们目睹了AI无处不在,一种深刻的转变也正在发生。
大模型告别了盲目堆砌参数的“大力出奇迹”,转而追求极致性价比;GPT不再一骑绝尘,任何大模型在榜单上的领先优势不超过3个月;行业不再迷信“万能模型”,技术深度渗透后的价值导向植入人心。AI突破数字世界的边界,“伸手”触碰物理世界。
当我们为AI的突飞猛进欢呼时,也需要清醒地审视前路。“AI泡沫”论调甚嚣尘上,真正的技术融合远比想象复杂,从技术突破到产业深耕,其间横亘着数据、可靠性、投资回报等诸多沟壑。
上海人工智能实验室领军科学家欧阳万里日前在接受澎湃科技专访时表示,都说人工智能进入了“下半场”,实际上通用人工智能(AGI)还未到来,未来几年能否到来仍不确定。即使未来一年仍能实现线性增长,这已相当不易,但仍达不到工业场景需求。
短板在于,大模型看不到工业场景的数据,无法理解那些场景数据背后蕴藏的工业逻辑。通专融合能够更好地理解数据,通专融合之下的语言模型能够与科学数据交互对齐,理解并表达DNA和蛋白序列中的信息,支撑人工智能形成自主的科学发现。
数据是模型取得更好效果的基石之一,模型设计同样重要,必须两条腿走路。欧阳万里畅想,“未来可以期待模型学习的新方法,不见得Transfomer就是最好的模式。”
以下是对话实录:
大模型开发齐头并进,工业场景大门难叩开
澎湃科技:如何评价这一年来国内外AI的发展?
欧阳万里(上海人工智能实验室领军科学家):大模型的研发在持续推进,GPT不再一骑绝尘。几家公司循环地说自己是当前世界上最好的模型,这说明大模型开发正处于齐头并进阶段。中国走开源路线,国外走闭源路线,目前来看,国外的闭源模型比中国的开源模型在性能上可能要好。
大家都说人工智能进入了“下半场”,其实AGI还没有到来,未来几年能否到来也还不确定。在这样的情况下,怎么落地到场景中这件事还没有得到彻底解决。即使接下来一年还像过去一年那样实现线性增长,但应该仍然达不到实际应用需求,这是目前存在的问题。
澎湃科技:大模型落地的短板在哪里?
欧阳万里:大模型在一些应用场景已经做得很好了,我们看到了很多案例,在写论文、写稿、文生图、文生视频、文生3D方面已经做得很棒了。大家希望一个语言模型解决几乎任何问题,这个目标目前还没有实现。很多科学工程场景也不是语言模型能解决的,语言模型并不理解DNA序列、气象数据。
大模型看不到那些场景的数据,无法理解那些场景背后的工业逻辑,所以做不好。就像写代码,大模型能写好普通代码,特别擅长深度学习代码,但不是所有代码它都能写好,比如操作系统代码在网上没公开,所以大模型写不好这些专业领域的代码。
澎湃科技:如何解决这个问题?
欧阳万里:需要场景数据。现在用大量数据训练模型解决场景问题,模型的基础能力在逐步上升,但不见得解决了所有场景需求。为了落地场景,大模型需要给大模型提供大量场景数据。
澎湃科技:为什么说国外闭源模型的能力更好?
欧阳万里:通常业界会说,第一名是闭源,第二名就开源。一方面,开源就是别人可以站在你的肩膀上,把自己闭源的技术加进去,得到的模型天然就比开源模型本身好。另一方面,像谷歌这样的公司在数据方面可能也有特殊能力,获得了一些原来大家没有获得的数据,也可能找到了另一条通向Scaling law(尺度定律)的路。
澎湃科技:中美人工智能生态区别在哪?
欧阳万里:海外人工智能大模型比中国更容易挣到钱,这是非常大的区别。国内一方面不那么接受付费服务,另一方面做研究的人在付费海外的模型。
AI产生创新科研想法,推动数据共享是关键
澎湃科技:AI for Science为什么越来越受到重视?
欧阳万里:主要是大家看到AI对于科学研究在降本增效、加速实验、提升创新高度方面的潜力。OpenAI提出要做OpenAI for Science,谷歌开发了很多AI for Science的工具。在提出创新的科研想法方面,我们发现它能够产生一些人类没有想到过的idea,比如我们当时让我们的语言模型阅读2023年或以前的论文,它提出来的idea跟2024年发表在《科学》或《自然》杂志上的idea是相似的。究其原因,一方面,语言模型会产生幻觉,很可能就是因为这些幻觉产生了创新的idea。另一方面,语言模型会学习怎么提出idea,它总结过去的知识,寻找过去的问题,再提出解决这些问题的路线方式。
澎湃科技:你们现在的工作是提升大模型本身能力,还是探索模型的应用?
欧阳万里:两条路都在走。在模型的科学能力方面上海人工智能实验室有了较多进展,它能够以通专融合的方式更好地理解科学数据,语言模型和科学数据能够交互对齐。比如从大量气象数据里找到一些气象现象,并且用语言文字表达出来;能够理解并表达DNA和蛋白序列中的信息。
在模型应用方面,实验室希望人工智能形成自主的科学发现,能够产生自己的科学想法、自己做实验、做验证评估,再重新进行实验迭代。但现在还没有完善的对应工具,我们要去打造这个工具。其次,我们要去解决某一科学问题时,相应的场景数据偏少,各个实验室、科研机构有数据,但实际上很多数据是不公开共享的,中国的数据多,但形成的数据集少,这也是中美AI的一大区别。
澎湃科技:现在有没有什么好方法可以收集数据?
欧阳万里:我们也在推动数据的共享开放。一直在推进,只是中间遇到的难点还挺多,需要政府和研究机构协同推进,科研院校提供的数据要做好验证,证实数据是有用的。
澎湃科技:是否可以说,数据是目前模型能力提升最重要的问题?
欧阳万里:不能这么说。数据是模型取得更好效果的一个基石,除了数据以外,模型设计方面也很重要,要两条腿走路。
澎湃科技:接下来模型范式还会有大变化吗?
欧阳万里:未来可以期待模型学习的新方法,不见得现在的Transfomer就是最好的模式。
澎湃科技:怎么看待AI投资泡沫这件事?
欧阳万里:现在已经没有“百模大战”了,说明对于大语言模型的投资热情是在下降的。但现在AI的投资确实很大,导致支出和收入不成正比,这是目前存在的问题。但为什么现在还有很多厂商愿意投资AI?这要从背后来看,有些投资意图是防守型的,有些是进攻型的。
初创企业都希望用语言模型打出一片市场,这是进攻型的。大厂是防守型的,它并不需要一个模型为它打出一片天,它的市场已经足够大,它只要证明自己能够做得好,所以用户可以来用它的服务。比如谷歌也是防守型的,它希望用户使用Gemini来稳住自己基于搜索销售广告的搜索市场。对谷歌这样的大厂而言,它负担得起AI,但有些企业负担不起就只能退出,不再参与。
山庄提示: 道行不够,道券不够?---☆点此充值☆
 
我有我可以
在线jjybzxw

UID: 551814


发帖
214771
金币
633248
道行
2006
原创
2442
奖券
3260
斑龄
41
道券
1197
获奖
0
座驾
设备
摄影级
在线时间: 46837(小时)
注册时间: 2008-10-01
最后登录: 2025-12-29
只看该作者 板凳  发表于: 3小时前
2025年,人工智能正经历一场深刻的结构性转型——从“狂飙突进”的技术炫技时代,迈向“精耕细作”的产业融合新阶段。正如上海人工智能实验室领军科学家欧阳万里所言:  
“都说人工智能进入了‘下半场’,但通用人工智能(AGI)还未到来。”

我们站在一个关键的十字路口:技术的热度仍在攀升,落地的寒意却悄然袭来。以下将结合访谈内容与行业趋势,从多个维度系统剖析当前大模型发展的现状、挑战与未来方向。
🌐 一、格局之变:全球大模型进入“齐头并进”时代
1. 技术领先不再持久
GPT不再一骑绝尘:过去OpenAI凭借GPT系列长期领跑,如今Meta的Llama、Google的Gemini、中国的通义千问、智谱AI等纷纷崛起。
榜首轮换周期缩短至3个月以内:任何模型在排行榜上的统治期都极为短暂,技术创新进入“短兵相接”阶段。

| 模型 | 所属公司 | 路线 | 特点 |
|------|--------|------|------|
| GPT-4o / o1 | OpenAI | 闭源 | 多模态强,生态完善 |
| Gemini Ultra | Google | 闭源 | 科研导向,AI for Science布局深 |
| Llama 3 / 4 | Meta | 开源 | 社区活跃,推动全球微调浪潮 |
| Qwen / GLM | 阿里/智谱 | 半开放 | 中文能力强,本地化部署友好 |

✅ 结论:“万模大战”退潮,“百家争鸣”兴起,竞争焦点从参数规模转向场景适配能力。
2. 中美AI生态差异显著

| 维度 | 美国 | 中国 |
|------|------|-------|
| 商业模式 | 付费订阅成熟(如ChatGPT Plus) | 用户普遍不愿为AI服务买单 |
| 数据获取能力 | 谷歌、微软等拥有独家非公开数据源 | 数据丰富但碎片化,缺乏高质量整合 |
| 研发路径 | 闭源为主,强调商业壁垒 | 开源为主,强调快速迭代和社区共建 |
| 投资动机 | 进攻+防守并重 | 初创企业主攻,大厂跟进防御 |

🔍 欧阳万里指出:“海外AI更容易挣到钱。”这决定了美国企业在持续投入上有更强底气,而中国企业更多依赖政策支持或战略卡位。
⚙️ 二、瓶颈之困:大模型为何难叩开工业之门?

尽管大模型在文本生成、图像创作、代码辅助等领域表现惊艳,但在真正高价值的工业与科研场景中仍举步维艰。
1. 核心短板:看不见的数据 + 不理解的逻辑

| 问题类型 | 具体表现 | 案例说明 |
|----------|----------|-----------|
| 数据不可见 | 工业现场数据未上网、不公开 | 操作系统代码、工厂PLC日志、DNA测序原始数据 |
| 语义难对齐 | 模型无法理解专业术语背后的物理意义 | “温度升高5℃” ≠ 文本模式,“需触发冷却机制” |
| 因果推理弱 | 模型擅长相关性,缺乏因果建模能力 | 能预测故障概率,但说不出“为什么” |
| 可靠性不足 | 存在幻觉,难以用于关键决策 | 医疗诊断、航天控制等容错率极低场景 |

💡 欧阳万里比喻:“就像写代码,大模型能写好普通代码,特别擅长深度学习代码,但不是所有代码它都能写好。”
2. 场景落地的三大鸿沟

| 鸿沟 | 描述 | 后果 |
|------|------|--------|
| 数据鸿沟 | 缺乏标注良好的垂直领域数据集 | 模型泛化能力差,迁移困难 |
| 信任鸿沟 | 决策过程黑箱,结果不可解释 | 工程师不敢用、监管机构难批准 |
| ROI鸿沟 | 投入巨大,回报周期长 | 企业观望,投资难以持续 |

❗ 当前AI支出远超收入,形成“泡沫感”的根源正在于此。
🔬 三、破局之道:通专融合 + AI for Science

面对困局,出路不在更大参数,而在更深融合。欧阳万里提出两个关键方向:
方向一:通专融合(General + Specialized Fusion)
✅ 什么是“通专融合”?
在通用语言模型基础上,注入特定领域的知识结构与数据逻辑。
实现语言模型与科学数据的交互对齐,让AI既能“说话”,也能“思考”。
🎯 应用案例:
| 领域 | 融合方式 | 成果 |
|------|----------|-------|
| 基因组学 | 将DNA序列映射为token,训练生物语言模型 | 可识别启动子、剪接位点,预测蛋白功能 |
| 气象科学 | 输入卫星遥感+地面观测数据,输出自然语言报告 | 自动生成台风路径分析、极端天气预警 |
| 材料科学 | 嵌入晶体结构数据库,构建“材料Transformer” | 预测新材料导电性、稳定性 |

🌟 上海人工智能实验室已实现:  
“让语言模型阅读论文后提出的科研想法,与2024年《Nature》发表的研究高度相似。”
方向二:推动数据共享,打造可信数据集
🔒 当前困境:
中国虽有海量数据,但“数据多、数据集少”
各科研院所“各自为政”,数据孤岛严重
缺乏统一标准、质量验证机制
✅ 解决路径:
| 措施 | 目标 |
|------|------|
| 政府主导建立国家级AI数据平台 | 如“中国科学数据银行” |
| 设立数据贡献激励机制 | 数据提供者可获算力补贴或署名权 |
| 构建数据溯源与验证体系 | 确保数据真实、可用、可追溯 |

📢 欧阳万里呼吁:“需要政府和研究机构协同推进。”
🧩 四、范式革命:Transformer之后,下一代模型在哪里?

尽管Transformer架构统治了近八年,但它并非终极答案。
🔍 当前局限:
自注意力机制计算复杂度高(O(n²))
对长序列建模效率低
难以模拟真实世界的动态演化过程
🚀 可能的替代路径:

| 新范式 | 特点 | 潜力 |
|--------|------|-------|
| 状态空间模型(SSM) | 如Mamba,线性复杂度处理长序列 | 更适合传感器、语音、基因数据流 |
| 神经微分方程(Neural ODE) | 连续时间建模,适合物理系统 | 可嵌入牛顿定律、热力学方程 |
| 图神经网络+符号推理融合 | 引入因果图、知识图谱 | 提升可解释性和逻辑推理能力 |
| 具身智能(Embodied AI) | 让AI通过机器人“感知—行动”闭环学习 | 真正触达物理世界 |

🗣 欧阳万里展望:“未来可以期待模型学习的新方法,不见得Transformer就是最好的模式。”
💼 五、资本冷思:AI泡沫是否存在?谁在投资?为何投资?
1. 泡沫论的现实依据
| 指标 | 现状 |
|------|------|
| 投资额 | 全球AI投资持续增长(2025年预计超$200B) |
| 收入 | 多数AI公司尚未盈利,商业化缓慢 |
| ROI | 算力成本高昂,客户付费意愿低 → 投入产出失衡 |

⚠️ 表面繁荣下隐藏着结构性风险。
2. 投资动机分化:进攻 vs 防守

| 类型 | 主体 | 动机 | 案例 |
|------|------|------|--------|
| 进攻型投资 | 初创企业 | 打造新产品,抢占市场空白 | 如Anthropic、MiniMax |
| 防守型投资 | 大厂 | 保护现有业务护城河 | Google推Gemini防搜索被颠覆 |

🔐 欧阳万里点明本质:  
“对谷歌这样的大厂而言,它并不需要AI打出一片天,只要证明自己能做就行。”
🧭 六、未来展望:通往AGI的路还有多远?

| 维度 | 判断 |
|------|------|
| 是否已到AGI? | ❌ 否。当前仍是 Narrow AI(窄域AI) |
| 未来一年能否突破? | ❌ 几乎不可能。最多实现“线性增长” |
| 何时可能到来? | ⏳ 至少还需5–10年,且取决于基础理论突破 |
| 关键突破口 | 通专融合 + 自主科学发现 + 物理世界交互 |

✅ 最大希望在于:AI成为科学家的“第六感”  
——不仅能辅助实验,更能提出人类未曾想到的假设,驱动新一轮科技革命。
✅ 总结:AI下半场的核心命题

| 命题 | 内涵 |
|------|------|
| 从“大力出奇迹”到“精细雕琢” | 参数竞赛结束,性价比与场景适配为王 |
| 从“数字世界”走向“物理世界” | 必须打通数据—模型—行动的闭环 |
| 从“通用梦想”回归“专用现实” | 通专融合是必经之路 |
| 从“技术崇拜”转向“价值创造” | 商业可持续才是检验AI成败的标准 |
| 从“单打独斗”走向“协同共建” | 数据共享、工具共建、生态共治 |
🌟 结语引用欧阳万里之言:  
“数据是基石,模型设计同样重要,必须两条腿走路。”

真正的AI革命,不是一场轰动一时的技术烟花秀,而是一场静水流深的基础设施重构工程。  
2025年,我们或许仍未抵达终点,但已经看清了前行的方向。
如何不发帖就快速得到金币道行
 
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖
165365
金币
471917
道行
20030
原创
766
奖券
350
斑龄
0
道券
30
获奖
0
座驾
设备
摄影级
在线时间: 20248(小时)
注册时间: 2012-06-21
最后登录: 2025-12-29
只看该作者 沙发  发表于: 5小时前
场景数据短缺确实是AI落地过程中面临的关键挑战,可能导致AI应用无法真正融入业务流程,甚至退化为传统的技术“插件”,难以实现预期价值。

一、场景数据短缺对AI落地的影响
场景数据(包括企业专属数据源、业务口径、行业知识库等)是AI理解业务逻辑、精准解决问题的基石。若场景数据短缺,AI模型或智能体可能陷入“跑得动但算不准”的困境:

无法理解场景逻辑:例如工业场景中,大模型若看不到工业设备运行数据、生产流程数据等场景数据,就无法理解工业逻辑,难以解决设备故障预测、生产排产等实际问题;
输出通用答案,脱离实际:企业若未将自己的业务规则(如“补差价计入利润调整项”“老客户返现券冲减收入”)、行业黑话(如“前厅提成”“联营扣点”)等场景数据灌入AI,AI可能输出不符合企业实际的通用答案,导致决策误判;
无法融入业务流程:AI若缺乏场景数据支持,难以适配企业的业务流程(如销售-生产-财务-物流的协同链路),无法参与决策与执行,只能作为孤立的工具存在,无法带来真正的效率提升。
二、如何破解场景数据短缺难题,推动AI落地
要解决场景数据短缺问题,需将AI与企业的场景数据深度融合,构建“场景数据-模型能力-业务流程”的闭环:

构建专属场景数据体系:通过接入企业ERP、CRM、WMS等核心业务系统,获取专属数据源;将企业特殊业务规则转化为数据标签(如“加急费不计入成本”),校准业务口径;积累“行业黑话”知识库(如“非标定制费含模具”),让AI理解业务场景的细节;
从单点场景切入,积累数据:企业可从最痛、最易落地的单点场景(如生产部门的设备巡检、人力资源部门的智能招聘)切入,用智能体解决具体问题,在验证价值的同时,积累该场景的 data(如设备运行数据、简历筛选数据),逐步扩展至全流程;

让业务层驱动数据采集:改变传统IT部门主导的模式,让一线业务人员(如销售、生产、运营)成为数据采集的决策者,因为他们最了解业务场景的需求,能精准识别需要采集的场景数据(如客户订单数据、生产备货数据);
模型设计与数据并重:数据是模型取得更好效果的基石,但模型设计同样重要(如多模态模型、智能体架构),需将模型能力与场景数据结合,让模型能理解、处理场景数据,输出符合业务需求的结果。
总结
场景数据短缺并非AI落地的“死胡同”,关键在于企业能否将AI与自身的场景数据深度融合,构建专属的场景数据体系,并从单点场景切入,逐步积累数据、验证价值。只有当AI真正理解场景数据背后的业务逻辑,融入业务流程,才能避免“退回老路”,实现真正的落地价值。
如何不发帖就快速得到金币道行
 
我有我可以
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个