切换到宽版
  • 46阅读
  • 2回复

[数码讨论]硅谷程序员,疯狂“投喂”中国大模型 [复制链接]

上一主题 下一主题
在线jjybzxw

UID: 551814

 

发帖
234819
金币
801026
道行
2006
原创
2457
奖券
3500
斑龄
44
道券
1548
获奖
0
座驾
设备
摄影级
在线时间: 50035(小时)
注册时间: 2008-10-01
最后登录: 2026-03-17
只看楼主 倒序阅读 楼主  发表于: 03-07
— 本帖被 兵马大元帅 执行提前操作(2026-03-08) —

作者:贾乐乐 ,编辑:赵元

一组来自全球最大AI模型API聚合平台OpenRouter的数据,在国内外都引发了强烈震动。

截至2026年2月28日,该平台内前十模型总Token消耗量已突破28.7万亿,其中,国产模型贡献超过14.69万亿,为历史上首次单月Token调用占比过半,且超越了美国模型。

从周维度看,2月16日至2 2日, 中国模型周调用量达5.16万亿Token,而同期美国模型跌至2.7万亿,中国模型全球占比达61%。调用量排名前五的模型中,中国占据四席——MiniMax M2.5、月之暗面 Kimi K2.5、DeepSeek V3.2和智谱GLM-5。

尽管接下来的一周,中国模型调用量下降,反超的时间很短暂,但能在全球最大的API聚合平台上与美国模型正面交锋并短暂领先,本身已是实力的证明。

此外,OpenRouter平台的用户中,美国开发者占比高达47.17%,而中国开发者仅占6.01%。也有报告显示,80%的美国人工智能初创公司在其产品开发过程中使用了中国的开源模型。

这意味着,推动中国模型登顶的主力军,是那些来自硅谷、来自欧洲的海外开发者,而非国内市场的自嗨。

这是因为大模型从“谁更聪明”的单维比拼,进入到了“谁聪明”“谁省钱”的多维比拼阶段。

一、真香定律:美国开发者爱上中国Token

中国AI模型能够在全球调用量上实现对美国的超越,背后是多重因素叠加形成的系统性优势,而其中直接的驱动力是,便宜。

先看一组数字。

长江证券的研报显示,在输入价格上,MiniMax M2.5和智谱GLM-5都是0.3美元/百万Token,而Anthropic的Claude Opus 4.6是5美元,是中国模型的16.7倍。

输出端更夸张,MiniMax-M2.5 价格为1.1 美元/百万Token,智谱GLM-5 为2.55 美元/百万Token,Claude Opus4.6 则为25 美元/百万Token,分别是前两者的约22.7 倍和9.8 倍。2月底刚出的阿里Qwen 3.5,直接把百万Token价格打到0.8元人民币,相当于谷歌Gemini的十八分之一。

而在大量日常场景里,尤其是伴随着Agent时代的到来,用户对量大便宜算力的需求,压过了对“顶级智商”的需求。

今年2月,开源框架OpenClaw火了,AI从“聊天工具”变成了能自己干活儿的“数字员工”。

一个Agent任务动辄消耗几十万上百万Token,按量付费的API成本瞬间成了开发者的大头开支。月之暗面顺势推出KimiClaw,支持一键部署,结果Kimi K2.5发布20天内的调用量就超过了去年全年,累计收入也超过了2025年总和。

这也是Google和Anthropic封禁那些在订阅制下进行全自动调用的账户,因为订阅费用是有限的,远远覆盖不了全自动调用的算力成本。

当消耗量指数级增长时,单位Token的价格优势,就成了决定生死的竞争力。

这个成本优势不是凭空掉下来的,底层是电力和工程的支撑。

算力的尽头是电力。

中国工业用电比美国低30%到40%,中西部绿电甚至低50%到70%。加上中国工业用电盘子大,可以充分利用谷电训练模型,这构成了中国AI企业的物理成本护城河。

另一头,是被迫卷出来的工程能力。从2024年4月起,中国AI企业就在尖端芯片断供的状态下活着,拿不到最好的卡,就把手里的卡压榨到极限。

中国模型普遍采用混合专家架构,这一技术路线重构了算力消耗逻辑。一个几千亿参数的模型,处理简单问题时只激活其中一小部分“专家网络”,这种“按需激活”的模式,省电省算力。

最后是开源生态的正向循环。

过去一年,中国大模型在全球的Token消耗占比增长了421%。斯坦福的报告说,2024年8月到2025年8月,中国开发者贡献了Hugging Face总下载量的17.1%,略高于美国的15.8%。

开源生态降低了全球开发者的使用门槛,也让中国模型在持续的技术反馈里快速迭代,能力和价格的综合优势在扩大。如硅谷投资人Aditya Agarwal所说:“50%以上的大模型调用通过廉价的开源模型完成,中国模型实际在支持大部分AI应用,美国同行甚至无法替代。”

中国AI模型出海的成功,是技术架构创新+极致成本控制+开源生态+场景适配共同作用的结果,也是系统性优势的集中爆发。

二、 出海模式:从应用到算力、生态

如果说调用量数据解释了中国AI“有多强”,那么接下来需要回答的是:这些Token究竟通过什么路径流向全球?

过去几年,中国AI出海的主流方式是“应用输出”,即,把AI能力封装成APP,送到海外用户手里。字节的Gauthmath、美图的影像产品、快手的KLING AI,走的都是这条路。

到今天,这条路径依然在贡献可观的用户规模和收入。

以Talkie为例,这款情感陪伴类应用覆盖全球200多个国家,在北美Z世代中渗透率持续提升。用户在和AI角色聊天的过程中,每一句话都在消耗Token。这类C端收入占Minimax收入的70%以上,且仍在快速增长中:2026 年 2 月日均 Token 消耗量达到了2025 年 12 月的 6 倍以上。

字节的Gauthmath在美国拍照搜题市场拿下47%的份额,成功替代老牌产品Mathway,也是同样的逻辑。

这类模式不直接按Token向用户收费,而是通过订阅、内购、广告变现。但从底层看,它们消耗的依然是中国算力,是中国AI出海的“用户基本盘”。

如果把AI出海比作一条产业链,应用是下游,算力是上游。中国企业先在下游做产品、做流量,然后向上游走,做底层、做基建。

一方面,通过API管道式输出,直接把算力做成水电煤。

海外开发者通过OpenRouter等聚合平台,调用中国大模型的API,推理在中国本土的数据中心完成,按Token付费。整个过程,算力不出境,电力不出境,只有价值通过Token跨境交付。

这是一种典型的“卖水卖电”生意。开发者不需要自己部署模型,不需要买显卡,就能让应用跑在中国的模型上。

据报道,月之暗面负责API服务的团队近期快速扩编,以独立业务分支形式直接向总裁张予彤汇报。组织层面的调整,足以说明API业务的重要性正在快速上升。

从商业角度看,这类模式的优势在于可规模化、利润率可观,而且随着Agent时代到来,单次任务的Token消耗量指数级增长,API业务的想象空间还在放大。

另一方面,通过构建开源生态,为算力输出修路。

阿里通义千问、DeepSeek系列选择了一条看起来“免费”的路:把模型权重、工具链、工程范式全部开源,海外开发者可以免费下载,在本地服务器上部署。

免费图的是让中国模型进入全球开发者的默认工具箱,成为他们技术栈的一部分。当一个开发者用熟了开源模型,他未来开发商业应用时,自然会优先考虑调用同系列的API。

基于阿里和DeepSeek开源模型的衍生模型上传量,已经超过基于美国主流模型的。这意味着全球开发者正在中国开源模型的基础上,生长出一个庞大的技术生态。生态一旦形成,迁移成本就极高。

可以说,今天的中国AI出海,不再是单一的“应用输出”,而是一个三层结构:底层是开源生态,通过开放换取开发者心智;中间层是API算力输出,直接把Token卖给全球开发者,是商业化的核心引擎;顶层是应用输出,用产品触达终端用户,既是流量入口,也是算力消耗的重要场景。

三层相互支撑,共同说明,中国算力正在成为全球AI的底层基础设施。

三、下半场考验:商业优势遭遇规则壁垒

OpenRouter平台上的数字确实亮眼,但OpenRouter不代表全貌。

消费级市场(开发者、初创公司、Agent应用)的决策链条短,核心指标是性价比+上手快。开发者用哪个模型,往往自己说了算。这个逻辑下,中国模型的“便宜量又足”是绝对优势。

企业级市场不一样。政府、金融、医疗、关键基础设施,决策链条长,涉及合规、安全、审计、供应商稳定性等等。

海外的企业级市场就更复杂了。

所以,有一个问题是绕不开的,即,在国际竞争中,纯商业方面的竞争优势,比如好用、成本低,可能还不够。

比如,此前的英伟达H200被禁止出口。虽然现在已经可以进口英伟达H200,但在AI竞争层面,美国的政策指不定又会出现什么“反复”,而当前推理集群还是离不开英伟达的H100/H200。

当然,封锁具有双面性,一方面会使得训练成本上升,模型迭代速度放缓,另一方面正是这种背景,倒逼工程优化提升效率,国产芯片取得进展。

但风险同样存在。银河证券的研报指出,全球模型迭代周期正在缩短,主流模型更新频率已由半年缩短至数月。如果核心能力提升速度放缓,成本优势可能在高端市场迅速失去吸引力。

大摩首席经济学家邢自强认为,Token出海肯定是有空间的,但不要过度吹捧中国的开源大模型、Token出海借助电力优势,而忽视了地缘政治与安全考量。

他举例称,中国在5G设备领域同样有性价比和技术优势,但从2018、2019年之后,欧美不少电信网络中,中国的5G基站还是被替代了。

在企业级市场,对价格敏感的中小企业可能被中国模型的性价比穿透,但在政府、金融、医疗等涉及数据主权和关键基础设施的领域,准入逻辑从“性价比”转向“合规信任、品牌认知与生态锁定”。

美国正通过投资审查、标准制定、数据主权规则,系统性地构筑企业级市场的准入门槛。

这意味着地缘政治的“天花板”正在降低。

2025年12月,美国政府提出所谓的“硅和平倡议”(Pax Silica),声称要把拥有全球顶尖科技企业或其他优势资源的国家联合起来,以确保“供应链安全”等。

专业人士认为,这是试图用规则、投资与项目清单重塑全球技术分工与资本流向,看起来是走向了重塑生态,实际上是包装下的排他性整合。

这个“他”是谁,不言而喻。

从芯片封锁到“硅和平倡议”,从遏制发展到规则输出,美国的目标是从生态层面重塑游戏规则、掌握话语权。

所以,模型调用量反超,是阶段性的成果,但也是故事的一半。

AI出海的下半场,需要在保持成本优势的同时,面对更多、更复杂的问题,有的问题可以靠提升模型性能、系统效率、竞争力来解决,有的问题没有答案。

山庄提示: 道行不够,道券不够?---☆点此充值☆
 
在线jjybzxw

UID: 551814


发帖
234819
金币
801026
道行
2006
原创
2457
奖券
3500
斑龄
44
道券
1548
获奖
0
座驾
设备
摄影级
在线时间: 50035(小时)
注册时间: 2008-10-01
最后登录: 2026-03-17
只看该作者 沙发  发表于: 03-07
中国AI模型:从调用量反超到全球出海的挑战与机遇
引言
在全球AI竞争的浪潮中,一组来自全球最大AI模型API聚合平台OpenRouter的数据引发了广泛关注。截至2026年2月28日,该平台内前十模型总Token消耗量突破28.7万亿,其中国产模型贡献超14.69万亿,首次单月Token调用占比过半且超越美国模型。尽管中国模型在调用量上取得阶段性成果,但AI出海之路仍充满挑战与变数。
中国AI模型调用量反超美国:系统性优势的爆发
价格优势:直接驱动力
在AI模型竞争中,价格成为中国模型吸引海外开发者的重要因素。长江证券研报显示,在输入价格上,MiniMax M2.5和智谱GLM - 5均为0.3美元/百万Token,而Anthropic的Claude Opus 4.6是5美元,是中国模型的16.7倍;输出端价格差距更大,MiniMax - M2.5价格为1.1美元/百万Token,智谱GLM - 5为2.55美元/百万Token,Claude Opus4.6则为25美元/百万Token,分别是中国模型的约22.7倍和9.8倍。阿里Qwen 3.5更是将百万Token价格打到0.8元人民币,相当于谷歌Gemini的十八分之一。

在Agent时代,一个任务动辄消耗几十万上百万Token,按量付费的API成本成为开发者的重要开支。月之暗面推出KimiClaw支持一键部署后,Kimi K2.5发布20天内的调用量就超过了去年全年,累计收入也超过了2025年总和。这表明在大量日常场景中,用户对量大便宜算力的需求超过了对“顶级智商”的需求,单位Token的价格优势成为决定竞争力的关键因素。
底层支撑:成本护城河
中国AI模型的价格优势并非偶然,而是得益于电力和工程方面的支撑。算力的尽头是电力,中国工业用电比美国低30%到40%,中西部绿电甚至低50%到70%,且工业用电盘子大,可充分利用谷电训练模型,形成了物理成本护城河。

同时,自2024年4月起中国AI企业在尖端芯片断供的状态下生存,被迫提升工程能力。中国模型普遍采用混合专家架构,这种技术路线重构了算力消耗逻辑,一个几千亿参数的模型处理简单问题时只激活其中一小部分“专家网络”,实现了按需激活,节省了电力和算力。
开源生态:正向循环
过去一年,中国大模型在全球的Token消耗占比增长了421%,斯坦福报告显示2024年8月到2025年8月中国开发者贡献了Hugging Face总下载量的17.1%,略高于美国的15.8%。开源生态降低了全球开发者的使用门槛,使中国模型在持续的技术反馈中快速迭代,能力和价格的综合优势不断扩大。硅谷投资人Aditya Agarwal称“50%以上的大模型调用通过廉价的开源模型完成,中国模型实际在支持大部分AI应用,美国同行甚至无法替代”,这体现了中国开源生态的强大影响力。
中国AI出海模式:从应用到算力、生态的三层结构
应用输出:用户基本盘
过去几年,中国AI出海的主流方式是应用输出,即将AI能力封装成APP送到海外用户手中。字节的Gauthmath、美图的影像产品、快手的KLING AI等都是典型代表。以Talkie为例,这款情感陪伴类应用覆盖全球200多个国家,在北美Z世代中渗透率持续提升,用户与AI角色聊天消耗大量Token,这类C端收入占Minimax收入的70%以上且快速增长。字节的Gauthmath在美国拍照搜题市场拿下47%的份额,替代老牌产品Mathway,同样依靠消耗中国算力实现出海。
API算力输出:核心引擎
中国企业通过API管道式输出,将算力做成水电煤。海外开发者通过OpenRouter等聚合平台调用中国大模型的API,推理在中国本土的数据中心完成,按Token付费。月之暗面负责API服务的团队近期快速扩编,以独立业务分支形式直接向总裁张予彤汇报,体现了API业务的重要性上升。随着Agent时代到来,单次任务Token消耗量指数级增长,API业务的想象空间进一步放大,具有可规模化、利润率可观的优势。
开源生态构建:修路搭桥
阿里通义千问、DeepSeek系列选择开源模型权重、工具链和工程范式,让海外开发者免费下载并在本地服务器部署。虽然看似“免费”,但目的是让中国模型进入全球开发者的默认工具箱,成为其技术栈的一部分。当开发者用熟开源模型后,未来开发商业应用时会优先考虑调用同系列的API。目前,基于阿里和DeepSeek开源模型的衍生模型上传量已超过基于美国主流模型的,全球开发者正在中国开源模型基础上生长出庞大的技术生态,迁移成本极高。
中国AI出海下半场:商业优势遭遇规则壁垒
企业级市场的复杂挑战
消费级市场决策链条短,核心指标是性价比和上手快,中国模型的“便宜量又足”具有绝对优势。然而,企业级市场决策链条长,涉及合规、安全、审计、供应商稳定性等多方面因素。海外企业级市场更为复杂,政府、金融、医疗、关键基础设施等领域,准入逻辑从“性价比”转向“合规信任、品牌认知与生态锁定”。
地缘政治的“天花板”降低
美国通过投资审查、标准制定、数据主权规则等手段,系统性构筑企业级市场准入门槛。2025年12月美国政府提出“硅和平倡议”,试图用规则、投资与项目清单重塑全球技术分工与资本流向,本质是包装下的排他性整合,目标是从生态层面重塑游戏规则、掌握话语权。这与中国在5G设备领域的遭遇类似,尽管中国在5G设备领域有性价比和技术优势,但自2018、2019年之后,欧美不少电信网络中中国的5G基站仍被替代。
风险与应对
银河证券研报指出,全球模型迭代周期正在缩短,主流模型更新频率已由半年缩短至数月。如果中国模型因封锁导致训练成本上升、迭代速度放缓,成本优势可能在高端市场迅速失去吸引力。不过,封锁也具有双面性,它会倒逼工程优化提升效率,推动国产芯片取得进展。中国AI出海下半场需要在保持成本优势的同时,应对地缘政治等复杂问题,部分问题可通过提升模型性能、系统效率和竞争力解决,但有些问题尚无明确答案。
结论
中国AI模型在调用量上反超美国是技术架构创新、极致成本控制、开源生态和场景适配共同作用的结果,体现了系统性优势的爆发。中国AI出海形成了从应用到算力、生态的三层结构,中国算力正在成为全球AI的底层基础设施。然而,AI出海下半场面临企业级市场的复杂挑战和地缘政治的规则壁垒,中国AI企业需要在保持成本优势的基础上,积极应对各种问题,不断提升自身竞争力,在全球AI竞争中实现可持续发展。
如何不发帖就快速得到金币道行
 
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖
176097
金币
573810
道行
20030
原创
769
奖券
432
斑龄
0
道券
30
获奖
0
座驾
设备
摄影级
在线时间: 21994(小时)
注册时间: 2012-06-21
最后登录: 2026-03-17
只看该作者 板凳  发表于: 03-07
中国大模型正被硅谷开发者大规模使用,核心原因是性价比碾压+开源生态成熟,已形成“美国创新、中国算力”的全球协作新模式。

🌍 背景:一场静悄悄的“倒戈”
过去几年,全球AI话语权长期由美国主导,但从2025年起,风向开始逆转。越来越多硅谷初创公司和科技巨头不再依赖自家模型,转而采用中国的开源大模型。这种转变并非偶然,而是开发者在真实开发成本压力下的理性选择。

OpenRouter作为全球最大AI模型API聚合平台,其数据显示:
截至2026年2月底,平台前十模型的总Token调用量突破28.7万亿,其中国产模型贡献超14.69万亿,首次单月占比过半1。
更惊人的是,在2月第三周(16日–22日),中国模型周调用量达5.16万亿Token,占全球61%,反超美国模型近一倍2。

指标    中国模型代表    美国模型代表(Claude Opus 4.6)    差距倍数
输入价格(美元/百万Token)    0.3(MiniMax M2.5)    5.0    16.7倍
输出价格(美元/百万Token)    1.1(MiniMax) / 2.55(GLM-5)    25.0    22.7倍 / 9.8倍
最新低价记录    阿里Qwen3.5:0.8元人民币/百万Token    Gemini定价的1/18    ——
(补充说明)Token是衡量AI模型计算消耗的基本单位,一次复杂任务可能消耗数十万甚至上百万Token。当AI从“聊天”转向“干活”(如自动编程、数据分析),成本直接影响产品能否存活1。

⚙️ 原因拆解:为什么是“真香”?
1. 成本优势:便宜不是一点点
美国模型虽强,但价格高昂。以Anthropic的Claude Opus为例,其输出成本是中国主流模型的10–20倍以上。对于需要高频调用的Agent类应用,这笔账根本算不过来。

而阿里Qwen3.5直接将价格打到0.8元/百万Token,相当于谷歌Gemini的十八分之一1。这种极致低价让中小开发者也能负担得起高性能AI服务。

2. 架构创新:混合专家(MoE)省电又高效
中国主流模型普遍采用混合专家架构(Mixture of Experts, MoE),只在处理复杂问题时激活部分参数网络,简单任务则轻量运行。这种“按需激活”模式大幅降低算力与电力消耗,支撑了低价策略3。

3. 开源生态:开发者用代码投票
HuggingFace数据显示,2024年8月至2025年8月,中国开发者贡献了平台17.1%的模型下载量,超过美国的15.8%2。丰富的开源工具链和本地化支持,降低了海外开发者的接入门槛。

更有甚者,Reddit论坛已有用户担忧:“如果中国停止开源模型怎么办?”9,足见其依赖程度之深。

4. 应用反哺:从“养模型”到“养龙虾”
2026年初爆火的开源框架OpenClaw,让AI能像“数字员工”一样自动完成任务,被称为“养龙虾”热潮。这类Agent任务动辄消耗海量Token,开发者自然倾向选择高性价比的中国模型作为底层引擎12。

MiniMax、Kimi、智谱等厂商因此迎来收入狂飙:

MiniMax年度经常性收入(ARR)突破1.5亿美元,2月单月Token消耗量为半年前的6倍以上12。
Kimi K2.5发布不到20天,收入已超2025全年总和

🛠️ 出海路径:不只是APP,更是基础设施
中国AI出海经历了两个阶段:

第一阶段:应用出海
如情感陪伴App Talkie、拍照搜题Gauthmath,通过订阅变现,背后仍消耗中国算力。

第二阶段:算力出海
海外开发者通过OpenRouter等平台直接调用中国模型API,推理在中国数据中心完成,按Token付费。整个过程“算力不出境、电力不出境”,只有价值跨境交付——堪称“卖水卖电”生意3。

如今,Vercel、TogetherAI、Cerebras等美国头部开发平台均已接入Kimi、GLM、Qwen等中国模型API,意味着中国大模型已成为硅谷创新的底层支柱之一8。

✅ 结论:系统性优势正在成型
中国大模型赢得硅谷开发者青睐,并非单一因素所致,而是技术架构 + 极致成本 + 开源生态 + 场景适配共同作用的结果。它们不再是“替代选项”,而是许多场景下的首选基础设施。

这场“投喂”潮的本质,是全球AI开发范式从“闭源垄断”向“开放协作”的演进。而中国凭借快速迭代能力和成本控制,在这一轮变革中占据了有利位置。
如何不发帖就快速得到金币道行
 
我有我可以
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个