切换到宽版
  • 82阅读
  • 2回复

[数码讨论]不能只算token账 [复制链接]

上一主题 下一主题
在线jjybzxw

UID: 551814

 

发帖
243045
金币
870286
道行
2006
原创
2459
奖券
3580
斑龄
45
道券
1580
获奖
0
座驾
设备
摄影级
在线时间: 51951(小时)
注册时间: 2008-10-01
最后登录: 2026-04-21
只看楼主 倒序阅读 楼主  发表于: 04-08
— 本帖被 兵马大元帅 执行加亮操作(2026-04-18) —

主要内容可以概括为两点。

第一,A社的做法虽然会短期推高使用成本,如果用户继续使用Claude模型,但长期来看会带来很好的工程纪律。

工程纪律的意思是,社区会因为模型成本上升,在开发产品时做更合理的工程优化来提升token的使用效率。

这里她点名批评了龙虾,上下文管理做得很拉胯,一个用户请求会触发多轮工具调用,每次都是携带长上下文的独立API请求。

第二,她呼吁模型厂商不要打价格战,不要靠低价吸引用户入坑后,又用缩水的模型和不稳定的服务去损害体验。

我们前两天写了篇文章,《》,其中提到MiMo Token Plan目前价格相对其他厂商同等套餐偏贵。

罗福莉没有直接承认这点,但间接回答了这个问题:小米的目标是“长期稳定地交付高质量的模型和服务 —— 而不是让你冲动付款,然后弃船。”

我们之前文章里提到,MiMo套餐偏贵的事实其实跟小米给大众的主流印象是有差距的,毕竟观众更熟悉性价比叙事。

但这也不是小米搞AI后就变了,小米这个定价肯定也谈不上赚钱,只是在其他选手亏损搞token倾销的时候,选择了更贴近成本的定价策略。

token倾销这个词可能有点重,因为要是以低于成本售卖AI服务这个标准看,目前行业里基本没谁能逃得过。

但有些玩家定价的确相当激进,低价吸引用户过来后保证不了体验,比如我就遇到过某家套餐服务卡顿甚至不可用的情况。

大模型跟其他传统互联网产品不同。传统互联网产品边际成本可以不计,用户翻倍成本增加很少。大模型产品成本跟用户规模比例扩张。

而且还因为是非标品,厂商很容易在背后做手脚,稍微降点智用户不容易察觉,察觉到也没有实际证据。

当然,即便存在这些一些问题,我仍然认为模型厂商价格战是利大于弊的,是双赢的局面。

用户客观上因为价格战得到了便宜,这是加速新技术采纳的决定性因素。

DeepSeek去年的模型并没有在能力上超过GPT或者Claude,但R1的意义仍然没有被高估,因为把成本降低几十倍对技术普及的促进必然强于某个增量SOTA模型。

至于亏钱卖token不可持续,我只能说不是现阶段二线厂商配考虑的问题。

Anthropic模型能力顶尖,产品体验差异化,所以哪怕经常封号拔网线也一堆用户求着交钱。

彭博上个月报道,Anthropic当时年化收入已经达到200亿美元,相比去年底翻倍还多,这个夸张的增长速度隐隐有取OpenAI而代之的意思了。

但二线厂商之间模型能力并没有拉开差距,不同厂商轮流领先,性价比是不得不走的路子。

罗福莉评价是对的,龙虾就是vibe coding出来的一堆屎山。

因为是屎山,所以它没有架构设计,没有工程优化,天生就浪费效率。

但它能火起来,能让一堆专业的非专业的用户愿意用,就已经算是功德无量了。

所有二线厂商都应该给龙虾磕一个,我很难想象没有龙虾他们得多努力才能证明自己的价值。

这是OpenRouter上不同模型的使用统计。

在龙虾火爆之前,你在这个排行里根本看不到二线模型厂商,除了硅谷御四家,其余全是others。

但现在排行榜前几名,已经被阿里、小米、阶跃星辰的模型占满了。

话说新模型出来,免费放OpenRouter上吸引大家用一用,已经成为国内厂商的惯例。OpenRouter现在已经沦为PR前沿阵地。

这两天阿里发布Qwen3.6,宣传登上OpenRouter排行榜首。小米MiMo之前也宣传登顶了OpenRouter。都是免费试用。

某种程度上说,龙虾耗token甚至可以理解成是feature。

大模型研发门槛很高,但大模型供给一直以来都是不稀缺的,因为用户不需要那么多模型。龙虾把性价比放大成了真正的竞争力。

简单拉下数据。MiniMax去年总收入7900万美元,龙虾爆火后2月ARR已超1.5亿美元。月之暗面发布K2.5模型后,不到20天收入超去年全年,且海外收入首次超过国内。

AI的确在推动各个产业发生变革,不过就AI自身而言,至今为止都还没有跑通独立的盈利模式。OpenAI和Anthropic收入在快速增长,但能否覆盖巨额研发和资本支出仍有疑问。

至于智谱、MiniMax和月之暗面们,距离闭环的商业模式就更为遥远了。

这种情况下,叙事成为生存的要义。叙事不能只靠画饼,模型厂商的第一性原理就是模型得有人用。

没人用,叙事就崩塌了。有人用,越来越多人用,叙事才会变得圆满。

去年底,月之暗面估值43亿美元,现在正以180亿美元寻求融资,翻了四倍不止。智谱今天收盘780港币,是1月份IPO发行价116港币的6.7倍。MiniMax的IPO发行价是165港币,现在股价是950,也是翻了快6倍。

不能只算token账。

02

二线模型厂商在成本和规模压力下,已经有提价动作。但这暂时不会达到摆脱价格战的地步。

小米的处境比较特殊,它有自己完整的产品矩阵和硬件生态,MiMo的第一使命是融入并改造这个现有生态。哪怕不对外卖token,小爱同学、智能手机、小米汽车、IoT设备生态,MiMo都能有大有作为的空间。

智谱、MiniMax、月之暗面们则处在另一个处境。它们有C端产品,但这个赛道竞争极其惨烈。目前看来独立的AI产品,无论是通用助手,还是细分赛道,字节、腾讯和阿里都有碾压性的优势,也有争夺的意志。

相较之下,API卖token的生意看起来好一些,虽然好得有限。因为这只关乎模型质量,而腾讯和Meta的经验表明,模型研发不只是钱和资源的因素。

但龙虾窗口期不会无限延续。

如果龙虾只是一阵风,过段时间随风而逝,那自然二线厂商也就不能指望这个出货渠道了。

如果龙虾代表的不是一个工具的短暂流行,而是C端AI产品的一种范式,那大科技公司一定会出手。

这些公司有流量、有分发、有用户信任,它们会以自己的竞品收割市场,并且会优先使用自己训练的模型,而不是采购二线厂商的API。

模型跟产品的结合是大趋势。阿里打通千问App跟通义模型研发团队,搞出了组织调整和人事出走风波。姚顺雨入职腾讯,也是首先做团队整合,不同研发部门之间的整合以及研发跟产品的整合。

罗福莉批评龙虾耗token,提到Claude Code更节省上下文的工程设计,这是另一个产品需要跟模型打通的案例。

龙虾架构上的天然缺陷,意味着每次工具调用都携带完整的长上下文发起独立请求,用户的一个操作可能在后台触发十几轮API调用。这不仅烧token,也制造延迟,制造不稳定。

Claude Code对上下文做精细管理,知道什么时候该压缩历史,什么时候该截断,怎么在保留任务状态的同时减少冗余信息的传递。

这背后是Anthropic对自己模型能力边界的深刻理解。只有模型研发者,才能把产品和模型调优成浑然一体的东西。

AI产品的第一代范式是,模型作为通用API,产品套在外面。这个范式催生了龙虾,也催生了无数套壳应用。它降低了创业门槛,但也带来了巨大的效率浪费。产品不理解模型,模型不适配产品,两边都在用蛮力弥补彼此的信息差。

如今第二代范式正在浮现:模型与产品深度整合,从架构层面共同设计。Claude Code是一个样本:模型不再是被调用的服务,而是产品本身的一部分。

这个趋势下,纯粹的模型API厂商面临的压力会越来越大,没有产品可能成为它们的致命缺陷。如果竞争力来自模型与应用层的深度整合,那API层的价格竞争就是一场慢性消耗。

行业一直喜欢说模型即产品,用这句话强调模型的基础作用和重要性没问题。但除非你的商业模式是只卖API,否则模型始终是产品的组成部分,而不是产品的全部。

山庄提示: 道行不够,道券不够?---☆点此充值☆
 
在线jjybzxw

UID: 551814


发帖
243045
金币
870286
道行
2006
原创
2459
奖券
3580
斑龄
45
道券
1580
获奖
0
座驾
设备
摄影级
在线时间: 51951(小时)
注册时间: 2008-10-01
最后登录: 2026-04-21
只看该作者 沙发  发表于: 04-08
这是当前大模型行业非常鲜活的行业观察,梳理下来核心观点和行业现状可以总结为:
一、行业对定价与价格战的分歧
1. Anthropic与小米的立场
A社涨价推高Claude短期使用成本,但被认为会倒逼行业做工程优化、提升token使用效率,小米罗福莉也借此批评Cursor(文中称“龙虾”)的架构缺陷:无合理上下文管理,单用户请求触发多轮带全量长上下文的独立API调用,极度浪费token。
针对此前曝出的小米MiMo Token套餐定价高于同行的争议,罗福莉间接回应:小米的目标是长期稳定交付高质量服务,而非低价获客后降配损害体验;小米这个定价贴近成本,并非故意卖贵,也不赚钱,只是没有跟风行业的token倾销。

2. 对价格战的辩证判断
当前大模型行业几乎所有厂商都在以低于成本卖token,属于普遍的token倾销;而且大模型和传统互联网产品不同,成本随用户规模同比例扩张,同时非标属性让厂商可以偷偷降配降智,用户很难察觉。
但本文仍认为现阶段二线厂商打价格战利大于弊:低价客观上让用户获利,是加速AI技术普及的核心动力——比如DeepSeek R1哪怕能力没有超越头部模型,但把成本降几十倍对行业的贡献,比增量式的SOTA模型更大。
对二线厂商来说,头部厂商Anthropic、OpenAI已经靠顶尖能力建立了壁垒,而二线厂商模型能力差距极小,性价比是不得不走的生存路线。
二、Cursor(龙虾)对二线厂商的特殊价值
罗福莉对Cursor“vibe coding堆出屎山、浪费token”的批评切中了它的架构缺陷,但Cursor对国内二线大模型厂商来说堪称“恩人”:
在Cursor爆火之前,OpenRouter的模型使用排行里,只有硅谷头部四家,二线厂商根本没有存在感;但Cursor带火了性价比模型,现在OpenRouter前排已经被小米、阿里、阶跃星辰等国内二线厂商占满,国内厂商也习惯把新模型免费放到OpenRouter获客,OpenRouter甚至成了国内厂商的PR阵地。
从结果来看,Cursor爆火直接带飞了二线API厂商的收入:MiniMax在Cursor火后ARR翻倍,月之暗面新模型不到20天收入就超去年全年,海外收入首次超过国内。

对当前行业来说,大模型还没跑通独立盈利,哪怕头部厂商的收入增长能否覆盖高额研发成本都存疑,二线厂商更遥远,“有人用”是活下去的核心叙事——只要用户规模起来,估值、融资就能打开空间,单纯算token的成本账没有意义。
三、行业正在发生的范式转变
目前二线厂商已经开始悄悄提价,但暂时还摆脱不了价格战,不过行业的产品范式正在迭代:
1. 不同厂商处境分化:小米有完整硬件与产品生态,MiMo的核心任务是赋能内部小爱、手机、汽车、IoT,哪怕不对外卖token也有价值;但纯API二线厂商没有生态,C端产品又打不过字节腾讯阿里这些巨头,只能靠API走量,非常依赖Cursor的流量窗口。
2. 从“套壳API”到“模型产品深度整合”:
第一代AI产品范式是“通用API+外层产品套壳”,这种模式降低了创业门槛,催生了Cursor这类产品,但天生效率浪费——产品不理解模型,模型也不适配产品,只能靠冗余调用补信息差,就像Cursor每次工具调用都带全量上下文,既费token又增加延迟。
而第二代范式正在浮现:模型和产品从架构层面共同设计,模型就是产品的一部分——比如Anthropic的Claude Code,自己做上下文的压缩、截断管理,精准控制token消耗,这只有模型研发方深度整合产品才能做到。
这个趋势下,纯API模型厂商的压力会越来越大:如果竞争力的核心变成模型和应用层的深度整合,那单纯API层的价格竞争,本质就是慢性消耗。

如何不发帖就快速得到金币道行
 
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖
179962
金币
610739
道行
20030
原创
769
奖券
471
斑龄
0
道券
30
获奖
0
座驾
设备
摄影级
在线时间: 22661(小时)
注册时间: 2012-06-21
最后登录: 2026-04-21
只看该作者 板凳  发表于: 04-08
“不能只算token账”这一观点,在当前的AI产业竞争中尤为关键。Token消耗量固然是衡量模型使用规模的重要指标,但模型厂商的长期竞争力与商业价值需从更全面的维度评估:

一、商业价值:用户黏性与产品体验是核心
工程优化与服务质量
如小米罗福莉强调,模型厂商需避免通过“低价倾销”吸引用户后牺牲服务稳定性,而应通过优化架构(如减少重复上下文调用)提升Token效率,确保长期可靠的体验230。用户愿意为高质量服务付费,如Anthropic凭借顶尖模型能力实现年化收入200亿美元30。

商业闭环能力

生态整合:小米、阿里等企业将AI融入硬件与产品矩阵(如小爱同学、钉钉),即使不依赖外部API收入,也能通过生态协同创造价值530。
独立厂商的挑战:纯API厂商若无法在C端产品(如通用助手)或垂直场景突破,可能面临巨头挤压30。
二、生态价值:开发者社区与平台效应
开源社区的杠杆作用
OpenClaw等工具通过降低开发门槛,推动国内模型调用量激增(如MiniMax的Token消耗量增长10倍),间接带动二线厂商市场份额提升530。厂商需通过工具链优化与社区支持,将Token消耗转化为开发者生态壁垒。

成本可控的规模化
阿里推出“安全沙箱”与Token券,既保障企业数据安全,又通过补贴降低开发成本,吸引更多企业用户接入其平台420。这种策略将Token消耗转化为生态扩张的燃料。

三、资本价值:叙事与用户规模的乘数效应
估值逻辑超越短期盈利
尽管多数AI企业尚未盈利,但资本市场更关注用户增长与场景落地潜力。例如:

月之暗面估值从43亿美元飙升至180亿美元,智谱股价涨至发行价6.7倍,反映市场对“用户规模即未来”的认可30。
厂商通过免费试用(如OpenRouter榜单竞争)快速获取用户,为融资叙事提供支撑30。
技术普惠的长期红利
DeepSeek等厂商通过压低Token成本(如百万Token仅0.8元)推动技术普及,虽短期亏损,但撬动了更大市场,为后续商业化铺路430。

总结
Token是AI经济的“血液”,但厂商能否构建可持续的“血液循环系统”,取决于技术壁垒、生态整合与资本叙事的三重共振。短期看Token,中期看场景,长期看生态——这才是真正的“AI经济学”。
如何不发帖就快速得到金币道行
 
我有我可以
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个