855阅读
2回复

[智能应用]外界热议DeepSeek低调“上新” [1P] [复制链接]

上一主题下一主题查看指定楼层

在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖: 165588

金币: 473470

道行: 20030

原创: 766

奖券: 350

斑龄: 0

道券: 30

获奖: 0

座驾

设备

摄影级

在线时间: 20296(小时)
注册时间: 2012-06-21
最后登录: 2025-12-31

只看楼主倒序阅读使用道具楼主发表于: 03-26

— 本帖被兵马大元帅执行加亮操作(2025-03-27) —

【环球时报报道记者刘扬】中国人工智能初创公司深度求索（DeepSeek）24日深夜低调上线了DeepSeek-V3的新版本DeepSeek-V3-0324，参数量为6850亿，在代码、数学、推理等多个方面的能力再次显著提升，甚至代码能力追平美国Anthropic公司大模型Claude 3.7。不过，外界对于DeepSeek-V3-0324的关注并不仅仅因为该版本的能力提升，而是猜测它的发布是否意味着DeepSeek更新一代的V4与R2大模型的发布不远了。

DeepSeek移动端页面图源：视觉中国

在回答《环球时报》记者有关DeepSeek-V3新版本有哪些能力提升时，DeepSeek表示，一是新版本代码能力显著提升，接近Claude 3.7水平。例如，有用户在实测中发现，V3-0324能一次性生成800行无错误的网页代码，并实现动态响应式布局和交互效果。二是数学与逻辑推理能力增强。例如经典的“4升水壶问题”和数学竞赛题（如AIME 2025题目），部分表现接近专业推理模型。三是模型架构与开源生态。V3-0324采用MIT许可证，允许自由修改、分发及商业化应用，进一步降低了开发者的使用门槛。
清华大学新闻学院、人工智能学院教授沈阳25日对《环球时报》记者表示，DeepSeek-V3-0324不仅是V3系列的一次迭代，更是中国AI技术崛起的又一力证。其在性能、效率和开源策略上的综合优势使其在全球大语言模型领域占据重要地位。未来，DeepSeek可能通过推理能力提升和多模态扩展来巩固技术领先优势，同时在中美竞争和社区生态中寻找平衡。沈阳认为，DeepSeek-V3-0324的发布看似是一次“小更新”，但其性能跳跃表明该团队可能在为后续重大版本（如传言中的DeepSeek-R2或V4）铺路。
路透社今年2月底引述3名知情人士的说法宣称，DeepSeek原计划在今年5月初发布R2，但现在希望尽早推出，具体时间尚未透露。此外，DeepSeek希望新模型在代码生成和多语言推理方面的表现进一步提升。不过，外媒的相关传言并没有得到DeepSeek公司的证实与回应。
沈阳表示，DeepSeek-V3-0324的推出进一步凸显中国AI企业在技术与成本上的竞争力。美国对华GPU出口限制可能促使中国企业加速国产硬件适配，同时其开源模式或引发西方厂商的连锁动作，例如推出更强闭源模型。2025年可能是中美AI竞争的分水岭。
沈阳认为，在OpenAI公司的GPT大模型要把通用大模型和推理大模型融合在一起的背景下，外界关注包括DeepSeek在内的中国头部大模型是不是最终也会出现这种合并的趋势。“这种可能是存在的，因为对于用户来说，并不关心大模型在回应自身问题时用的是什么类型的模型，更关心大模型能不能给出更为智能、合理的参考答案。”

共1条评分，金币+10

兵马大元帅

金币 +10

优秀文章，支持！n神马都是浮云

03-27

山庄提示：道行不够，道券不够？---☆点此充值☆

我有我可以

分享到 淘江湖新浪 QQ微博 QQ空间开心人人豆瓣网易微博百度鲜果白社会飞信

发帖回复

返回列表


	关闭您还没有登录，快捷通道只有在登录后才能使用。立即登录还没有帐号？赶紧注册一个


	关闭选中1篇全选

帖子

[智能应用]外界热议DeepSeek低调“上新” [1P] [复制链接]