切换到宽版
  • 132阅读
  • 2回复

[数码讨论]Anthropic最强模型曝光,性能实现“代际跃迁”,全面碾压Opus [复制链接]

上一主题 下一主题
在线jjybzxw

UID: 551814

 

发帖
243727
金币
876135
道行
2006
原创
2461
奖券
3580
斑龄
45
道券
1580
获奖
0
座驾
设备
摄影级
在线时间: 52007(小时)
注册时间: 2008-10-01
最后登录: 2026-04-23
只看楼主 倒序阅读 楼主  发表于: 03-28
— 本帖被 兵马大元帅 执行加亮操作(2026-04-18) —

Anthropic一次内部配置失误,意外将其最机密的技术底牌公之于众。

据《财富》杂志26日独家报道,一款名为"Claude Mythos"、内部代号"Capybara"的全新旗舰模型已完成训练并进入早期测试阶段,Anthropic官方将其性能提升描述为"代际跃迁",在编程、学术推理和网络安全等核心测试中全面超越现有最强版本Claude Opus 4.6。

报道称,由于Anthropic内容管理系统(CMS)的人为配置失误,近3000份未发布的内部文件暴露在公开可检索的数据缓存中,泄露文件揭示,公司计划引入一个名为"Capybara"的全新模型层级,其定位高于现有旗舰Opus系列,运行成本也将更为高昂。

然而,超强性能伴随着前所未有的安全隐忧。泄露的内部草稿显示,Anthropic将新模型定性为网络安全领域的重大风险来源,认为其网络攻击能力"远超目前任何其他AI模型",一旦被黑客利用,将可能催生大规模网络攻击,且破坏力将远超防御者的应对能力——这也是公司迟迟不敢公开发布的核心原因。

超越Opus:全新层级"Capybara"打破现有格局

泄露的博客草稿显示,Claude Mythos代表着Anthropic产品线的一次结构性重组。

目前,Anthropic的模型矩阵分为三个层级:能力最强的Opus、速度与成本均衡的Sonnet,以及最小最快的Haiku。而泄露文件表明,Anthropic正在引入一个全新的"Capybara"层级,其定位在Opus之上——体量更大、智能程度更高,但运行成本也更为昂贵。

在具体性能方面,草稿博客称,"与此前最强版本Claude Opus 4.6相比,Capybara在软件编程、学术推理及网络安全等测试中的得分均大幅提升。"文件将Claude Mythos描述为"迄今为止我们开发过的最强大AI模型,远超以往任何版本"。

Anthropic发言人在回应《财富》询问时证实了上述方向,表示公司"正在开发一款在推理、编程和网络安全方面取得重大进展的通用模型",并强调"鉴于其能力的强大,我们正在审慎地推进发布方式"。

前所未有的网络安全风险:Anthropic自身也感到警惕

伴随强大能力而来的,是泄露文件中措辞罕见强烈的安全警告。

泄露草稿博客直言,新模型"目前在网络攻击能力方面远超任何其他AI模型",并预示着"一波即将到来的模型浪潮,其漏洞利用速度将远远超出防御者的应对能力"。

正是出于这一顾虑,Anthropic在发布策略上将网络安全防御机构列为优先受益方。草稿写道:"我们将率先向相关机构开放早期访问权限,让它们能够在即将到来的AI驱动漏洞利用浪潮中抢占先机,提前加固自身代码库的稳健性。"

这一担忧并非孤例。今年2月,OpenAI发布GPT-5.3-Codex时,将其列为首个在网络安全任务中达到"高能力"评级的模型,也是首个被直接训练用于识别软件漏洞的模型。同期,Anthropic发布的Claude Opus 4.6也展现出识别生产代码库中未知漏洞的能力,公司承认这属于攻守两用的"双刃剑"特性。

配置失误:3000份内部文件意外公开

此次泄露事件的技术根源,在于一个看似低级的操作失误。

LayerX Security资深AI安全研究员Roy Paz与剑桥大学网络安全研究员Alexandre Pauwels发现,Anthropic用于发布官方博客的外部CMS工具存在配置缺陷:该系统默认将上传的数字资产设置为公开状态并赋予可访问的URL,除非用户手动将其设为私密。这一默认设置导致近3000个未发布资产——包括图片、PDF文件及音频文件——暴露在公开可检索的数据缓存中。

Anthropic在声明中将此次事件归因于"人为错误",表示"外部CMS工具的一个问题导致草稿内容被公开访问",并将泄露材料定性为"考虑发布的内容早期草稿"。

X平台炸锅:震撼与质疑并存

消息一经曝光,X平台迅速掀起讨论浪潮,舆论焦点集中在技术震撼与安全信任两个维度。

账号TFTC发文直指事件的讽刺意味:"Anthropic不慎证明了AI安全论。一个CMS配置错误导致3000份未发布文件暴露在公开可搜索的缓存中——其中就包括关于'Claude Mythos'(代号Capybara)的详情,而Anthropic内部文件将其称为'迄今为止最强大的AI'。"这一评论在科技圈广泛传播,不少用户对一家以AI安全为核心价值观的公司,竟因基础配置失误而自露底牌深感错愕。

另有用户fardeen则将视角转向Claude最新的能力,评论道:"Claude现在真的可以像你一样使用电脑——打开应用、点击按钮、填写表单。Anthropic正在逐步将人类从操作流程中移除。"

用户Oliwier Makowski Trusz则认为Capybara的发布改变了格局。根据泄露信息,参数量达到10万亿。Claude 与其他所有模型之间的差距刚刚被大幅拉开。


山庄提示: 道行不够,道券不够?---☆点此充值☆
 
在线jjybzxw

UID: 551814


发帖
243727
金币
876135
道行
2006
原创
2461
奖券
3580
斑龄
45
道券
1580
获奖
0
座驾
设备
摄影级
在线时间: 52007(小时)
注册时间: 2008-10-01
最后登录: 2026-04-23
只看该作者 沙发  发表于: 03-28
根据《财富》杂志的报道,Anthropic公司发生了一次内部配置失误,导致其未发布的内部文件意外公开。这些文件揭示了Anthropic正在开发一款名为"Claude Mythos"、内部代号为"Capybara"的全新旗舰AI模型。该模型被描述为"代际跃迁",在编程、学术推理和网络安全等核心测试中全面超越了现有的最强版本Claude Opus 4.6。

然而,这款新模型也带来了前所未有的安全隐忧。泄露的内部文件显示,Anthropic将新模型定性为网络安全领域的重大风险来源,认为其网络攻击能力"远超目前任何其他AI模型"。这也是公司迟迟不敢公开发布的核心原因。

此次泄露事件的技术根源在于一个看似低级的操作失误。外部CMS工具的配置缺陷导致近3000个未发布资产暴露在公开可检索的数据缓存中。Anthropic将此次事件归因于"人为错误",表示"外部CMS工具的一个问题导致草稿内容被公开访问"。

这一事件引发了科技圈的广泛讨论,许多人对一家以AI安全为核心价值观的公司竟因基础配置失误而自露底牌深感错愕。
如何不发帖就快速得到金币道行
 
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖
180347
金币
614819
道行
20030
原创
769
奖券
471
斑龄
0
道券
30
获奖
0
座驾
设备
摄影级
在线时间: 22717(小时)
注册时间: 2012-06-21
最后登录: 2026-04-23
只看该作者 板凳  发表于: 03-28
Anthropic意外泄露的旗舰模型 Claude Mythos(内部代号 Capybara)已确认为该公司迄今为止最强大的AI系统,其性能在关键领域实现了“代际跃迁”,全面超越当前顶级模型Claude Opus 4.6。核心突破与影响如下:

一、技术性能的代际突破
多领域能力碾压
Mythos在三大核心测试中展现跨越式提升:

软件编程:自动化代码生成与复杂系统重构能力显著增强,可独立解决人类工程师级别的工程问题。
学术推理:跨学科知识联结与逻辑推导能力升级,尤其在法律、医学等专业领域接近人类专家水平。
网络安全:攻防能力大幅领先现有所有AI模型,可识别未知漏洞并构建自动化攻击链,防御方应对窗口被急剧压缩。
架构层级重构
Mythos属于全新模型层级 Capybara,定位高于现有Opus系列,具备更大参数量与更高智能密度,但运行成本也成倍增加。

二、引发行业安全预警
双刃剑风险
Mythos的网络安全能力被Anthropic内部视为“颠覆性威胁”,其自动化漏洞利用速度远超防御技术迭代周期,可能引发大规模网络攻击浪潮。该公司坦言,该模型已被黑客组织在真实攻击中测试性使用。

谨慎发布策略
因风险与成本过高,Anthropic采取严格管控:

限域测试:仅向网络安全机构开放早期访问权限,助其提前加固防御体系。
暂缓公测:拒绝大规模部署,需进一步优化能效比并评估伦理影响。
三、战略影响与行业震荡
重新定义AI竞争格局
Mythos的曝光标志着Anthropic在通用模型领域首次实现对同梯队竞品(如OpenAI的GPT-5系列)的实质性代差优势,可能加速头部厂商的军备竞赛。

资本市场连锁反应
消息泄露后,美国网络安全概念股全线暴跌,多家头部安全企业单日跌幅超5%,反映出市场对AI颠覆传统防御体系的担忧。

四、技术细节与演进方向
能力链整合:编程、推理与网安能力的协同跃迁,使Mythos能构建端到端攻击/防御工作流(如理解系统语义→规划攻击路径→生成漏洞利用代码)。
安全机制升级:新增对抗性风险控制模块,通过“思维摘要”技术提升模型行为可解释性,但仍未完全消除双刃剑属性。
此次泄露事件暴露了超强AI的不可控风险,而Mythos能否在能力与安全间取得平衡,将直接影响Anthropic的产品化进程与行业生态走向。其最终发布形式及效能边界,仍需持续观察。
如何不发帖就快速得到金币道行
 
我有我可以
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个