切换到宽版
  • 69阅读
  • 2回复

[智能应用]GPT-5发布与华为CANN开源有望带动AI应用发展 [复制链接]

上一主题 下一主题
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君
 

发帖
151581
金币
335123
道行
20030
原创
758
奖券
224
斑龄
0
道券
0
获奖
0
座驾
设备
摄影级
在线时间: 17899(小时)
注册时间: 2012-06-21
最后登录: 2025-08-22
— 本帖被 兵马大元帅 执行加亮操作(2025-08-16) —
智通财经APP获悉,中信建投发布研究报告称,GPT-5正式发布,在长文本记忆、幻觉率的降低和推理效率优化,为AI应用的生长提供了更好的土壤。后续可期待Google、Anthropic的更新和国内模型的跟进,以及基模优化下AI应用代币化的持续落地。华为全面开源CANN生态,针对不同层级开发者差异化开放,大幅提高开发效率,有望对标CUDA加速追赶。1)利好有数据、有客户、有场景的软件企业,AI产品有望带动公司ARPU提升和项目单价上升;2)模型私有化需求增加,利好一体机、超融合和B端服务外包企业;3)市场成交量持续维持高位,互联网金融标的有望受益。

中信建投主要观点如下:
GPT-5正式发布,刷新多项能力SOTA。2025年8月8日凌晨1点,OpenAI正式发布GPT-5,包含GPT-5、GPT-5-Mini、GPT-5-Nano三个版本。性能方面,GPT-5刷新多项基准测试Sota,尤其在数学、编程、视觉理解和健康领域表现突出,并在大模型竞技场LMArena上各维度取得综合排名第一的成绩。
数学:OpenAI认为使用工具的Benchmark得分不应该与不具备工具访问能力的模型进行比较,而GPT-5在AIME 2025 no tools/Python分别得分94.6%/100%,一定程度反映其对工具的有效利用。同时,GPT-5在专家级问题上表现优异,在HMMT(麻省理工学院数学锦标赛)最高获得100%的得分;GPQA Diamond(博士级科学问题)最高得分89.4%;HLE(跨学科专家问题)得分42.0%。
编程:GPT-5在SWE-bench Verified(With thinking)得分74.9%,略超Claude Opus 4.1的74.5%,取得新的Sota。同时,在LMArena 的各类能力得分中,GPT-5在WebDev上得分1479分,大幅领先排名第二的Gemini-2.5-Pro(1403分)。
多模态:GPT-5在视觉理解方面MMMU(With thinking)得分84.2%(高于gemini 2.5 pro的81.7%,但二者在LMArena得分相同,均为1253分且排名第一),在MMMU-Pro、VideoMMMU等Benchmark上较前代模型亦有不同程度的提升。
场景: 教育方面,GPT-5可在几分钟之内生成数百行代码,生成互动内容以解释复杂概念;几分钟时间写出一个法语学习网页,帮用户练发音,且语音语调较前代更加自然;医疗为GPT-5重点应用场景,OpenAI称其为迄今为止最好的健康模型;在涵盖法律、物流、销售和工程等 40 多个职业的具有经济意义的任务上,GPT-5在47.1%的场景中达到了与专家相当或更高的水平。
GPT-5上下文窗口达400K,可通过实时路由器自行决定适用模型。初基准测试外得分高外,GPT-5还是带实时路由器的统一模型,可以根据用户对话类型、复杂性、工具需求和明确意图快速决定使用哪个模型(类似混合推理模型中自己决定快/慢思考)。同时,GPT-5的上下文窗口提升至400K tokens(约30万字,较o3翻倍),“Memory”功能将新增对Gmail和谷歌日历的访问权限(下周推出,先向专业用户开放,随后是Plus/团队/企业用户),可根据用户偏好帮助用户规划日程。
幻觉率显著降低,成本优化明显。在ChatGPT生产环境流量的匿名测试中,GPT-5的事实错误率比4o降低约 45%;启用推理功能时,错误率比o3降低约 80%。在开放性事实准确性基准 LongFact和FActScore测试中,GPT-5 thinking的幻觉率比o3减少约六倍;此外,GPT-5进一步降低了模型过于自信的问题,例如在对不存在图像的多模态问题回复欺骗率从o3的86.7%%降低至9%。
而在定价&成本方面,GPT-5全用户可用,Plus用户用量更高,Pro用户可使用带思考能力的GPT-5-Pro。GPT-5每百万tokens输入$1.25(缓存命中$0.125),输出$10,与Gemini 2.5Pro持平;Mini和Nano则为GPT-5的1/5和1/25。此外,GPT-5在推理效率亦有提升,部分任务表现优于o3,但输出token减少了 50-80%。
华为CANN全面开源,加速生态完善。8月5日,在昇腾计算产业发展峰会上,华为轮值董事长徐直军宣布,华为昇腾硬件使能CANN全面开源开放,Mind系列应用使能套件及工具链全面开源,支持用户自主的深度挖潜和自定义开发,加速广大开发者的创新步伐,让昇腾更好用、更易用。
具体而言,CANN(神经网络异构计算架构)是由多种技能栈和算子加速库等组成的软件生态系统,能把上层AI训练框架(如PyTorch、TensorFlow、MindSpore等)和底层昇腾芯片连接起来,使开发者不用关心芯片细节就能调用底层算力,从而加速昇腾生态建设。
针对不同层级开发者差异化开放,大幅提高开发效率。昇腾CANN针对不同技术层级的开发者推出了差异化开放策略。比如在算法创新层,开发者可基于业务场景进行“魔改式”创新;在系统优化层,CANN开放了190多个底层接口,得以释放硬件的原子级能力。在编译生态层,通过开放毕昇编译器的AscendNPU IR接口,开发者可以在接入Triton后直接使用Python语法编写高性能算子,底层硬件差异被完全抽象化。
而在效率方面,CANN通过对计算、内存、通信的优化提高效率。计算层面,昇腾CANN针对MoE大模型训练场景推出了超级算子MLAPO,将MLA前处理耗时从行业平均109ms压缩至45ms,在金融风控模型、广告推荐系统中实现了20%以上的端到端性能提升,打破Transformer架构的算力瓶颈;内存层面,多重地址映射技术可以实现内存碎片的自动化拼接利用,解决动态shape场景的“内存碎片化”难题,让京东商品搜索、腾讯短视频推荐等业务场景的内存利用率提升了20%以上,突破了单卡可承载并发请求量行业极限。在分布式训练领域, NPUDirect通信算法将传统RDMA通信所需的3对同步精简为1次原子操作,让科大讯飞语音大模型的跨机通信时延下降了90%,走通了万卡级分布式训练可行性路径。
根据昇腾官方数据,6年来,有超过60万开发者了解CANN、使用CANN、赋予CANN创新活力,在昇腾CANN持续推进开放,以及产业各方开发者、企业积极参与之下,CANN生态正在快速成长。目前CANN的算子认证开发者已经超过了6000人。随着CANN的进一步开源,昇腾CANN生态有望进一步完善,对标CUDA加速追赶,并为基于国产算力的AI应用开发提供了更好的基础。
总结:GPT-5正式发布,在长文本记忆、幻觉率的降低和推理效率优化,为AI应用的生长提供了更好的土壤。后续可期待Google、Anthropic的更新和国内模型的跟进,以及基模优化下AI应用代币化的持续落地。华为全面开源CANN生态,针对不同层级开发者差异化开放,大幅提高开发效率,有望对标CUDA加速追赶,同样为国内AI应用开发提供了更好的基础。
海外GPT-5推出,降低幻觉的同时,提升推理性能,降低成本。1)利好有数据、有客户、有场景的软件企业,AI产品有望带动公司ARPU提升和项目单价上升。2)模型私有化需求增加,利好一体机、超融合和B端服务外包企业。
山庄提示: 道行不够,道券不够?---☆点此充值☆
 
我有我可以
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖
151581
金币
335123
道行
20030
原创
758
奖券
224
斑龄
0
道券
0
获奖
0
座驾
设备
摄影级
在线时间: 17899(小时)
注册时间: 2012-06-21
最后登录: 2025-08-22
只看该作者 沙发  发表于: 08-11
GPT-5发布与华为CANN开源:双引擎驱动AI应用发展新机遇
近期,GPT-5的正式发布与华为CANN生态的全面开源,成为推动人工智能产业发展的两大重要事件。这两项技术进展分别从模型能力提升与底层生态构建两个维度为AI应用的创新与落地注入新动能,引发行业广泛关注。

GPT-5技术突破:夯实AI应用发展基础
GPT-5在多项关键技术指标上实现显著提升,为AI应用的深化拓展提供了更优质的模型支撑。

长文本记忆与处理能力增强:能够更高效地理解和生成超长文本,拓展了在法律文书处理、学术论文撰写、多轮对话等复杂场景的应用潜力13。
幻觉率显著降低:通过优化训练数据与推理机制,模型输出内容的准确性和可靠性得到提升,这对于医疗诊断辅助、金融分析等对精度要求极高的领域至关重要13。
推理效率优化:在保持性能的同时,提升了模型的运行速度和能效比,有助于降低AI应用的部署成本,推动其在边缘设备等资源受限环境中的普及13。
华为CANN开源:构建自主AI生态,加速追赶CUDA
华为宣布全面开源其AI计算架构CANN,旨在打造中国自主的AI底层生态,直接对标英伟达的CUDA,这一举措对国内AI产业发展具有深远影响。

CANN的核心定位与作用:CANN(神经网络异构计算架构)是连接上层AI训练框架(如PyTorch、TensorFlow、MindSpore)与底层升腾芯片的关键桥梁,能够帮助开发者在无需深入了解芯片细节的情况下高效调用底层算力,提升开发效率47。
开源的战略意图:华为希望通过开源CANN,吸引全球开发者参与生态建设,弥补升腾产品早期易用性不足的问题,扩大其生态圈,进而拉近与CUDA的差距,构建自主可控的AI生态体系47。
面临的挑战与业内反应:尽管开源是积极信号,但业内也存在一些担忧。例如,部分观点认为升腾NPU转向GPGPU可能导致原有软件栈难以维系更新,开源CANN有吸纳外部开发者参与维护之嫌;也有观点指出NPU本身编程难度较高,生态构建非一蹴而就,需要长期投入4。不过,也有行业人士认为,开源有助于开发者反馈改进,虽然构建能与CUDA相抗衡的生态需要数年时间,但CANN有望成为重要的基础设施
如何不发帖就快速得到金币道行
 
我有我可以
在线jjybzxw

UID: 551814


发帖
179323
金币
362853
道行
2004
原创
2415
奖券
2935
斑龄
37
道券
1068
获奖
0
座驾
设备
摄影级
在线时间: 40238(小时)
注册时间: 2008-10-01
最后登录: 2025-08-22
只看该作者 板凳  发表于: 08-11
中信建投发布的研究报告对GPT-5的发布和华为CANN生态的开源进行了深入分析,指出这些技术进步对AI应用和软件企业带来的积极影响。以下是对报告主要观点的总结和评论:

1. GPT-5的性能提升:
   - GPT-5在多个领域刷新了基准测试的最佳成绩(SOTA),特别是在数学、编程、视觉理解和健康领域,显示了其卓越的性能。

2. 长文本记忆和幻觉率降低:
   - GPT-5的上下文窗口提升至400K tokens,显著提高了长文本记忆能力。同时,幻觉率(事实错误率)显著降低,提升了模型的可靠性。

3. 推理效率优化:
   - GPT-5在推理效率上进行了优化,部分任务的性能优于前代模型,同时减少了输出token的数量,提高了效率。

4. 华为CANN生态的开源:
   - 华为全面开源CANN生态,为不同层级的开发者提供差异化的开放策略,大幅提高了开发效率,并有望加速追赶CUDA。

5. 对软件企业的利好:
   - GPT-5的发布和华为CANN生态的开源,利好有数据、有客户、有场景的软件企业,有望带动公司ARPU提升和项目单价上升。

6. 模型私有化需求增加:
   - 随着AI技术的发展,模型私有化需求增加,利好一体机、超融合和B端服务外包企业。

7. AI应用代币化:
   - 报告预计,基于模型优化的AI应用代币化将持续落地,为AI应用的商业化提供了新的可能性。

8. 国内外AI模型的竞争:
   - 报告提到后续可期待Google、Anthropic等公司的更新和国内模型的跟进,显示了国内外AI模型之间的竞争和合作。

9. 互联网金融标的受益:
   - 市场成交量持续维持高位,互联网金融标的有望受益于AI技术的进步。

总体来看,GPT-5的发布和华为CANN生态的开源为AI应用的发展提供了更好的土壤,推动了AI技术的创新和应用。这些技术进步不仅提升了AI模型的性能和可靠性,也为软件企业和AI应用开发提供了新的机会。随着国内外AI模型的竞争和合作,以及AI应用代币化的发展,AI技术有望在更多领域发挥重要作用,推动数字经济的发展。
如何不发帖就快速得到金币道行
 
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个