切换到宽版
  • 313阅读
  • 1回复

[数码讨论]AI算力专题:AI算力软件生态:难以突破吗?[12P] [复制链接]

上一主题 下一主题
在线huozm32831

UID: 329002

精华: 1097
职务: 超级斑竹
级别: 玉清道君
 

发帖
107050
金币
242
道行
19523
原创
29307
奖券
17433
斑龄
192
道券
10532
获奖
0
座驾
 设备
EOS—7D
 摄影级
专家级认证
在线时间: 20497(小时)
注册时间: 2007-11-29
最后登录: 2025-01-23
只看楼主 倒序阅读 使用道具 楼主  发表于: 2024-10-19
— 本帖被 兵马大元帅 执行加亮操作(2024-11-06) —

《AI算力软件生态:难以突破吗?》探讨AI芯片软件生态相关问题。2024H2国内AI芯片厂商产品密集迭代,软件生态成核心竞争要素,兼容CUDA路线的海光信息和自成体系路线的华为昇腾进展快且用户体验佳。AI开发框架中Pytorch、Tensorflow双寡头且逐渐与AI芯片解耦,GPU编程平台方面英伟达CUDA有先发优势形成生态壁垒,其他厂商竞争方式有兼容CUDA(如AMD、海光信息)和自成体系(如华为昇腾、寒武纪)。软件工具是AI芯片的“大管家”,包括开发框架、GPU编程平台等多个层次。训练端后进入者竞争CUDA有两类方式,兼容CUDA又分两种途径且各有优劣,AMD通过ROCm及相关工具实现兼容,海光信息共享ROCm生态但完全兼容有困难,华为昇腾则打造自栈生态且算子适配进展快,寒武纪拥有完整软件堆栈且与Pytorch适配较好。推理端ONNX是“中间人”,软件生态百花齐放,不同推理框架各有优劣适用于不同场景。还介绍了相关公司情况,同时指出AI芯片软件生态发展面临挑战,如CUDA生态壁垒受开发框架解耦影响逐渐瓦解,但GPU编程平台学习成本和针对性优化仍需积累,不过国产厂商已有进展,,,,,,,,,,,,,。
以下为报告节选内容
















山庄提示: 道行不够,道券不够?---☆点此充值☆
 
  




    
在线jjybzxw

UID: 551814


发帖
120545
金币
1255775
道行
1965
原创
2249
奖券
2311
斑龄
30
道券
836
获奖
0
座驾
设备
摄影级
在线时间: 29007(小时)
注册时间: 2008-10-01
最后登录: 2025-01-24
只看该作者 沙发  发表于: 2024-10-19
  在探讨AI芯片软件生态的突破问题时,我们可以看到几个关键点。首先,软件生态已成为AI芯片厂商竞争的核心要素之一。海光信息和华为昇腾在兼容CUDA路线和自成体系路线上取得了较快的进展,并且用户体验良好。

  AI开发框架中,Pytorch和Tensorflow形成了双寡头局面,并且逐渐与AI芯片解耦。这意味着开发者可以更加灵活地选择不同的硬件平台来运行这些框架,从而推动了软件生态的发展。

  在GPU编程平台方面,英伟达的CUDA由于其先发优势,形成了强大的生态壁垒。然而,其他厂商如AMD、海光信息通过兼容CUDA的方式,以及华为昇腾、寒武纪通过自成体系的方式,也在积极竞争。这些竞争方式各有优劣,例如AMD通过ROCm及相关工具实现兼容,而海光信息虽然共享ROCm生态,但在完全兼容方面存在困难。华为昇腾则通过打造自己的生态系统,并且算子适配进展迅速,寒武纪也拥有完整的软件堆栈,与Pytorch的适配较好。

  在推理端,ONNX扮演了“中间人”的角色,软件生态呈现出百花齐放的局面,不同的推理框架适用于不同的场景。这种多样化的生态为开发者提供了更多的选择,同时也增加了软件生态的复杂性。

  AI芯片软件生态的发展确实面临挑战。例如,CUDA生态壁垒虽然受到开发框架解耦的影响而逐渐瓦解,但GPU编程平台的学习成本和针对性优化仍然是需要积累的。国产厂商在这方面已经取得了一定的进展,例如华为昇腾的CANN开发者社区虽然活跃度较低,但正在逐步构建自己的加速平台和软件栈。

  总的来说,AI芯片软件生态的突破需要厂商在兼容性、自成体系的生态建设、以及与主流AI框架的适配上持续努力。随着技术的发展和市场的推动,我们有望看到更加成熟和多样化的软件生态,为AI芯片的发展提供强有力的支持。

如何不发帖就快速得到金币道行
 
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个