huozm32831 |
2024-04-15 20:26 |
英特尔(Intel)最近在官网上发布了一份名为“Gaudi 3 AI加速器白皮书”的报告,揭示了他们即将在中国发售Gaudi 3两款“特供版”AI芯片产品。这两款硬件形态加速卡分别是型号为HL-328的OAM兼容夹层卡(Mezzanine Card)和型号为HL-388的PCle加速卡,预计将于今年6月24日和9月24日推出。 据报道,原版Gaudi 3在FP16/BF16上的性能可以达到1835 TFLOPS,而中国特供版Gaudi 3的16bit性能将不超过150 TFLOPS。相比国际版Gaudi 3,中国特供版的HL-328芯片性能或将降低约92%左右。这意味着中国特供版Gaudi 3的TDP(热设计功耗)也将大幅降低。 Gaudi 3在AI加速领域的强大性能和效率,尤其在大模型训练和推理方面表现出色。国际版Gaudi 3拥有128GBHBMe2内存容量、3.7TB内存带宽和96MB板载静态随机存取内存,可以满足大模型的超大内存需求。而Gaudi 3的训练时间平均比英伟达的H100缩短了50%。在Llama-2 7B/70B以及Falcon180B大模型的推理测试中,Gaudi 3的吞吐量平均比H100快了50%,平均推理效率快了40%。 人工智能芯片发展路径 人工智能作为一项计算密集型的新技术,在早期发展阶段依赖通用芯片的性能迅速发展,而后期将依赖专用芯片来主宰市场。定制的硬件能够实现更优的功耗效率,满足不同算法、结构、终端和消费者的需求,实现规模化的收益。然而,通用芯片与专用芯片永远不是互相替代的关系,二者必须协同工作才能发挥出最大的价值。 人工智能芯片分类 目前,人工智能芯片根据技术架构可分为CPU、GPU、FPGA、ASIC和类脑芯片;根据在网络中的位置可分为云端AI芯片、边缘AI芯片和终端AI芯片;按实践目标可分为训练芯片和推理芯片。 全球GPU芯片出货量超过4.6亿片/年 GPU是目前市场上应用最广泛、在AI计算方面最成熟的通用芯片。根据弗若斯特沙利文的推算,2020年GPU芯片在AI芯片市场占据了35.95%的主要份额。 近年来,全球GPU技术迅速发展,不仅满足了传统图形应用需求,还在科学计算、人工智能和新型图形渲染技术方面得到广泛应用。这些技术的成熟应用推动了全球GPU芯片市场的持续高速发展。据全球知名调研机构JPR的数据显示,2021年全年全球GPU芯片的出货总量超过4.6亿片,每个季度的出货量维持在1-1.3亿片之间。 根据IDC的预测,随着智能手机需求逐步复苏以及对AI芯片的强劲需求,半导体市场将在2024年重新回到增长趋势,年增长率预计将超过20%。 另据Omdia的预测,全球机器人人工智能芯片组市场规模预计将达到8.66亿美元,这将有助于推动GenAI在机器人领域的普及化。 IDC亚太区半导体研究高级研究经理Galen Zeng指出,内存芯片制造商对供应和产量的严格控制导致芯片价格自去年11月初开始上涨。预计人工智能的需求将推动2024年整体半导体销售市场的复苏。 |
|