切换到宽版
  • 670阅读
  • 0回复

[智能应用]面向云端数据中心 燧原科技发布首款人工智能推理产品 [复制链接]

上一主题 下一主题
在线huozm32831

UID: 329002

精华: 1097
职务: 超级斑竹
级别: 玉清道君
 

发帖
106061
金币
771
道行
19523
原创
29307
奖券
17205
斑龄
189
道券
10126
获奖
0
座驾
 设备
EOS—7D
 摄影级
专家级认证
在线时间: 19961(小时)
注册时间: 2007-11-29
最后登录: 2024-11-14
只看楼主 倒序阅读 使用道具 楼主  发表于: 2020-12-22
— 本帖被 兵马大元帅 执行加亮操作(2021-03-20) —
          人工智能早已影响了人们工作生活的各个方面,人工智能需要数据的支持,而大数据处理早已进入需要云端支持的时代。因此面向云端数据中心的人工智能加速卡为数据处理提供了强大的算力。



燧原科技创始人兼CEO赵立东

继去年12月发布了首款面向数据中心的人工智能训练加速卡“云燧T10”后,今天燧原科技发布首款人工智能推理产品“云燧i10”,这正是一款面向云端数据中心的高性能推理卡,用以满足由于AI应用和落地场景迅速扩大,市场和客户对更高性价比以及国产化和差异化云端推理产品的需求。

燧原科技CEO赵立东表示,“当前全球科技产业特别是集成电路产业正在发生深刻变革,燧原科技会继续加速技术创新和产品迭代。”

与此同时,与上下游伙伴合作,加速业务落地,扩大市场规模。针对互联网数据中心、垂直行业(金融、保险、教育、医疗及运营商等)、新基建三大业务方向的应用场景,完善训练和推理软件栈、工具链和解决方案。通过产学研协作,共建国产化产业生态,助力中国人工智能和集成电路产业的发展。”

人工智能对于算力的要求非常高。云燧i10是单槽位标准卡,大大加快了人工智能的深度学习过程中的运算环节。支持PCIe 4.0,FP32算力达到17.6TFLOPS,BF16/FP16算力70.4TFLOPS。

据介绍,“云燧i10”拥有卓越的算力、出色的通用性以及优异的价值特性:高算力、多精度:FP32算力17.6TFLOPS,BF16/FP16算力70.4TFLOPS;采用自主指令集,支持从FP32到INT8等多种精度,而最大功耗仅为150W;高能效、高可靠性:采用动态调频调压(DVFS)技术,根据负载加速应用性能,支持RAS、ECC;设备虚拟化:实现多用户支持,最大可支持4个设备实例,具备计算与存储资源的独享性,多用户间安全隔离;单颗芯片上可同时部署不同的业务与负载,实现多任务并行,有效提高利用率;支持KVM、Xen等系统虚拟化平台;易编程、生态开放:开放C++和Python编程接口,支持CNN及NLP典型模型,支持主流机器学习框架,并通过SDK提供深度定制。

燧原科技COO张亚林介绍道:“云燧i10在多项基准测试中,性能领先,并已完成与浪潮、新华三及Supermicro等服务器厂商推理服务器的适配。可适用于视频图像、语音、自然语言处理、知识图谱等多种应用场景,并针对内容理解、推荐、识别等高精度场景做了优化。与此同时,面向多元的开发需求,我们提供不同层次的开发模式,针对客户定制化算法模型联合开发,从而实现与客户的双赢。”

除了硬件,燧原科技同时推出针对推理产品的高性能神经网络模型推理引擎“鉴算TopsInference”。通过计算图优化、算子融合、模型压缩、量化等优化技术,可以为深度学习应用提供低延迟、高吞吐率的推理性能。

通过TopsInference的推理加速,配合i10 的高算力及虚拟化技术,数据中心可以高性价比地部署计算密集型深度学习工作负载。此外TopsInference除TensorFlow、PyTorch模型格式外,还支持ONNX通用模型格式,借助燧原GCU-CARA架构的可编程性,可以应对未来深度神经网络日益多样化、复杂的增长趋势。云燧i10与云燧T10以及“驭算TopsRider”软件平台搭配,可实现算法模型在数据中心训推一体化的快速生产部署。
1条评分金币+10
兵马大元帅 金币 +10 验证通过,感谢支持 2020-12-24
山庄提示: 道行不够,道券不够?---☆点此充值☆