加入收藏 | 设为首页 | 会员中心 | 我要投稿 开发网_开封站长网 (http://www.0378zz.com/)- 科技、AI行业应用、媒体智能、低代码、办公协同!
当前位置: 首页 > 站长资讯 > 动态 > 正文

寒武纪发布新款 AI 训练卡 MLU370-X8

发布时间:2022-03-22 17:41:02 所属栏目:动态 来源:互联网
导读:寒武纪今天正式发布新款训练加速卡 MLU370-X8,搭载双芯片四芯粒思元 370,集成寒武纪 MLU-Link 多芯互联技术,主要面向训练任务。 寒武纪表示,在业界应用广泛的 YOLOv3、Transformer 等训练任务中,8 卡计算系统的并行性能平均达到 350W RTX GPU 的 155%
  寒武纪今天正式发布新款训练加速卡 MLU370-X8,搭载双芯片四芯粒思元 370,集成寒武纪 MLU-Link 多芯互联技术,主要面向训练任务。
  
  寒武纪表示,在业界应用广泛的 YOLOv3、Transformer 等训练任务中,8 卡计算系统的并行性能平均达到 350W RTX GPU 的 155%。
   MLU370-X8 采用了 7nm 工艺,配备 48GB LPDDR5 内存,FP32 单精度浮点性能达到 24 TFLOPS。
 
  
  据介绍,MLU370-X8 智能加速卡提供 250W 最大训练功耗,可充分发挥 AI 训练加速中常见的 FP32、FP16 或 BF16 计算性能。寒武纪首次将双芯片四芯粒思元 370 整合在 MLU370-X8 智能加速卡中,提供了两倍于标准思元 370 加速卡的内存、编解码资源,同时搭载 MLU-Link™多芯互联技术。
 
  
  MLU370-X8 智能加速卡支持 MLU-Link™多芯互联技术,提供卡内及卡间互联功能。寒武纪为多卡系统专门设计了 MLU-Link 桥接卡,可实现 4 张加速卡为一组的 8 颗思元 370 芯片全互联,每张加速卡可获得 200GB / s 的通讯吞吐性能,带宽为 PCIe 4.0 的 3.1 倍,可高效执行多芯多卡训练和分布式推理任务。
  

(编辑:开发网_开封站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读