

宣布搭载全新昇腾950PR(Ascend 950PR)处理器的Atlas 350加速卡正式,相较于上一代昇腾910系列实现算力与内存双升级、访存更灵活、开发更易用。
华为将Atlas 350定位为面向AI部署预填充阶段(推理)的高效能主力产品,据华为昇腾计算业务总裁张迪煊透露,AtlKaiyun科技有限公司as 350单卡算力达到英伟达专供中国市场的H20的2.87倍,是国内首款支持FP4低精度计算的商用推理产品;HBM容量达112GB,为H20的1.16倍,多模态生成效率提升60%;内存访问颗粒度由512字节优化至128字节,小算子访存效率提升4倍。
华为Atlas 350是首款针对FP4进行原生优化的国产AI加速器,英伟达也是直到最近才通过Blackwell GPU开始支持该格式。FP4允许在相同硬件上部署更大规模的模型,同时降低内存需求。据现场公示的参数显示,Atlas 350的FP4精度算力为1.56P,带宽达1.4TB/s,功耗600W,为H20的1.5倍。
昆仑、华鲲振宇、神州鲲泰、长江计算、宝德、软通华方、百信7家核心伙伴首发基于 Atlas 350 的整机产品,面向行业提供高性能、易运维的定制化推理方案,标志着昇腾950代际推理算力正式进入商用阶段。返回搜狐,查看更多