动态资讯 分类
AMDMI350P峰值4600万亿次浮点运算适配多类AI模型 发布日期:2026-05-12 14:39:56 浏览次数:

  

AMDMI350P峰值4600万亿次浮点运算适配多类AI模型(图1)

  据香港IDC新天域互联了解,芯片设计巨头AMD近日正式发布全新Instinct MI350P PCIe加速卡,旨在帮助AI基础设施运营商提升计算性能,进一步完善其AI-centric产品矩阵。该款双槽即插即用卡片适配标准风冷服务器,用户可直接将其接入现有设备架构,无需重构基础设施,大幅降低AI部署门槛。

  据悉,Instinct MI350P支持单台风冷服务器最多搭载八块加速卡,在微缩放四位浮点(MXFP4)下峰值性能可达4600万亿次浮点运算,堪称目前企业级PCIe卡中的高性能代表。其原生支持多种精度格式,适配大中小各类AI推理模型及检索增强生成(RAG)流程,能满足企业多样化AI workload需求。

  AMD计算与企业AI副总裁Suresh Andani表示,MI350P无需企业重建数据中心,就能让其运行更多模型、服务更多用户,搭配AMD软件栈可实现工作负载迁移,仅需少量代码调整,还支持Kubernetes GPU Operator等生命周期工具,且无持续按令牌收费压力。

  PCIe作为服务器内部高速接口,是连接GPU、加速器与CPU的关键通道,能有效缓解复杂AI代理工作负载的通信瓶颈。此次新品发布,也是AMD继收购赛灵思、19亿美元收购DPU厂商Pensando后,在数据中心基础设施领域的又一布局,进一步补齐其硬件生态短板。

  目前,联想、思科、戴尔科技、惠普企业等主流厂商已纷纷布局这款新品。思科计算高级副总裁Jeremy Foster称,双方合作体现了AI计算与智能凯云官网网络、安全深度融合的需求,MI350P能助力构建可扩展、高可靠的企业级AI基础设施。Akamai云计算产品副总裁也表示,该卡片适配分布式推理场景,将推动边缘代理AI发展。返回搜狐,查看更多