动态资讯 分类
4卡96GB显存暴力输出!英特尔锐炫ProB60工作站评测:千人AI聊天不是梦 发布日期:2026-02-12 10:08:33 浏览次数:

  

4卡96GB显存暴力输出!英特尔锐炫ProB60工作站评测:千人AI聊天不是梦(图1)

  显卡,以其强大的AI推理能力,引发了业界的广泛关注。这款工作站凭借96GB的超大显存,宣称能够满足千人同时在线AI聊天需求。那么,这款产品究竟表现如何?本文将为您详细解读。

  随着英特尔向“全栈AI公司”转型,其在AI领域的布局逐渐显现出强大的竞争力。锐炫Pro B60显卡正是这一战略下的重要产品。它基于第二代Xe2架构(Battlemage),拥有20个Xe2核心、2560个FP32单元,以及160个XXMAI引擎。单颗BMG-G21 GPU可提供12.28TFLOPS的FP32浮点性能和197TOPS的INT8 AI性能。显存方面,锐炫Pro B60配备了192bit位宽、19GbpsGDDR6显存,显存带宽高达456GB/s,显存容量达到24GB。更重要的是,相比同等显存规格的NVIDIAAI加速卡,锐炫Pro B60的售价更具优势,使其成为构建96GB(4卡)到192GB(8卡)超大显存池最具性价比的方案。本次评测的长城世恒X-AIGC工作站,搭载了4张锐炫Pro B60显卡,总显存达到96GB。

  为了验证其AI推理能力,我们对长城世恒X-AIGC工作站进行了GPT-OSS-120B模型Kaiyun官方入口的测试。该模型是OpenAI首个开源的千亿级参数模型,总参数量高达1170亿。测试结果显示,在MXFP4混合精度下,4卡并联运行GPT-OSS-120B模型表现出色。即使在并发数为1的情况下,请求成功率也达到100%,TTFT(首字延迟)仅为91.37ms,平均ITL(逐词延迟)为32.01ms,输出吞吐量达到184tok/s。随着并发数的增加,系统吞吐量呈现指数级增长,在并发60时,吞吐量达到701tok/s。这意味着,这套系统理论上可以支持70个用户同时请求回答。如果按照1:15的活跃比计算,这台工作站可以支持1000人同时在线聊天,满足了其宣传的目标。

  英特尔锐炫Pro B60凭借其强大的性能和极具竞争力的价格,为构建高性能本地LLM推理站提供了新的选择。它不仅能够运行千亿级参数模型,还能满足大规模并发需求。对于想要涉足AI推理的企业和个人用户来说,锐炫Pro B60无疑是一个值得考虑的选项。那么,在AI技术持续发展的今天,这类高性价比的AI加速方案,是否会成为未来AI应用的主流选择?欢迎在评论区留下您的看法。