400-830-3360

取消



顶部

动态资讯分类

动态资讯

行业资讯

当前位置：首页 > 动态资讯 > 行业资讯

4卡96GB显存暴力输出！英特尔锐炫ProB60工作站评测：千人AI聊天不是梦发布日期：2026-02-12 10:08:33 浏览次数：

4卡96GB显存暴力输出！英特尔锐炫ProB60工作站评测：千人AI聊天不是梦(图1)

　　显卡，以其强大的AI推理能力，引发了业界的广泛关注。这款工作站凭借96GB的超大显存，宣称能够满足千人同时在线AI聊天需求。那么，这款产品究竟表现如何？本文将为您详细解读。

　　随着英特尔向“全栈AI公司”转型，其在AI领域的布局逐渐显现出强大的竞争力。锐炫Pro B60显卡正是这一战略下的重要产品。它基于第二代Xe2架构（Battlemage），拥有20个Xe2核心、2560个FP32单元，以及160个XXMAI引擎。单颗BMG-G21 GPU可提供12.28TFLOPS的FP32浮点性能和197TOPS的INT8 AI性能。显存方面，锐炫Pro B60配备了192bit位宽、19GbpsGDDR6显存，显存带宽高达456GB/s，显存容量达到24GB。更重要的是，相比同等显存规格的NVIDIAAI加速卡，锐炫Pro B60的售价更具优势，使其成为构建96GB（4卡）到192GB（8卡）超大显存池最具性价比的方案。本次评测的长城世恒X-AIGC工作站，搭载了4张锐炫Pro B60显卡，总显存达到96GB。

　　为了验证其AI推理能力，我们对长城世恒X-AIGC工作站进行了GPT-OSS-120B模型Kaiyun官方入口的测试。该模型是OpenAI首个开源的千亿级参数模型，总参数量高达1170亿。测试结果显示，在MXFP4混合精度下，4卡并联运行GPT-OSS-120B模型表现出色。即使在并发数为1的情况下，请求成功率也达到100%，TTFT（首字延迟）仅为91.37ms，平均ITL（逐词延迟）为32.01ms，输出吞吐量达到184tok/s。随着并发数的增加，系统吞吐量呈现指数级增长，在并发60时，吞吐量达到701tok/s。这意味着，这套系统理论上可以支持70个用户同时请求回答。如果按照1:15的活跃比计算，这台工作站可以支持1000人同时在线聊天，满足了其宣传的目标。

　　英特尔锐炫Pro B60凭借其强大的性能和极具竞争力的价格，为构建高性能本地LLM推理站提供了新的选择。它不仅能够运行千亿级参数模型，还能满足大规模并发需求。对于想要涉足AI推理的企业和个人用户来说，锐炫Pro B60无疑是一个值得考虑的选项。那么，在AI技术持续发展的今天，这类高性价比的AI加速方案，是否会成为未来AI应用的主流选择？欢迎在评论区留下您的看法。