

2025年末,中国移动在智算运营领域有了大动作——行业首创的“智算推理集群运营黄金标准”正式发布。
现在,人工智能正从集中式的“模型训练”阶段,快速进入大规模“推理部署”阶段。
这背后,AI算力需求正在发生深刻变化:推理算力占比越来越高,已经成了智算基础设施的核心负载。
然而,一个亟待解决的难题摆在面前——面对用户对更高性能、更优体验与更低成本的Kaiyun复合诉求,行业仍缺乏统一的运营标准。
长期以来,智算行业的竞争都停留在拼硬件的阶段。企业们都在比谁的AI加速卡多、算力规模大,却没人关注这些贵价硬件是不是真的用到位了。这也是中国移动推出“智算推理集群运营黄金标准”的核心原因。
这套“黄金标准”的核心思路是“用数据度量打破困局”,第一次拿出了一套可量化、可评估、还能重复使用的集群运营指标体系。通过实时监控推理集群的运行情况,在保证关键体验达标的基础上,精准找到最先出现性能瓶颈的硬件资源指标。
中国移动专门测试了多种主流模型在不同业务负载下的表现,结果发现,在不同的推理负载场景下,算力利用率、显存利用率、显存带宽利用率和KVCache利用率这四项硬件指标的增长速度差别很大。
这就意味着,以前靠感觉、凭简单规则做扩容决策的方式,要被数据驱动的精准判断取代了。
企业只要靠着“黄金指标”的实时监控,就能清楚掌握集群运行状态,把运营做得更精细。
其实中国移动在AI领域早就多方面布局了。2025年10月,移动发布了“AI+”行动计划升级版本,还成立了“AI+”生态联盟,目的就是全面提升经济社会的智能化水平,带动形成一个千亿级规模的产业新生态。
这个计划包含五大主线项具体工作,涉及智算底座搭建、九天模型升级、数据沉淀汇聚、安全治理能力建设、标准制定等多个方向。
中国移动的定位很明确,就是“人工智能供给者、汇聚者、运营者”三位一体。这不仅说明他们是算力的提供者,更要做标准的制定者、生态的搭建者和应用的赋能者。
能拿出这样的标准,离不开中国移动在新型信息基础设施领域的长期积累。目前他们已经在呼和浩特和哈尔滨,建成了两个全球运营商里规模最大的智算中心。
具体来说,呼和浩特的是全球运营商中最大的单体智算中心,智能算力规模有1.9万卡;哈尔滨的则是最大的单集群智算中心,单集群的AI加速卡就超过1.8万张。
数据显示,到2025年上半年,中国移动可调度的智算规模已经达到61.3 EFLOPS,其中自己建的智算规模有33.3 EFLOPS。按照计划,到2028年底,他们要把全国产的智能算力规模提升到100 EFLOPS以上。
从以前拼“谁的AI加速卡多”的硬件竞赛,到现在牵头定义“怎么把每张卡用到位”的运营效率标准,中国移动显然在布局长远。
对用户来说,这绝对是个好消息——当供应商都开始比拼怎么让你的每一分钱都能买到更多有效智能时,真正普惠的AI时代才能来得更快。返回搜狐,查看更多