动态资讯 分类
算力不再稀缺?中国AI芯片供给出现反转 发布日期:2026-01-21 10:12:13 浏览次数:

  

算力不再稀缺?中国AI芯片供给出现反转(图1)

  “算力够不够”几乎是中国AI产业最普遍的焦虑。高端算力卡供应紧张、算力集群扩容受限、训练计划反复推迟,一度成为行业常态。但在靠近制造与交付的一端,变化正在发生,市场讨论的焦点开始从“还能不能买到算力”,转向“算力是否值得长期投入,以及新增算力能否被真实业务持续消化”。

  外部环境并未出现根本性变化,全球AI竞赛仍在加速推进,但国内算力市场的判断正在发生偏移。随着国产AI芯片进入集中交付阶段,自给率持续抬升。伯恩斯坦在其关于中国AI芯片供需的研究中测算,国产化率有望从2023年的约17%提升至2027年的约55%,并指出在部分阶段,供给增长速度可能快于需求释放,从而对价格体系形成压力。

  当算力供给不再被视为随时可能中断的稀缺资源,行业开始重新审视算力的使用效率、长期成本以及真实需求,中国AI芯片产业也由此进入新的竞争阶段。

  回到2020-2022年,彼时中国AI芯片自给率偏低并不意外。在一个高度全球化、以效率为导向的算力体系中,海外GPU几乎是唯一真正实现大规模工业化交付的标准产品。对头部互联网公司而言,采购芯片并不是简单购买硬件,而是引入一整套已经被反复验证的工程体系,包括软件生态、工具链、社区支持以及成熟的调优方法论。因此,低自给率并不完全等同于“国产芯片不可用”,更多反映的是在当时条件下,切换底层方案所面临的成本与风险并不对称。

  这也解释了一个常被忽略的事实,低自给率未必意味着做不出来,更多时候意味着切换不划算。大模型训练的成本结构,决定了这种选择背后存在显著风险,一旦训练失败,付出的代价往往远高于芯片采购本身。对于高度并行的训练任务而言,性能差距并非线性惩罚,而是会通过集群规模、通信开销和工程调度被持续放大,最终转化为成倍上升的时间和成本。

  从头部云厂商的产品布局中,也可以看到这一阶段的行业选择。2021年,阿里云上线面向AI训练和高性能计算场景的gn7系列云服务器,其核心配置采用英伟达A100 GPU;2022年5月,腾讯云发布新一代计算集群GT4,同样以A100 GPU 作为主要算力配置,面向大规模AI训练等高算力需求场景。这类产品主要服务于对性能和稳定性要求最为严苛的模型训练任务,也在一定程度上反映出,在当时的大模型训练阶段,公有云对外提供的高端算力服务,整体仍主要依赖海外GPU及其成熟的软件生态体系。

  从反面也能印证这一点。英伟达在出口管制前曾披露,来自中国及其他随后被纳入许可范围地区的相关产品,在过去几个季度中贡献了其数据中心业务收入的约20%-25%。这意味着,当时中国市场对海外GPU的依赖,并非边缘现象,而是深度嵌入全球算力供应体系的一部分。

  真正推动国产AI芯片自给率变化的,并不是哪一家厂商在性能上突然追平了海外产品,而是算力需求本身出现了结构性变化。

  过去几年,中国最集中的算力消耗几乎全部指向大模型训练。这类需求对单卡性能、软件生态和系统稳定性的要求极高,也最不适合在底层架构上频繁切换。即使国产芯片已经具备一定可用性,在这一阶段,也很难成为主力选择。

  随着AI应用从集中训练走向规模化部署,算力需求开始向推理端和行业应用扩散。无论是搜索、推荐,还是政企与行业场景,推理算力的消耗更加分散,也更贴近真实业务运行。这类场景对极限性能的敏感度相对较低,更看重单位成本、部署密度、系统稳定性以及长期运行能力。

  全国政协委员、飞腾信息技术有限公司副总经理郭御风举例指出,西方发达国家往往通过不断堆叠算力来提升大模型性能,而以DeepSeek 为代表的国内团队,则通过协同优化和系统潜力挖掘,在更小的算力规模下实现了相近效果。这意味着,即便在算力芯片仍存在差距的情况下,中国仍可以通过协同创新降低对算力规模的依赖,推动人工智能持续发展。

  中国信息通信研究院院长余晓晖在公开场合表示,随着人工智能应用从集中训练走向规模化部署,推理算力正逐步成为拉动算力增长的重要力量。在这一过程中,对算力稳定性、成本和可持续供给的要求上升,也为国产算力进入更多应用场景创造了现实条件。

  从整体规模看,算力需求并未降温。按照公开测算口径,以FP16智能加速卡性能计,中国智能算力在2024年已达到725 EFLOPS,同比增长超过七成,并预计在未来几年仍将保持较快增长。中国信通院等机构的测算也显示,在新增算力中,推理侧和行业应用相关算力的占比提升速度,已明显快于高端训练场景。

  外部环境的变化,进一步放大了这一趋势。出口限制并未直接压缩算力需求,却为海外方案增加了不确定性。短期补充算力或许还能应付,但对需要做中长期规划的企业而言,很难再将核心算力路线完全押在一个存在变数的供应体系上。于是,在采购决策中,一个新的考量逐渐被放大,算力能否持续供给,而不仅仅是性能是否领先。

  也正是在这一背景下,自给率的“分母”开始发生变化。过去决定自给率高低的,主要是那一小部分最难替代的训练需求;而现在,更多算力消耗来自行业应用、推理部署以及算力基础设施建设。当这些需求逐步成为算力增长的主要来源,自给率自然会上行,即便在高端训练领域仍然存在缺口。

  如果只从单个企业的采购决策来看,国产AI芯片的出货情况并不乐观。多数客户在切换上仍保持谨慎,落地节奏不快,核心训练任务依然主要由少数成熟方案承担。

  但近一两年,变化的关键不在于单个企业是否“愿意切换”,而在于国产芯片被纳入了更大的算力体系之中。需求结构的变化,让国产芯片有机会进入更多应用场景,而以算力池为代表的集中部署,则解决了这些算力如何被持续、大规模使用的问题。

  早期国产芯片往往围绕具体项目单独配置,一旦项目调整,算力就可能被闲置;而现在,越来越多的国产算力被统一纳入算力池,由平台集中调度,上层业务更关注算力服务是否稳定可用,而不再频繁放大底层芯片差异。

  在这一过程中,底层互联标准和生态开放程度,成为算力体系能否顺利扩展的重要因素。以华为为例,其近期宣布开放“灵衢”互联协议技术规范,允许上下游企业基于该协议研发光模块、交换机、服务器等配套产品,逐步形成“超节点硬件+ 软件工具链 + 行业解决方案”的完整产业链。业内人士认为,这种开放共建的模式,一方面可以避免重复研发和资源浪费,另一方面也有助于吸引芯片设计、算法优化和行业应用等领域的合作伙伴参与,推动国产算力生态在体系层面逐步完善。

  政策导向和大型项目的组织方式,进一步加快了这一进程。对不少算力基础设施而言,优先采用国产方案,已不仅是成本或性能层面的权衡,而是与项目合规要求、长期供给稳定性以及运维可控性直接相关。算力基础设施一旦建成,往往需要长期稳定运行,底层方案在规划阶段就已基本确定。

  这也解释了为什么,供给端的变化往往会先于需求端的直观感受显现。算力基础设施一旦投运,就需要持续填充并保持运行,国产芯片正是在这一过程中被不断使用和消化,自给率也逐步脱离单一市场博弈,更多与算力体系本身的扩张节奏绑定。

  需要指出的是,这并不意味着供给已经全面过剩。高端训练算力仍然存在短板,不同芯片之间在性能和生态上的差异依然明显。更准确地说,这一变化标志着产业正在进入新的阶段,算力供给不再完全依赖即时市场出清,而是通过算力体系的运行被持续吸收。

  随着国产AI芯片逐步被算力体系吸收,自给率持续抬升,产业关注的重点也在发生变化。最先变化的,并非技术短板是否消失,而是市场对算力紧张的预期正在减弱。一旦算力不再被视为随时可能断供的资源,企业在采购和部署时,关注点自然从“能不能拿到”,转向“值不值得长期用、能不能稳定跑”。

  在当前环境下,算力采购正逐渐呈现出长期投入的特征,需要反复测算整体成本和使用效率,选择权也在回到需求侧。

  竞争压力最先显现的,是推理芯片、定制化加速卡以及面向政企和行业应用的算力产品。这些领域对极限性能的依赖相对较低,多家厂商已能满足基本需求,产品差异逐渐收敛。客户在比较方案时,也不再只关注算力参数,而是更多考量价格、交付能力、运维支持以及长期运行成本。

  供给趋于充裕,也加速了产业内部的分化。一些厂商发现,产品虽然能够出货,但毛利水平难以支撑持续投入;另一些厂商则因客户结构过于集中,只要关键项目推进放缓,出货节奏便会受到明显影响。

  更深层次的变化在于,竞争的核心正在从单一产品转向整体能力。在算力紧缺阶段,市场对生态不完善、工具链不成熟的方案往往保持较高容忍度,只要芯片能够交付即可;而当算力供给趋于稳定后,开发效率、框架适配、迁移成本、调优支持、分布式兼容性以及长期维护能力,都会重新成为客户评估的重要因素。

  海光信息副总裁吴宗友表示,在国产化快速推进的过程中,芯片种类的快速增加反而给用户带来了新的负担,每一种芯片都需要单独适配、优化和维护,性能并不能直接转化为用户的实际收益。

  雷神科技董事长路凯林也提到,国产AI工作栈发展的瓶颈之一在于生态资源的丰富度。相比英伟达多年积累的生态体系,国产算力在硬件与软件的无缝衔接上仍存在差距。“生态的打通和生态的丰富度,是制约快速发展的重要因素,但好在这一问题正在加快突破。”

  当算力供给趋于稳定后,单点性能的重要性会相对下降,系统级效率、整体拥有成本以及长期运维能力,才是决定算力价值的关键因素。这一变化,正在推动算力竞争从“拼参数”转向“拼体系”。芯片本身依然凯云官网重要,但已经不再是唯一决定因素,竞争逐渐演变为不同算力体系之间的较量。

  需要看到的是,自给率提升并不意味着各个层级的供给都已充分,高端训练算力、先进封装及部分关键配套环节仍然紧张,当前出现的更像是一种结构性的供给变化而非全面宽松。也正因如此,供给反转并未让竞争变得轻松,竞争的重心正从性能指标和交付能力,转向体系效率、整体拥有成本(TCO)、长期运行稳定性以及生态持续演进能力,中国AI芯片产业也由此从“保供优先”逐步转向“效率优先”。

  供给反转不是终点,而是产业秩序重新调整的起点,在算力不再由稀缺性单独主导之后,真正决定行业走向的,将是谁能在长期运行中,把算力用好、把成本算清、把体系跑稳。