

2026年3月24日,阿里巴巴达摩院在上海发布了新一代旗舰CPU玄铁C950,这是全球第一款原生支持千亿参数大模型的CPU,基于RISC-V开源架构,单核通用性能在SPECint2006基准测试中首次突破70分,刷新了RISC-V的全球性能纪录。
发布会上,达摩院同步推出了两款RISC-V原生AI计算引擎:Vector加速引擎和Matrix加速引擎,与玄铁CPU统一编址,可流畅运行Qwen3-235B-A22B、DeepSeek V3-671B等千亿参数模型。与C950一同亮相的,还有高能效版CPU玄铁C925、以及支持芯片企业自定义修改玄铁IP的Flex可扩展平台。至此,C925、C930、C950构成了达摩院玄铁完整的服务器级产品矩阵,覆盖从边缘到高端的全场景。
这不只是一次产品更新。这颗芯片的意义在于,它替阿里回答了一个困扰中国AI产业多年的问题:当你有了自己的大模型、自己的AI加速卡,你凭什么把CPU也换成自己的?
2018年,阿里巴巴全资收购了大陆唯一拥有自主嵌入式CPU IP核的公司:杭州中天微系统。同年云栖大会上,时任CTO张建锋宣布将达摩院内部芯片团队与中天微合并,成立独立运营的芯片公司平头哥半导体。这是阿里造芯事业的正式起点。
从那时起,平头哥的产品线年发布了RISC-V处理器玄铁910与AI推理芯片含光800;2021年发布了基于ARMv9架构的云原生服务器芯片倚天710;此后又陆续推出多款覆盖存储、网络、AI加速的芯片产品,并有PPU(处理器单元)进入中国新增AI算力市场。
表面答案是降本:阿里的业务版图横跨电商、物流、云计算,规模化的芯片需求足以支撑自研的投入回收。但更深层的驱动力是算力主权与全栈协同的迫切性。
自研的AI加速卡如果依赖别人的CPU来调度,硬件之间就无法按设计意图协同,整体系统的商业交付竞争力会被拖累。英伟达早就看清了这个逻辑,推出了自己的ARM架构CPU Grace,与GPU一体化交付,形成从芯片到系统的完整算力底座。要想做出与英伟达竞争的AI基础设施,就必须有自己的高性能CPU。
AI Agent时代进一步放大了这一需求。万卡互联集群对CPU的调度能力要求极高;一个性能不足的CPU,会成为整个集群的瓶颈,拖慢AI推理的吞吐效率。玄铁C950,正是补上这块短板的关键一步。
这也契合阿里更宏观的战略布局。2025年,阿里巴巴集团CEO吴泳铭宣布未来三年投入超过3800亿元用于云和AI硬件基础设施,总额超过此前十年总和,集团AI战略的首要目标直指AGI。玄铁作为达摩院内部唯一基于RISC-V的自研芯片业务,也是达摩院唯一可盈利的业务线,与这一目标高度对齐。
理解了为什么造芯,还需要理解另一个选择:为什么是RISC-V,而不是ARM或x86?
RISC-V(精简指令集计算架构第五代)是一套诞生于2010年前后的开源指令集架构,由加州大学伯克利分校发起,任何人都可以免费使用和修改,无需支付专利许可费。
RISC-V长期以来有一道难以逾越的门槛:性能天花板太低,生态太薄。在相当长的时间里,它只活跃在物联网、嵌入式控制等低功耗领域,没有人认为它能与x86或ARM在高性能计算市场正面竞争。
达摩院首席科学家孟建熠在2026年玄铁生态大会上直接点出了这一矛盾:在走向生态繁荣的路上,RISC-V需要迎接通用计算和AI计算两场攻坚战。虽然RISC-V广泛渗透进智能终端、汽车、家电、通信等领域,但长期存在性能不足和软件生态壁垒。
C950采用8指令译码、16级流水线条指令乱序窗口,最高主频3.2GHz,单核通用性能在SPECint2006基准测试中首次突破70分。70分是什么概念?当前英特尔等主流服务器CPU普遍在100到110分区间,而70分大致相当于五六年前苹果M1芯片的成绩,那一代芯片曾被认为彻底颠覆了PC性能的标杆预期。
这意味着RISC-V在高性能服务器领域,终于有了一款可以与主流产品同台竞技的产品。
爱丁堡大学高级研究员Nick Brown是首批试用C950的国际用户之一,他在大会现场表示,这是第一款可以对标市面上主流服务器级别产品的RISC-V CPU。
性能突破之外,RISC-V开源的本质属性,对中国科技企业有着非常现实的意义。x86架构由英特尔与AMD共同控制,ARM架构由英国ARM公司授权,两者都有被断供的风险,2020年前后ARM曾向部分中国企业收紧授权。RISC-V的开源特性从根本上规避了这一风险——没有任何单一国家或公司可以卡断这套架构的使用权。
RISC-V另一个被低估的优势是可定制性。x86和ARM指令集经过几十年的积累,体量庞大且有大量历史包袱;RISC-V天生精简,允许芯片设计者根据自身场景扩展专用指令。玄铁C950搭载自研Vector加速引擎和Matrix加速引擎,与CPU统Kaiyun科技有限公司一编址,本质上就是利用了这种可扩展性,把通用算力与AI算力深度融合,而不是以外挂协处理器的方式叠加。
市场趋势也验证了这一方向。据行业分析机构SHD Group预测,到2031年,全球RISC-V设备出货量将激增至360亿颗,年复合增长率高达31.7%,市场规模超3000亿美元。中国工程院院士倪光南在大会上给出了一个更直接的数字:截至2025年底,RISC-V在全球芯片市场的份额已突破25%,x86与ARM的双寡头格局正在松动。
玄铁系列自2019年首发以来,已陆续推出16款覆盖嵌入式到服务器领域的CPU IP,250多款芯片投入量产,落地近千款热门终端产品,全球合作伙伴超过400家。
从产品角度看,玄铁C950的意义不只是又一款高性能CPU,它是阿里AI算力全栈布局里最晚到位的一块。
过去几年,阿里在AI芯片层面已经积累了含光800(AI推理)、PPU(AI训练/推理加速)、倚天710(基于ARM的服务器CPU)等产品。但倚天710基于ARMv9授权,并不对外销售,属于阿里云内部部署。玄铁C950则不同,它是一款可以通过IP授权方式向外部芯片设计企业输出的高性能RISC-V CPU,配合Flex可扩展平台,下游企业可以在玄铁基础上进行自定义修改,打造符合自身场景需求的专属CPU。
这套逻辑,与英伟达的全栈交付理念高度相似:不只卖算力,而是提供从CPU到AI加速引擎再到软件生态的完整方案。C950发布后,阿里具备了向外输出RISC-V算力全栈的能力。
软件生态的补全同样关键。达摩院与中国科学院软件研究所等机构联合发起了如意社区,共同优化AI和高性能通用计算软件栈,内核开源贡献率排名第一;还与openKylin合作打造RISC-V原生AI操作系统。在推理性能上,软硬件协同优化后的计算库性能较开源版本提升超30%,推理性能提升超40%。
DeepSeek的出现,进一步为RISC-V打开了窗口。DeepSeek在MoE(混合专家模型)架构上的创新,让大模型推理时被激活的参数量大幅下降,算力需求降至原先的二十分之一量级。这意味着以往只有顶级AI芯片才能流畅运行的千亿参数模型,现在在更广泛的硬件组合下都成为可能。
2026年3月24日,达摩院还与北京开源芯片研究院、中国科学院软件研究所签署战略合作协议,三方将联合研发下一代开源高性能RISC-V CPU香山,探索SMT(同时多线程)、片上互联、通推一体等关键技术。这意味着玄铁C950不是终点,而是阿里在RISC-V高性能计算路线上更大规Kaiyun科技有限公司模投入的起点。
一颗CPU,最终指向的是一套生态的线刷新全球RISC-V性能纪录,阿里用八年时间,从嵌入式芯片走到了服务器级高性能CPU。RISC-V在中国的故事,已经进入一个新的章节——不再是备选,而是认真参与竞争的主角之一。返回搜狐,查看更多