

2025年上半年营收9.15亿元;截至2025年9月在手订单14.3亿元
据悉,沐曦股份正在研发中的下一代旗舰产品C700,在计算能力、存储能力、通信能力、能效比等方面,预计会接近英伟达的旗舰H100,未来可能在应用市场取得进一步突破。
壁仞科技则汇聚多巨头技术基因,专注高端通用GPU,目标是成为“国家算力基建的核心供应商”。其选择原创架构追求极致算力,是国内首家采用2.5D芯粒(Chiplet)技术封装双AI计算裸晶的企业,在先进制程受限背景下,通过不同工艺节点组合实现性能突破。其产品BR100芯片算力可以与英伟达A100相较,支持FP32/FP16/INT8等多精度计算,适用于超大规模集群,目前已在中国电信落地千卡集群,实现国内首个商业化异构混训方案。
目前,壁仞商业化还在发力阶段:2024年营收3.37亿元,2025年上半年营收5,890万元。不过,壁仞科技下一代旗舰芯片BR20X预计将于2026年实现商业化上市,可能成为中国高端GPGPU芯片产业发展的重要里程碑,或将推动壁仞科技在商业化上取得重要进展。
此外,天数智芯是国内首家实现7nmGPGPU量产的企业,并以通用GPU量产先锋为重要标签,其核心团队具备AMD技术背景,主要产品涵盖天垓(训练)及智铠(推理)系列,覆盖Kaiyun官方入口通用计算、AI训练推理等多元场景,其中天垓100支持超200个AI模型训练,专注AI推理的智铠系列能效比远超国际产品。截至2025年6月30日,天数智芯的产品已在超过290家客户中完成超900次实际部署,在互联网、智能制造等垂直领域兼容性测试通过率高。这促使其商业化有不俗表现:2024年营收5.39亿元,2025年上半年营收3.24亿元。
在各具特色的差异化竞争基础上,国产GPU“四小龙”的齐头并进意义重大,包括打破海外巨头垄断,保障关键领域算力安全,夯实自主可控基础;差异化路径形成产业协同,加速国GPU从“可用”向“好用”跨越,完善半导体产业链;推动技术创新与生态构建,吸引资本加注形成良性循环,为数字经济发展注入核心动能,提升我国在全球算力领域话语权。
在“四小龙”密集上市之际,国产GPU产业正站在发展的关键十字路口,政策、市场、技术多重机遇叠加,为产业崛起提供了广阔空间,但同时也面临着技术壁垒、生态建设、供应链安全等多重挑战。如何把握机遇、应对挑战,直接决定着国产GPU能否实现从跟跑到并跑再到领跑的跨越,从而真正构建起自主可控且生态成熟的产业体系。
目前,AI大模型迭代、边缘计算等新兴场景催生爆发式算力需求,预计2029年中国加速服务器市场规模将突破千亿美元,为国产GPU创造差异化发展空间。另一方面,国家“东数西算”工程推进与半导体产业政策扶持,叠加国内晶圆制造、先进封装技术突破,降低了国产GPU对先进制程的依赖,同时提供了宝贵的市场验证与迭代机会。此外,开源生态发展与“模芯生态创新联盟”等平台搭建,打通全链路技术,助力国产生态加速成熟。
为抢抓历史性机遇,除了处于国产AI芯片第一梯队的寒武纪、海光信息以及“四小龙”之外,这一赛道还涌现出一批具备核心竞争力的企业,通过深耕细分场景形成差异化优势,与头部企业共同构建起多层次的产业生态。这些企业或聚焦特定应用领域,或在技术路线上另辟蹊径,抢占AI推理、工业自动化、元宇宙等细分市场,为国产GPU产业注入多元活力。
其中,燧原科技是云端AI推理领域的领军企业,当前处于上市辅导期,预计2026年申报A股。目前,燧原科技已自研迭代四代架构5款云端AI芯片,构建覆盖AI芯片、AI加速卡及模组、智算系统及集群和AI计算及编程软件平台的产品体系。据悉,其第三代AI加速卡产品“燧原S60”于2024年下半年量产,已经实现7万卡落地规模,处于国产卡落地规模方第一梯队。第四代训推一体产品“燧原L600”,国内首创原生FP8低精度算力,拥有144GB存储容量、3.6TB/s存储带宽、800GB/s互联带宽,可有效支撑国产通用大模型训练与推理。
景嘉微作为国产GPU先行者,在特种垂直领域占据领先地位。其自主研发的JM9系列GPU性能接近英伟达GeForceGTX1050,打破了海外产品在特种图形算力领域的垄断,已实现规模化应用,覆盖图形处理、数据计算等场景,凭借稳定的可靠性和适配性,在特种计算机市场建立起深厚Kaiyun官方入口壁垒。近年来,景嘉微还积极拓展民用市场,推出性能持续提升且面向桌面端和服务器的通用GPU产品,已适配多款国产操作系统和应用软件,生态兼容性不断完善。
此外,砺算科技以全自研路径突破高端图形渲染市场,其自研的7G100系列采用台积电6nm制程,搭载全自主设计的TrueGPU天图架构和指令集,理论算力达120TFLOPS(FP16),在GeekbenchOpenCL测试中性能超越英伟达RTX4060。该产品已完成首批数字孪生领域订单交付,可流畅运行国产3A大作并适配DeepSeek等AI大模型,通过“存储+计算”的产业链协同模式,降低了研发成本并提升了产品性能,目前已经开始首批订单交付。
同时,部分互联网大厂也在通过积极布局AI芯片并“由内而外”打通产品应用体系。其中,阿里平头哥依托阿里生态专注云端AI与物联网,主要产品PPU性能达英伟达H20水平,在特定应用场景下能效比和性价比优势明显。其含光800专注AI推理,适用于阿里内部及生态企业。百度昆仑芯依托百度生态,专注搜索、推荐、自动驾驶,主要产品昆仑芯2代性能突出且支持训推一体,在内部场景充分验证后向外部开放供应。目前,百度智能云采用昆仑芯P800芯片建成万卡集群,支持搜索广告、推荐系统等场景,主要服务百度内部及生态企业。
值得注意的是,瀚博半导体、芯动科技、登临科技、芯瞳半导体等一批国产 GPU 生力军,并未盲从同质化竞争的路线,而是锚定和深耕差异化赛道。各家企业立足自身技术基因与市场需求,分别在 AI 视频编解码加速、高性能高端显卡自主研发、GPU 集群高速互联技术攻关、国产芯片软硬件生态深度适配等领域打造出独树一帜的特色优势,正通过这条错位发展的差异化路径,不断丰富国产 GPU 产业的创新版图,为行业发展与突破注入多元活力。
国产GPU“四小龙”齐聚资本市场,标志着产业发展正式迈入资本化、规模化的全新阶段。这不仅是企业自身商业化落地的里程碑,更折射出资本市场对国产GPU赛道的重要认可,为后续技术研发、生态建设注入充足资金动能,加速推动国产算力从替代突围迈向全球性竞争。
然而,在全球人工智能产业的激烈竞争与博弈中,国产GPU产业面临的挑战同样不容忽视。例如技术层面,与英伟达等海外巨头相比,国产GPU在先进制程、算力密度、能效比等核心指标上仍存在差距,单卡性能不足的问题在高端场景中明显,且核心技术研发需要长期巨额投入。生态层面,英伟达CUDA生态全球开发者数量超600万名,构建了牢固的竞争壁垒,国产GPU面临软件适配不足、开发者数量少等问题,生态建设需要长期投入与积累。商业化层面,多数企业收入规模有限,仍处于亏损状态,未来估值终将回归业务本质,考验企业长期盈利能力与价值创造能力。同时还存在应链稳定性、人才短缺和内部竞争激烈等挑战。
但在需求驱动、政策支持、技术创新与资本赋能的多重合力下,国产GPU产业必将突破重重壁垒。短期看,国产GPU将在推理端、专用算力等特定场景实现突破,逐步替代海外产品,同时资本市场助力关键技术攻关。中期而言,生态将趋成熟,通过产业协同、开源社区、校企合作强化软件适配,形成“芯片—软件—应用”良性循环,系统级解决方案创新和适配成差异化关键。长期来看,在自主体系逐步建成后,国产GPU有望实现从“替代”到“引领”跨越,为中国数字经济发展提供坚实的核心算力支撑,并在全球算力竞争中占据重要地位。