

随着国内掀起“全民养虾”热潮,人们逐渐发现,算力才是数字化转型的“硬通货”。然而,随着LLM、Agent应用爆发式增长,企业却纷纷陷入了焦虑。
当前,8卡服务器是主流,在模型研发初期,它能从容承接小模型训练、轻量推理及原型验证等需求,是入门利器。可当AI产业迈入商业化深水区,8卡服务器的局限性便彻底暴露,沦为发展瓶颈。有人试图通过堆卡解决问题,可动辄数百卡、上千卡的大规模超节点集群,对绝大多数企业而言都堪称天文数字。
算力瓶颈已成为企业数字化转型的“拦路虎”。在此背景下,中科曙光3月26日在中关村论坛发布的世界首个无线缆箱式超节点scaleX40,就尤其值得关注。对此,行业人士分析,在8卡的性能瓶颈与大集群的高成本之间,定位在普及型超节点的sacleX40有望快速填补市场空白,成为破局关键。
首先,传统8卡服务器因部署简便、成本可控,一度成为企业的主流优选。不过,随着大模型参数量向千亿、万亿发展,MoE架构成为主流,8卡服务器开始显存容量吃紧、多骤机协同效率降、并发推理能力不足,很明显不够用了。此外,传统8卡服务器还有高TCO、升级改造复杂、适配难度大等多重问题,已难以满足日益增长的AI训练与推理需求。就像用手机处理简单日常工作没啥问题,但想做点复杂工作,哪怕多买几部手机拼一起也解决不了问题,除非换PC。
其次,很多企业认为只要不断堆料,粗暴叠加卡的数量就能解决问题了。且不说上Kaiyun科技有限公司百卡乃至数百卡的集群采购成本足够烧光公司几年的预算,后续的机房、运维、电力成本也非常巨大,对绝大多数都过于昂贵,根本难以负担。实际上,对这些公司来说,几十卡已经足够,就算手持上百卡,大多时候系统也会闲置。就像每天拉几十吨货跑,一辆货车装不下,但也犯不上买火车。
最后,不少人转而选择云算力,看似灵活省心,可长期高频使用下来,按次计费的成本居高不下,综合算下来并不划算,也难以支撑稳定、规模化的业务运行。更重要的是,最近短短三个月内,AWS、谷歌云等厂商集体重塑定价策略,半年前AI创业者还能跟云厂商谈折扣,现在能拿到配额就不错了。
如果你时刻关注行业,可以看到迄今至少有8家厂商推出了自己的“超节点技术”。产品规格也不断冲高,规模从64到上百,价格门槛层层抬升,但在这背后,真的能让中小企业买得起、能落地的产品反而成为稀缺品。
行业普遍认为,超节点规模存在性能收益边际递减,32卡~256卡为高性价比投资“甜点区”,越往大规模靠拢,性能冗余越多,资源浪费也越严重。
32卡是千亿级模型商业化落地的基本门槛,能覆盖更广泛的行业级应用,显存池可完整承载模型、梯度与训练数据,既能支撑千亿模型训练,也能满足中等并发推理,是兼顾性能与成本的实用配置。
不过,企业业务始终动态变化,模型规模与并发量随时可能大幅提升,需要在32卡的基础上进一步拓展能力边界。此时就存在一个兼顾性能与成本的“算力甜点区”,不仅能够将采购门槛从“亿元级”拉低至“千万级”,同时适配90%企业场景。
“算力甜点区”的存在并非秘密,但市场上真正落地又好用的产品却寥寥无几。中科曙光便推出了全球首个箱式无线,让超节点成为中国算力标配。
在此之前,曙光发布了面向大规模算力需求的超节点scaleX640,证明了自身在“大算力”领域的实力。然而,要让更多企业真正享受到超节点的技术红利,就必须向下兼容,这正是scaleX40的使命。从scaleX640的极致性能到scaleX40的普及落地,曙光实现了从“顶配”到“标配”的全场景覆盖。
scaleX40采用标准19英寸箱式设计,打破传统柜式超节点的高门槛,以无线缆、即插即用为特色,让企业无需改造机房、无需专业运维即可拥有超节点级算力。为了能够一站式搞定超节点运维管理、大模型和智能体开发,曙光还推出了SothisAI平台。
scaleX40的目标场景包括互联网、金融、科教、电网、医疗、运营商Kaiyun科技有限公司六大领域,典型应用比如,智能客服、智能投研、风险控制、网络故障预测、医学影像辅助、虚拟实验、智能教学等。
scaleX40超节点共有五个亮点:一是内置40张AI加速卡,总算力超过28 PFLOPS(FP8精度),总显存超过5TB,访存带宽突破80TB/s;二是40张加速卡实现一级Scale-Up全互连,持内存语义与统一显存编址,聚合带宽超过17TB/s;三是采用正交架构,相比传统铜缆方案可用性提升10倍,对比光纤连接功耗降低40%~70%;四是设备尺寸采用标准19英寸规格,兼容主流机柜,支持单柜单Pod或单柜双Pod的灵活部署方式;五是开箱即用,兼容主流软件生态,拥有配套的开发工具、基础软件、AI大模型与应用,用户可轻松完成大模型迁移,开箱即用。
与传统8卡机方案相比,scaleX40在成本几乎持平的前提下,训练性能提升20%,推理性能更是大幅提升40%。与组合柜式超节点相比,采购门槛数量级下降。
值得一提的是,通过“scaleX40(计算)+ ScaleFabric(网络)+ ParaStor F9000(存储)”的存算传三级强协同技术架构,训推带宽提升2倍以上,大模型推理TTFT降低97%,GPU利用率提升,KV cache offload卸载显存压力。
此外,scaleX40也支持OpenClaw私有化部署,为每位用户提供专属AI智能助手,联动平台skill、API及Agent,实现超节点高效管理与应用。
最佳算力不是最贵的,而是最匹配业务的,理性选型的核心是“刚刚好”。40卡之所以成为行业共识,正是因为它既足够敏捷,又在“够用”与“不浪费”之间找到了黄金平衡点。
scaleX40的发布,一方面定义了性能上限,展现了顶尖的互连拓扑与集成能力,为多种AGI技术路线提供了极致算力支撑,另一方面提升了全系标准,其核心架构(统一互连、全局内存、异构支持)将惠及整个产品矩阵,确保客户无论从小规模起步验证技术路线,还是扩展至大规模部署,都能获得一致的体验。
这意味着,无论客户的集群规模大小、技术路线如何选择,都能依托源自同一技术蓝图的先进架构优势,获得适配自身需求的最优方案。
更重要的是,scaleX40在性能与成本间取得平衡,向下可兼容32卡配置,向上则可通过扩展构建更大规模的集群,这种灵活性,使企业能够根据自身业务节奏分步投入,而非一次性押注。
技术的价值一定要回归千行百业,喧嚣退去,务实才是长久之道,曙光的scaleX40无疑做到了这一点。
特朗普称“卸任后可能去委内瑞拉竞选总统”,旁边的人听完忍不住笑了,曾称“被伊朗邀请当最高领袖”自己婉拒了:我才不想当
当地时间3月26日,美国总统特朗普在内阁会议提及委内瑞拉问题时,声称委内瑞拉人“很喜欢自己”。特朗普称,在自己总统任期结束后,“可能会去委内瑞拉竞选总统”。
在中国货币史上,四川钱币品类独特、文化内涵丰富,从先秦至近现代,产生了成百上千种独特的钱币,其中不少在全国甚至世界范围内都具有开创意义,其丰富性、独特性和创新性,对于今日之社会治理、金融建设,仍具有启迪价值。
健身舞蹈《We Rock to Chengdu》上线!跳着跳着就瘦了丨运动健身课程⑪
春季塑形进行时拒绝器械虐练跳着舞就能瘦还能解锁成都专属氛围感运动健身课程第11期续档持续带你跳着瘦别再靠枯燥器械硬扛减脂了!
省直机关女工程师被境外情人策反,拉着副县长丈夫当间谍17年,被明确要求搜集涉密红头文件
上海浦东公安分局洋泾派出所。接到一名女孩的报案。刚下飞机就匆匆赶来。刘文一开始没有多想,后来临近期末考试,她无意间刷到了对方的一条朋友圈,说可以提供真题和解析。
川观新闻记者 钟帆汇聚多方力量,为“星星的孩子”筑就温暖港湾。3月26日,在成都市孤独症儿童教育康复研究与指导工作启动会上,来自教育、医疗、社会领域的代表携手建立“医教康社”联合体,并发布《成都市孤独症学生教育与发展指南(试行)》。
摆了特朗普一道,结束与中方通线号晚上,特朗普在社交媒体上撂下狠线小时最后通牒,说只要伊朗不无条件开放霍尔木兹海峡,就把伊朗所有发电厂全摧毁。
三部长会晤结束没几天,中越军舰已经在北部湾开火射击、联合搜救,这节奏有多快,基本不用翻译了。越南给中国的信号就一句话:话不是白说的,“同志加兄弟”不只挂嘴上,是真肯拿军队和安全部门一起下水的。
3月20日,长和集团(长江和记实业)联合董事总经理陆法兰,在公司2025年度全年业绩报告记者会上,对外放出了一个极其头铁的信号。他公开表示,长和将按照原定计划,继续与美国资产管理巨头贝莱德牵头的买方财团,以及来自内地的重大金融战略投资者,就出售全球港口事宜进行磋商。
公元234年秋,五丈原的秋风裹挟着肃杀之气,病榻上的诸葛亮强撑着最后一丝气力,将手书《自表后主》递给侍从。当众人以为这位“出师未捷身先死”的丞相要交代身后事时,他却突然挣扎起身,用尽全身力气喊出21个字:“成都有桑八百株,薄田十五顷,子弟衣食,自有余饶!