动态资讯 分类
美国商务考察英伟达AI算力与图形技术研学 发布日期:2026-02-24 08:52:18 浏览次数:

  

美国商务考察英伟达AI算力与图形技术研学(图1)

  一个叫黄仁勋的男孩出生。九岁那年,他和哥哥被父母送往美国,投奔华盛顿州的叔叔。

  临行前,母亲罗彩秀做了件外人看来近乎疯狂的事。这位只会说闽南语的小学教师,拿出一本英文字典,每天从里面随机挑出十个单词,让两个儿子背熟。她完全不懂这些词的意思,更不会检查发音对错。她只做一件事——坚持。

  这句话,后来支撑他走过无数次生死关口,最终把一家从餐馆餐巾纸上诞生的公司,带到五万亿美元市值之Kaiyun科技有限公司巅。

  三十岁的黄仁勋坐在卡座里,对面是两位Sun微系统的芯片工程师——克里斯·马拉考斯基和柯蒂斯·普里姆。三个人在餐巾纸上涂涂画画,讨论一个疯狂的想法:做一款能在PC上实现逼线D图形的芯片。

  1993年4月,三人凑了四万美元,在加州弗里蒙特注册成立公司。公司最初连名字都没有,所有文件上只写NV——next version。后来为了注册,他们翻拉丁词典,找到invidia,意为嫉妒。他们希望做出的产品,让对手嫉妒得眼睛发绿。

  黄仁勋是三人中最年轻的,只有三十岁。另外两人却推举他做CEO。普里姆后来解释:从第一天起,我们就基本上把决策权交给了他。

  创业的剧本,从来不是线年,英伟达推出第一款产品NV1。这款芯片同时拥有2D、3D图形处理和音频能力,看起来功能强大。但它基于方形绘图法开发,不兼容微软主推的三角形绘图标准Direct3D。售价贵,标准偏,销量惨淡。

  但NV1的集成方案吸引了一个大客户——日本世嘉。当时世嘉正与任天堂激战,需要下一代主机Dreamcast的图形芯片。世嘉豪掷700万美元,资助英伟达研发NV2。

  然而团队犯了一个致命错误:固执地坚持方形绘图路线,不向主流标准妥协。结果NV2研发失败,Dreamcast难产。700万美元烧完,产品出不来,资金链濒临断裂。公司账上只剩够发一个月工资的钱。

  黄仁勋做了一个艰难的决定。他飞往日本,面见世嘉社长入交昭一郎,坦诚相告:因我的错误,芯片已无继续开发的必要。

  多年后黄仁勋回忆这段往事,把它归结为正视错误,谦卑求助。他说,正是那次坦诚,让公司捡回一条命。

  濒临破产的危机感从此刻进骨子里。此后三十年,他在公司每月例会上必说一句话:

  这次,他们学乖了。RIVA 128是全球首款128位3D处理器,完全兼容微软Direct3D标准,性能是竞品的四倍。上市四个月,狂销100万片。

  1999年1月22日,英伟达在纳斯达克挂牌上市。同年8月,推出GeForce 256——世界上第一款GPU(图形处理器)。

  在此之前,3D渲染主要靠CPU运算,效率低下。GeForce 256把完整的3D几何变换、光照计算、渲染管线集成进单一芯片,让CPU可以腾出手干别的活。这不是一次性能提升,而是一次计算范式的转移。

  游戏开发者第一次可以自由发挥想象力。电影特效第一次可以在桌面电脑上渲染。虚拟现实第一次有了硬件底座。

  但黄仁勋心里装着另一个疯狂的想法:让GPU不仅能处理图形,还能做通用计算——科学计算、机器学习、密码学。如果这个想法成真,GPU将从一个图形加速卡,变成通用计算引擎。

  2006年,英伟达推出Tesla架构和CUDA(统一计算设备架构)。开发者可以用C语言直接在GPU上编程,调用上千个核心并行计算。

  CUDA开发的前五年,英伟达投入超过六亿美元。但营收跟不上,利润和股价持续低迷。投资人坐不住了,轮番找黄仁勋谈话,要求调整路线,砍掉这个战略浪费。

  黄仁勋顶住所有压力。他相信一件事:并行计算的时代终将到来,届时CUDA就是入场券。

  2012年,一个叫Alex Krizhevsky的学生用英伟达GPU训练了一个卷积神经网络,在ImageNet图像识别大赛中把错误率从25%直接降到15%,震惊学术界。那个网络叫AlexNet。

  2016年,OpenAI刚成立不久。黄仁勋亲自送去一台超级计算机DGX-1,在机箱上写下签名。那台超算后来训练出GPT。

  英伟达也想分一杯羹,推出Tegra系列移动处理器,用于手机和平板。但很快发现一个致命问题:GPU追求极致算力,功耗高、发热大。手机空间太小,散热跟不上,装上就发烫。

  这在外界看来是撤退,是认输。但他很清楚:当你的核心能力与战场不匹配时,越坚持越危险。

  从2006年Tesla架构开始,英伟达保持每两年左右更新一代架构的节奏。

  2008年Fermi,第一款带L1缓存和ECC纠错、面向超级计算机的架构。2012年Kepler,支持双精度计算,性能比Fermi提升三到四倍。2014年Maxwell,针对低功耗场景优化,每瓦性能翻倍。2016年Pascal,首个为深度学习设计的架构,支持主流深度学习框架。2017年Volta,引入Tensor Core,专门加速矩阵运算。2018年Turing,增加RT Core,支持光线年Ampere,新增对TF32和BF16的支持,优化稀疏矩阵Kaiyun科技有限公司计算。2022年Hopper,引入Transformer引擎,专为大模型优化。

  每一代架构,都是对下一代计算需求的预判。黄仁勋说,英伟达不是一家硬件公司,也不是软件公司,而是一家加速计算公司。

  2026年1月,英伟达开源自动驾驶模型Alpamayo。同月,与Uber达成合作,目标是2027年部署10万辆L4级自动驾驶出租车。

  这不是简单的芯片买卖。英伟达提供的是三台计算机:DGX用于云端训练AI模型,OVX用于仿真测试,AGX用于车端推理。

  车企买的不只是芯片,更是全栈解决方案。英伟达的工程师团队长期驻场,帮客户优化算法、跑通模型。这种教练式服务,让竞争对手很难撬动客户。

  黄仁勋说,中国是全球第二大计算市场,全球约50%的AI研究人员在中国。对于美国科技公司来说,进军这个市场至关重要。

  2025年10月29日,英伟达市值突破五万亿美元,成为全球首家达到这一市值的上市公司。

  从1993年Dennys餐厅的餐巾纸,到2025年五万亿美元市值,这中间隔着一连串的生死劫:

  NV1失败,差点破产;NV2失败,靠世嘉的宽容捡回一命;RIVA128翻身,GPU诞生;CUDA烧钱六年,投资人施压;移动芯片撤退,转型自动驾驶。

  这不是狂妄。这是三十年穿越无数生死后,养成的一种心法:把不可能,当作只是还没做到。

  那位不会说英语的母亲,用一本字典和一个信念,教会儿子最重要的事:比会不会更重要的,是敢不敢硬着头皮上。

  2026年,黄仁勋六十三岁。黑皮衣,皮靴,手臂上纹着英伟达logo。他依然每天工作14小时,没有固定办公室,在总部四处走动,随时坐下来开会。

  如果您也希望带领团队深入这片创新的源头,实地感受硅谷与英伟达的脉搏,我们诚挚邀请您关注我们的 美国商务考察 定制行程。在这场深度的 美国考察 之旅中,我们将带您走进硅谷科技巨头,与行业专家深度交流,探寻从车库创业到万亿市值的底层逻辑。特莱德游学 将为您搭建一座连接东西方商业智慧的桥梁,让每一次远行,都转化为企业生长的动力。