陈茜表示,未来21个月NVIDIA GPU订单预计收入10亿美元。刚刚召开的GTC大会上,黄仁勋就开始谈论芯片。他开始关注更雄心勃勃、更长期的市场蛋糕的更广泛故事:代币经济。在这篇文章中,我们解构了Nvidia的五层蛋糕生态系统。一万亿美元的收入如何计算?基于 Groq 的 LPU 为 NVIDIA 创造了哪些新机遇?黄仁勋在光通信和未来大规模人工智能工厂方面的先进设计也有机会。而在OpenClaw里程碑之后,NVIDIA所押注的通证经济将如何演变,又会给算力市场带来哪些挑战? (本文由视频剪辑而成,请务必观看下面的视频) 01 推理的临界点已达到多模态+OpenClaw。 Nvidia 2026 年 GTC 的故事基于两个背景和事件。一是AI的落地应用程序。其次,OpenClaw 的爆炸性采用推动了全球代理生态系统的发展。这使得黄仁勋在 GTC 的演讲中大喊推理的转折点已经到来。 Neocloud提供商GMI Cloud的创始人Alex Yeh在与我们的对话中透露,虽然北美需求的增长是由于多模态和程序化,但OpenClaw驱动的代币需求主要来自中国。 GMI Cloud 创始人 Alex Yeh 表示,用于推理的 token(词元素)的使用量急剧增加,并且呈指数级增长。我们的客户也从大规模培训客户端转向推理密集型边缘节点。 (在美国)一是以基因为中心的推理协调。代码生成,二是多模态图像和视频的生成。两者发展都太快了。就 OpenClaw 而言,我认为美国市场并没有真正意识到这有多大的影响。 Alex的观点与rece类似没有与硅谷的许多行业参与者进行讨论。这是因为北美用户,尤其是有技术经验的开发者,非常习惯使用Claude Cowork来执行一些代理任务。所以虽然OpenClaw在硅谷很流行,但在中国却不太流行。 Alex Yeh,GMI Cloud 创始人 我认为 OpenClaw 来自中国,并且已经开始在中国引起轰动,现在可以在 Mac mini 和 DGX Spark 上运行,但我不认为它是一个标准。因为这未来肯定会迁移到云端。毕竟,安装PC的成本太高了。我们看到硅谷的许多公司已经创建了无需代码且具有非常易于使用的用户界面的 OpenClaw。随着开源和闭源模型变得越来越好,查询的数量只会增加。所以我觉得我们还没有达到 1% 或 5%。但这只是开始,全球(计算能力)已经不复存在。 、未来发展代币调用规模非常可怕。以上是人工智能发展现状的大致脉络。由于两个趋势:推理需求的增加和OpenClaw的流行,黄仁勋整个演讲的逻辑与去年完全不同。英伟达过去向云制造商和人工智能公司出售芯片,但现在黄仁勋想向世界上每家公司出售代币。黄仁勋,NVIDIA 创始人兼首席执行官 世界上每家公司、每家软件公司都需要代理、代理策略、OpenClaw 策略。这也是我今年参加黄先生主题演讲时感受最深的。看PPT上的小爱心,可以看出黄的态度是“我们爱大家(拥抱大家)”。我明白。因此,今年GTC最重要的话题不是“芯片”而是“生态”。 GTC大会前几天,英伟达发表了一篇名为《AI五层蛋糕》的论文,为大会造势黄仁勋建议,今年的大会将强调垂直整合的能力和生态,而不是单个芯片。简而言之,黄仁勋为外界创造了更大的蛋糕。首先我们来谈谈黄仁勋在GTC演讲中提到的1万亿这个数字。 0.21万亿美元是过于保守还是过于乐观?黄仁勋去年在 GTC 上表示,当前和下一代 GPU 架构 Blackwell 和 Vera Rubin 的订单收入到 2026 年底将达到 5000 亿美元。这次,我们直接翻倍了这一预测,并表示仅 Blackwell 和 Vera Rubin 的订单收入现在预计到 2027 年底将直接达到 1 万亿美元。注意,这个收入不包括其他产品线的订单收入,例如新的 Nvidia CPU 或LPU芯片。基于Groq,仅针对GPU架构的订单。他在闭门记者会上特别澄清,造成这一情况的原因是内政部由此,外界可以直观地感受到NVIDIA GPU业务的增长。黄仁勋,NVIDIA 创始人兼首席执行官。如果我把这10亿的业务范围改成包括CPU、Groq和Storage,我的比较就不那么简单和直接了,因为它混淆了两个不同的东西。但对于其他人来说,10亿美元就很难理解了。您是否认为当 Nvidia 现在提供更多产品时,Blackwell 和 Vera Rubin 的总价值还不到 10 亿美元?不,恰恰相反。任阳 吉融投资联合创始人 首先,我认为这个数字是非常可以实现的。其次,这个数字是真实的。这是命令。我们可能会在几个月后重新审视这个数字。新订单将会到来,这个数百万美元的数字将继续增长。从财务分析的角度来看,它的意义告诉我们,2027年营收和盈利正在见底,这就是底部。然后,如果我们将这 1 万亿个数字代入模型,我们会发现2027年的底线EPS(每股收益)为13元或4元。 Guest认为,当谈到大型企业计算能力的CapEx(资本支出)时,它将继续增加。一方面,对推理的需求将不断增加,但另一方面,对训练的需求也不会随着尖端模型竞争的加剧而减少。图片来源:Business Insider 任洋 吉隆投资联合创始人 任洋 我认为增速会放缓,但毫无疑问仍在快速增长,而且我不认为年增长率的绝对值一定会下降。首先,推理的使用显然已经达到了拐点,每个人的代理和代币消耗都显着增加。其次,从模型制作者的角度来看,我认为这些尖端实验室中的任何一个都没有真正脱颖而出。大家轮流带头。就连大型开源模型也不甘落后专有的闭源模型。我认为模型制作者只有两个选择:扩大规模或创建一个应用程序,然后创建用户粘性并赚钱。或者通过应用程序。另一种方式是花比别人更多的钱,利用资产负债表和现金流优势与算力和人才竞争,希望实现模型的进步。一段时间以来,OpenAI 一直想走这条路,包括去年 Sam Altman 指出 1.4 万亿这样的数字。我想大家未来都会走这两条路,所以CapEx(资本支出)的投入并不小。为什么黄仁勋今年不强调单芯片,为什么连鲁宾和费曼都专注于下一代?我是否提到了一些关于计算机体系结构的内容?除了老黄希望将英伟达的企业故事提升为“AI工厂”并向所有人出售代币之外,现实是,由于产量上限,市场上的卡异常缺乏能力跟不上。目前市场上不可能买到最新的卡。 Inc.Luso的旧卡,如两三年前发布的“H100”和“H200”,使用几年后可以卖到比原价更高的价格。同时,软件生态和各种配置也跟不上老黄。因此,其强调提高单卡性能对于市场来说没有任何意义。钱玉晶 GMI 工程总监 市场上最成熟的平台仍然是 Hopper。 Blackwell近几个月开始进入大规模应用阶段,软件层也取得了比较好的进展。但回想起来,我认为这是因为Blackwell是两年前宣布的,目前的产能仍然不符合黄当时的预期。所以光是GPU销售收入10亿美元就不太乐观了,而且看来这样的需求确实存在。 。但是c显然,黄仁勋对这万亿日元并不满意。你所规划的是一个完整的生态系统。当代币成为商品时,“算力就等于收入”。黄仁勋的下一步就是灌输他对“AI五层蛋糕”的全部定义,让英伟达仍然是AI行业最赚钱的机器。 035 千层蛋糕同质化博弈与生态坑的拆除 第3.1章:五层蛋糕与“同质化” 范振勋定义的AI五层蛋糕是:从下往上,动力层(这里是电力等基础供应),然后是芯片层(NVIDIA的核心业务:卡),再往上是基础设施层(包括云提供商及其数据中心,细分为土地、能源供应、冷却系统和建设)。项目、网络通信等)。前三层是它们统称为AI Factory。它被称为。再往上,模型层包括OpenAI、G等顶级模型oogle Gemini、Anthropic,以及 NVIDIA 开发的一套开源模型。在应用层,英伟达开发了多个领域的技术,包括机器人、自动驾驶、工业制造、编程和企业级人工智能代理。我有些疑惑,老黄到底在策划一场什么样的比赛呢? Nvidia 可以使用这个五层蛋糕的所有层吗?任洋,吉融投资联合创始人。如果您可以将这些其他层商品化(同质化)或减少您的利润,请将这些利润集中在您的层上。这一层的瓶颈是谁,稀缺价值集中在哪里?过去几年,短缺的价值完全集中在芯片层面,因此虽然英伟达在这一轮中占据了收益和蛋糕的最大份额,但顶级公司仍然非常强大。嘉宾任彦认为,在每一层蛋糕中,如果所有玩家的水平都差不多,没有绝对的领导者或绝对的一旦垄断,这一层的好处就会被稀释。这就是所谓的“商品化(同质化)”。议价权最终回到了拥有绝对领导地位和垄断地位的层面:NVIDIA芯片层。换句话说,黄仁勋最终还是要依靠芯片销售。但除其他重要因素外,NVIDIA 必须支持自己的软件生态系统并定义其规则。就像建立CUDA这样的护城河一样,当一个新的市场定义了一个范式时,市场就会爆炸,每个人都意识到最好使用的平台是NVIDIA,最后买的就是计算能力和NVIDIA卡。例如,Nvidia 已经意识到,像 Google Cloud 和 AWS 这样的云提供商在基础设施层面(以及云平台)具有很大的竞争议价能力。再比如,在模型层,NVIDIA开放了很多大大小小的模型,但黄仁勋这次专门组织了全球核心开源模型论坛来破坏SOTA(state of the art, top level)在长期模型层。议价能力与一流的闭源模型的比较。在应用层,NVIDIA也在推进机器人和自动驾驶的发展,等待产业大规模爆发,预建生态利基。任洋,吉融投资联合创始人。如果英伟达能够鼓励或带领开源社区快速迭代,代币的价格将会下降。 Anthropic和OpenAI通过API、推理和代币销售赚钱,但如果开源模型能够以10%的价格实现来自领先实验室的尖端代币90%的模型性能,那么这些代币的价格肯定会下降。然后,模型销售、推理销售和代币销售层层商品化(同质化),整个生态系统的最终收入流又回到了英伟达。因此,虽然老黄总是关注饼的其他层,但最赚钱的永远是筹码层。瑟尔此前,这是黄仁勋最关注的群体。在此 GTC 中传输了两个信号。第3.2章:基于Groq的ASIC反击的第一个迹象是在芯片层。老黄发布了一款基于Groq的LPU。如您所知,Groq 的非独家技术许可交易是在去年 12 月圣诞节前夕宣布的,耗资 200 亿美元现金,使其成为 Nvidia 有史以来最大的交易。 Groq 创始人乔纳森·罗斯 (Jonathan Ross) 在接受《福布斯》最新采访时爆料称,与 Groq 的交易是老黄在短短三周内迅速做出的决定。 GTC?虽然只有三个月的时间,但产品已经推向市场。我只能说,老黄和英伟达绝对没有任何关系。那么为什么要“包含”Groq呢?简单来说,就是GPU的架构。即使维拉·鲁宾(Vera Rubin)实力强大,她也擅长高性能并行计算。它非常适合预填充(上下文预处理g)和注意力(计算注意力),但对于超快速令牌生成(解码)的任务来说不是那么强大。令牌生成的特殊性在于一次只能生成一个,因此整个过程必须是串行链,并且对每一步的延迟非常敏感。因此,“高吞吐量”和“低延迟”是自相矛盾的,很难同时实现。 Groq 解决了这个矛盾。 Graham Steele NVIDIA Staff LPX 在参与率非常高的场景中表现出色。 Rubin 非常适合单独处理大多数推理工作负载,但当涉及非常大的模型、非常长的上下文和非常高的交互性时,LPX 就可以发挥作用,并进一步为 Vera Rubin 提供支持。 Groq 采用 SRAM(静态随机存取存储器)设计,自然非常适合推理和令牌生成。类似于 Groq 创始人 Ross 的类比,启发了 Jensen Huang,他说:大型 GPU 就像“18 轮车”,但推理任务是例如“最后一英里交付”,更适合更灵活、更高效的货车。他告诉老黄,最好的答案是,如果你想为美国建立一个物流网络,你既需要卡车,也需要18轮货车。在后OpenClaw代理时代,老黄通过与Groq的深度技术和人才合作,解决了代币生成的挑战。这是非常重要的一步。 NVIDIA表示,一旦Groq的新芯片集成到NVIDIA系统中,将额外开辟3000亿美元的市场。这200亿花得值。然而,仍然存在一个小内存问题。 SRAM有以下缺点:一是价格昂贵,二是占用空间大,三是容量不大。单个 Groq 3 LPU 仅具有 500 MB SRAM,而 Rubin GPU 具有 288 GB HBM4。相差超过500倍,无法存储数十亿参数的模型。 NVIDIA的解决方案是使用Dynamo软件e 将推理过程分成两半。 Vera Rubin 的 GPU 负责预取和注意力,Groq 负责后续解码和 token 生成。所以我们可以看到,Rubin GPU 与 8 个 Groq 3 LPU 配对并集成到一个推理单元中。 Groq 3 LPX 机器可存储 256 个 LPU,并提供 128 GB SRAM、40 PB/s 带宽、315 PFLOPS 推理计算能力和 640 TB/s 互连带宽。 Nvidia 和 Groq 之间的交易目前因涉嫌“秘密收购”而面临反垄断审查(尽管这种做法已经是人工智能时代硅谷巨头的入门读物)。不过,LPU 已经与三星合作量产,预计今年第三季度出货,Vera Rubin 机架也已经在 Microsoft Azure 云上运行。同时,Nvidia与Groq的合作也具有战略意义,因为它发起了ASIC反击。 ,以及多家云厂商工程师们还支持 ASIC 芯片的研发,以侵蚀 Nvidia GPU 的利润和业务实力。包括 Google 的 TPU(一种 ASIC 芯片)和 Groq 本身(也是一种 ASIC 芯片)。但现在英伟达却告诉外界:“你还可以打造一款 ASIC 芯片,并将其与自己的 GPU 结合起来,获得更强大的性能!” NVIDIA 创始人兼首席执行官黄仁勋 然而,这种结构将代币生成速度从 200 万个提高到 7 亿个,增长了 350 倍。这是一种极致的协作设计。我们想纵向整合优化,横向开放给大家享用。第 3.3 章:CPU 和期待已久的 CPX 突然出现。我们再看芯片层的第二个关键词:CPU。是不是有“枯木逢春”的感觉? AI耕种时代代币经济的兴起,不仅救了Groq的命,也让老旧的CPU再次流行起来。 GPU 非常适合训练并运行人工智能模型,但随着代理工作负载不断增长,并且这些系统需要发送大量数据并协调多个代理之间的工作流程,CPU 在现代人工智能基础设施中变得与 GPU 一样重要。在本次 GTC 上,NVIDIA 发布了 Vera CPU,称其为“世界上首款专为基于代理的 AI 和强化学习时代而设计的处理器”。它的效率是传统机架级 CPU 的两倍,速度提高 50%。领先的人工智能调度公司 Cursor 还推出了 Vera CPU 平台,声称该平台将提高整体性能和效率,并为客户提供更快、响应更灵敏的调度代理体验。 Praveen Menon NVIDIA 员工 这些 CPU 专为 AI 工厂而设计。当GPU进行推理或者强化学习训练时,会生成大量的软件代码,需要对其准确性进行评估,然后反馈给GPU。 CPU承担的任务是评估这些代码,所以在那个阶段我们需要一个非常快的CPU来向GPU提供评估反馈,这样它就不必做任何加权。这就是为什么我们构建该产品来提供极高的单核性能和海量内存带宽,使您能够通过无与伦比的机架级扩展无缝地移动数据。现在您可以快速高效地移动。因此,所有这些结合起来为您提供了执行 AI 工厂和代理任务的理想 CPU。在芯片层面,还有一个秘密武器,叫做CPX。这是黄仁勋去年9月在AI基础设施峰会上宣布的一款芯片,专门针对inference.long-term context ai进行优化。它代表了 GPU 设计的新类别。该芯片可以处理软件编程和使用数百万代币生成的视频,在速度和效率上实现突破性提升,被外界认为进一步加强了英伟达在推理领域的领先地位。有趣的是,黄他在演讲中根本没有提及 CPX,这引发了业界对 NVIDIA 目前在芯片级别的 GPU、CPU、LPU 和 CPX 组合是否会进一步使其与竞争对手区分开来的兴趣。据吉隆投资联合创始人任阳介绍,我们了解到NVIDIA有非常有用的产品,可以安装在机箱中以应对不同类型的工作负载。 NVIDIA 希望提供最完整、最全面的服务。我想要的都有了,我觉得买全是最方便的。总之,这五层蛋糕相互支撑,又相互制约。黄仁勋所做的就是将这五个层整合起来,确保NVIDIA在每一层都有发言权,无论是支持甲方竞争对手、支持自研开源模式,还是在不同领域保持开放协作,定义行业切入点和范式。英伟达的故事不再仅仅与芯片有关,而是与芯片有关。黄仁勋手里拿着芯片的名场面新闻发布会上的这种行为已经成为过去。未来是完整的人工智能工厂和更雄心勃勃的代币经济。这将使NVIDIA的外护城河超越CUDA,让竞争对手难以渗透其环境帝国。 04 传播前沿技术 CPO、空间数据中心、规模设计 黄仁勋展望了未来爆发式增长的下一个行业,对前沿技术充满热情。在这次新闻发布会上,并没有过多提及数据中心内单元的光CPO捆绑或扩展(垂直扩展)或扩展(水平扩展)。然而,3 月初,NVIDIA 向光子技术巨头 Lumentum 和 Coherent 各投资了 20 亿美元,获得了数十亿美元的承购协议和未来产能的权利。两家公司都是主要的原棕油供应链。行业专家认为,Hwang In-hoon 正准备为下一代光互连奠定基础打造“千兆瓦级人工智能工厂”。 Cathy Jiang 光学工程师之一是Lumentum,目前唯一一家高功率(400毫瓦)DFB激光器供应商。最近的OFC会议上还提到了参数更高的1瓦高功率激光器。另一家公司是Coherent,它是由几家在硅光子领域积累了大量技术的公司合并而成。首先,这两家公司都是美国公司。其次,我们有多年的技术和专利积累。第三,在整个产业链上,这种投资将帮助这些企业不断利用下一代技术进行创新。这次,公司的很多创新都在封装上,从2.5D到3D。但公司正在开发更新的技术,包括使用更多的光波长相互通信以及进一步提高带宽密度。更先进的技术也正在被使用,例如不同的方式定位激光器、不同波长带、不同光纤参数以及其他正在探索的其他创新。目前,业界正在争论upscaling(纵向扩张)和upscaling(横向扩张),据业内专家透露,黄仁勋已经决定采取下一步,即扩张(领域间扩张)。也就是他们正在考虑如何解决不同数据中心的互联。 Cathy Jiang 光学工程师 在不同的距离场景下,例如放大倍数(垂直扩展)可以达到毫米量级,放大倍数(横向扩展)可以达到米量级,横向缩放(跨域扩展)可以达到公里量级甚至更多。在这些不同的尺度下,最优的技术路径是什么?我们应该继续使用当前波长还是应该更换为另一个波长?是否有任何技术使用当前的光纤或光纤n 开放媒体?会不会有一种科技突然出现并毁灭我们?领域,采用所有其他技术?这些都是非常有趣的讨论。当然,还有更远的设计,比如黄仁勋提到的太空数据中心。我还写过一篇文章介绍它。在本文的最后,我还想谈谈整个芯片和数据中心供应链的现状。如果你还记得这块五层蛋糕,你就知道,电源和数据中心供应链的基础层决定了芯片产能,决定了整个AI模型和应用是否得到足够的算力支撑,决定了AI的进步。 05 供应链完全紧张。记忆和能量的超级循环。当我在GTC期间与供应链朋友聊天时,我得到的是这样的信息:什么都短缺。 Alex Yeh,GMI云创始人 我们意识到所有硬件的短缺情况,包括各种内存侧组件,例如CX7和其他子组件。目前,所有零部件都开始亮起“红灯”,这意味着严重短缺和大幅涨价。 DDR4 DRAM价格比一年前上涨了10倍。目前,CX7供不应求,电源和CPU都开始告罄,所有供应链都开始告罄。我对 OpenClaw 的崛起和代理的崛起感到兴奋。我们看到了这种增长,我们看到了多模式的兴起,我们看到了编程的兴起。事实证明,这三者是一场完美风暴,但并非所有供应链都能跟上这一步伐。 Alex表示,近期全球特别是中东地区的地缘政治导致能源价格出现异常波动,这给全球AI数据中心的供电带来了更大的不确定性。然而,能源部分可能占象征性价格的 10% 左右。导致代币价格居高不下的是价格上涨缓解供应链短缺造成的问题,尤其是与内存相关的短缺。 GMI Cloud 创始人 Alex Yeh 我认为最大的影响将是服务器系统内存价格的上涨,这将导致代币价格上涨。我还在展会上采访了三星,它是内存市场的明显赢家。他们认为这种短缺至少会持续到 2027 年底。 Candice Hu 三星内存产品营销经理 这是一个我们以前从未见过的超级周期。它已经存在了几年了,但当时更多的是对手机、电脑和互联网的需求。但今年一切都与人工智能有关。 2026 年已完全售罄,2027 年可能仍供不应求。我们已经在投资我们的生产线,但可能要到2028年才会看到如此显着的增长。在这个超级周期中,许多买家是云和数据中心。他们对成本不太敏感,更愿意花钱购买。因此,超未来两年内存短缺或需求可能会相对较大。这是我们参加这次会议的体会。我的感觉是,随着基因时代的到来,许多范式将会改变。尽管机遇与挑战并存,GTC仍将继续引领AI行业。我们将持续关注上述行业和方向。一年后的 GTC 大会上,人工智能将给我们的世界带来多少加速?注:部分图片可能为- 本程序来自网络【本程序不构成投资建议】【视频播放频道】全国:bilibili |腾讯|视频账号|雪瓜 |今日头条 |百家帐号 | 36克|微博 |虎秀海外:Youtube 联系方式:video@sv101.net 【主创团队】主管|洪军 编剧/组织者:陈茜 |编辑:陈茜|橙色动画|导演: 雅各布 |孙泽平王子钦
特别提示:以上内容(包括图片和视频,如有)为上传发布由自有媒体平台“网易账号”的用户发布。本平台仅提供信息存储服务。
注:以上内容(包括图片和视频,如有)由网易号用户上传发布,网易号是一个仅提供信息存储服务的社交媒体平台。