连续几个月霸屏科技圈头条,只是“皮衣老黄”黄仁勋的开胃菜。
正菜是这次他在台北国际电脑展前夕发表的演讲。
北京时间6月2日晚,英伟达创始人黄仁勋举办了一场名为“揭开新工业革命”的主题演讲。他花了两个小时详细阐述自己对“GPU加速AI计算革命”及“AI工厂”的理解。
而硬核信息是去年发布的Blackwell芯片开始投产,2025年将推出Blackwell Ultra,而下一代 AI 芯片架构平台名为Rubin,采用HBM4芯片,预计将于2026年推出。
同时,黄仁勋还宣布推出推理模型微服务NVIDIA NIM,以部署在云、数据中心或工作站上,并且开发者能够轻松地为Copilot、ChatGPT等构建生成式 AI 应用,所需时间从数周缩短至几分钟。
同时,英伟达面向GeForce RTX AI电脑平台推出AI助理,为数字人推出G-Assist和NVIDIA ACE(数字人技术) NIMs,以及为微软Windows Copilot Runtime推出用于RTX加速API的小语言模型(SLM)等等。
而在这一系列新产品与新预言中,最具看点的是其展示的GPU全新一代的Rubin架构。
在黄仁勋看来,生成式AI刚刚打开了软件编写软件的历史,而一步,或者说新一代的工业革命正是机器来生产机器。
01.
尽管英伟达才刚推出了新的Blackwell平台,却开始了预告下一代Rubin GPU架构路线图的野心计划。
黄仁勋表示,Blackwell的下一代架构将是Rubin架构,且Rubin GPU将采用8颗HBM4,而Rubin Ultra GPU将采用12颗HBM4。
这个新的架构以美国天文学家Vera Rubin命名,她被视为发现宇宙中的暗物质的第一人,并在研究银河系等星系自转速度方面做了开创性的工作。
黄仁勋透露了GPU的更迭计划:
“我们公司有一年的节奏。我们的基本理念很简单:建立整个数据中心规模,然后以一年的节奏拆解并出售给您,并将一切推向技术极限。”
这意味着英伟达新的GPU架构将从两年一次迭代,加速到以一年为周期推出。
2024 年:Blackwell 芯片现已开始生产 2025 年:推出 Blackwell Ultra 产品 2026 年:推出 Rubin 产品 2027 年:推出 Rubin Ultra 产品
根据外媒wccftech的消息,英伟达的Rubin GPU将采用4x光罩设计,并将使用台积电的CoWoS-L封装技术,并采用N3制程。此外,英伟达将使用下一代HBM4 DRAM来为其Rubin GPU提供动力,目前英伟达在其B100 GPU中使用最快的HBM3E存储器,并预计在2025年底当HBM4存储器解决方案大幅量产时,用HBM4版本来更新这些芯片。
02.
当前CPU面临的困境是什么?
在黄仁勋看来,当今 CPU 性能扩展的速度已经大大减缓,尽管我们需求的计算量仍然在以指数级的速度非常快速地翻倍。如果处理需求、我们需要处理的数据量呈指数级增长,但性能却没有相应增长,我们将经历计算的「通货膨胀」(computation inflation)。事实上,就在我们现在说话的时候,世界各地使用的数据中心电力数量正在大幅增长。计算机的成本正在不断增长。这当然不能再继续下去了,因为数据将继续呈指数级增长,但 CPU 性能扩展速度将永远不会恢复。
比如说对比英伟达2016年发布的Pascal GPU,Blackwell GPU的计算能力(对应人工智能浮点运算能力)增长了1000倍,几乎“超越了摩尔定律在最佳时期的增长”。
黄仁勋一贯坚持“买的越多,省得越多”的理念。
GPU和CPU组合在一起,实现了高达100倍的加速计算,同时功耗仅增加三倍,换算下来平均单位性能比单独使用CPU提高25倍,显著起到了节能、降成本的效果。
而100倍的速度意味着97%、98%的节省,所以当GPU+CPU的组合从100倍的速度到200倍的速度再到1000倍的速度,节省、计算的边际成本就会继续下降。
黄仁勋的设想是,随着人工智能模型继续扩大,对GPU性能的要求也将越来越高,传统数据中心将进化为“AI工厂”,而工厂的基石便是超级GPU。
演讲过程中,黄仁勋甚至还亲自搬上一台体型更大的DGX服务器。这台服务器上连接了8个Blackwell GPU,采用空气冷却技术散热。目前全球抢购的AI服务器都用到这款产品,也是各大数据中心的核心设备。
其中DGX的AI算力提升到上一代的45倍,达到1440PFLOPS,而能耗仅为上一代的10倍。
黄仁勋极力描绘着生成式AI时代的一幅蓝图,展示了英伟达如何从Blackwell芯片等一系列先进技术和产品的组合,垒起层层叠叠的机架、集群,最终形成由32000张GPU组成的AI工厂。
03.
一座AI工厂到底如何掀起新产业革命?
这次演讲,黄仁勋宣布推出推理模型微服务NIM,能将企业部署生成式AI应用的时间从几天压缩到几分钟,
这个微服务可以用于研究、开发和测试。
该服务提供了一种简单、标准化的方式,通过经优化的容器形式提供AI模型,可部署在云、数据中心或工作站上。
现在,全球2800万开发者可下载NIM,从而轻松构建Copilot、聊天机器人等生成式AI应用。
04.
如果你有听黄仁勋在今年GTC上演讲内容,会发现具身智能占到居多篇幅。
黄仁勋坚信下一波AI浪潮是物理AI,机器人时代已经到来,所有移动的物体都将实现自动化。
英伟达这次发布了Isaac机器人平台。
黄仁勋表示,我们正在努力通过推进英伟达机器人堆栈来加速生成物理 AI,包括用于模拟应用的Omniverse、Project GR00T人形基础模型和 Jetson Thor机器人计算机。
目前,Isaac 生态系统迅速扩张,包括西门子、比亚迪、Gideon、idealworks和RGo Robotics等都在与英伟达展开合作。
其他一系列新产品服务的落地情况,还有为专为AI打造的新型以太网Spectrum-X等。
一年前,黄仁勋曾在台大毕业典礼上提出了一个这样的问题:
2023年毕业的同学们,你们即将进入一个经历巨大变革的世界,就像我毕业时遇到个人电脑和芯片革命时一样,你们正处于AI的起跑线上。每个行业都将被革命、重生,为新思想做好准备——你们的思想。在40年的时间里,我们创造了个人电脑、网路、移动设备、云端技术。现在的AI时代,你们将创造什么?
彼时英伟达的市值超过了1万亿美元,这一时刻与生成式AI爆发对GPU需求增长的节点吻合。
05.
一年过后的现在,英伟达市值超过2.7万亿美元,成为直逼苹果挑战全球第二大市值地位的公司。
根据Google财经的数据,截止目前,苹果的市值为2.95万亿美元,而英伟达的市值为2.7万亿美元。参考路透社的解释认为,英伟达仍受益于人工智能热潮,但苹果目前正苦于IPhone需求疲软和中国市场的激烈竞争。
今年,英伟达市值已从1万亿美元增长到2万亿美元,一举超越亚马逊、谷歌和沙特的石油公司。
这不禁让智驾网想到此前在社交平台上看到的一幕——
一位国外网友在社交平台评论称:“一百年后,人们会记得苹果还是英伟达?”
另一位网友模仿老黄的口吻回答:“the future is generative AI!”
x
-
特斯拉自动驾驶出租车“Cybercab”曝光,但投资者为Model 2喊冤 2024-06-13 13:44
-
2024北京车展:让流量回归流量,技术回归技术 2024-05-29 13:17
-
禾赛和速腾聚创Q1财报横评:市场对激光雷达的需求刚刚迎来爆发期 2024-05-22 11:05
-
续航301km,花仙子挚爱版5.99万元起售 2024-06-10 23:14
-
欧盟关税大棒砸向中国电动汽车:中欧贸易战山雨欲来 2024-06-13 12:49
-
特斯拉自动驾驶出租车“Cybercab”曝光,但投资者为Model 2喊冤 2024-06-13 13:44