生成式AI一定是近期最火的话题。从GPT-4到百度文心一言,谷歌也公布Bard将接受测试申请的消息。Midjourney几可乱真的图片生成能力更是令人细思极恐。
AI也成为英伟达本次GTC大会主旨演讲的主题。不到80分钟的时间里,黄仁勋多次提及“AI的‘iPhone’时刻”。
根据黄仁勋的介绍,GTC生态系统涵盖全世界400万开发者,4万家公司,几乎已经渗透到科技的各个角落。
本次主旨演讲中,英伟达不仅发布了新的芯片和系统,还涉及AI、加速计算 、云服务、元宇宙等多个领域,可以说几乎是以高精科技底层构建者的身份参与了顶层的建设。
而其中,AI是绝对的主角。在为期四天的GTC大会中,合计650多场演讲,仅生成式AI相关内容就占到了70多场。
开场的短片,形象地描述了AI能做到什么。结合实际的体验,那种震撼感,脑中自动跳出“人类群星闪耀时”。今天 ,无疑是AI群星闪耀的时刻。
而英伟达,将成为这背后重要的构建者。
2012年,Alex Kerchevsky、Ilya Suskever 和他们的导师 Geoff Hinton 在两块 GeForce GTX 580 上,使用 1400 万张图像训练了 AlexNet。这是英伟达与AI的首次亲密接触。
而在2016年,黄仁勋又亲手向OpenAI交付了第一台NVIDIA DGX AI超级计算机,也就是支持 ChatGPT 的大型语言模型突破背后的引擎。
如今,最初作为AI研究仪器使用的NVIDIA DGX超级计算机已在世界各地的企业中全天候运行,用于完善数据和处理AI。据黄仁勋表示,《财富》100强企业中有一半都安装了DGX AI超级计算机。
可以说,在AI崛起的今天,OpenAI与英伟达一定意义上实现了互相成就。
本次GTC主旨演讲发布了多项AI相关的技术与产品。“AI的‘iPhone时刻’”,足可见黄仁勋的激动。
除了AI相关内容,Omnivous元宇宙也是本次主旨演讲重要的组成部分。同时,AI和元宇宙的构建也将共同赋能汽车行业。本文我们也主要从AI和元宇宙两个方面,以及其与汽车行业的交互来展示本次演讲的内容。
首先是AI相关内容。
01.
DGX是构建AI基础设施的蓝图
软件能力的构建始于硬件基础。
黄仁勋表示,类似ChatGPT大型语言模型(LLM)的部署是一个重要的全新推理工作负载。为了支持像ChatGPT这样的大型语言模型推理,英伟达发布了一款新的GPU——带有双GPU NVLink的H100 NVL。
也就是说,英伟达为ChatGPT类的AI应用专门发布了一款新的GPU。后文我们会再介绍H100 NVL。
而去年GTC上发布的H100基于NVIDIA Hopper架构,配有一个Transformer引擎,也用于处理驱动ChatGPT的类似GPT模型。和用于GPT-3处理的HGX A100相比,配备四对H100与双GPU NVLink的标准服务器的速度最高可达10倍。
最新版本的DGX搭载8个NVIDIA H100 GPU,可连接成一个巨大的GPU。黄仁勋更是将NVIDIA DGX H100称为全球客户构建AI基础设施的蓝图。目前已全面投产。
已有多家使用H 100的企业公布了其产品进展。上周,微软 Azure 发布了其 H100 虚拟机 ND H100 v5 的私人预览版。Meta 则已为其内部的AI生产和研究团队部署了由H100驱动的Grand Teton AI超级计算机。OpenAI也将在其Azure超级计算机上使用H100来支持其持续进行的AI研究。
此外,为加快把DGX能力带给初创企业和其他各类企业,以助力其快速打造新产品和制定AI战略,英伟达也发布了NVIDIA DGX Cloud。通过与微软Azure、Google Cloud和Oracle Cloud Infrastructure合作,“从浏览器上” 即可实现将NVIDIA DGX AI超级计算机 “带给每家公司”。
甲骨文将成为英伟达AI云的首个云合作伙伴。微软Azure预计将在下个季度开始托管DGX Cloud,后续也将很快扩展到Google Cloud等。
企业将能够按月租用DGX Cloud集群以便快速、轻松地扩展大型多节点训练工作负载的开发。英伟达宣布有50家早期企业客户,覆盖消费互联网和软件、医疗保健、媒体和娱乐、金融服务。
02.
AI Foundation为企业提供生成式AI代工服务
在ChatGPT、DALL-E和Midjourney等应用唤醒了世界对生成式AI的热情,也大大改变了各个行业的生产模式。黄仁勋表示,今天,每个人都是程序员,而生成式AI就是新的计算平台。
为了加速企业应用生成式AI,使企业能够构建、完善和运行自定义大型语言模型和生成式AI模型,英伟达也推出了全新的 NVIDIA AI Foundations 模型开发服务,专为企业所在领域的特定任务而创建,并且在专有数据上训练。
黄仁勋表示,通过AI Foundations,英伟达将成为AI领域如台积电在芯片代工领域一般的存在。
NVIDIA AI Foundations 涵盖语言、图像、视频和3D,目前已推出的模型包括 NVIDIA NeMo™ 语言服务和NVIDIA Picasso图像、视频和3D服务以及面向生物学(用于药物研发)的NVIDIA BioNeMo™云服务模型。
NeMo和Picasso服务运行在 NVIDIA DGX Cloud™ 上。
NeMo云服务提供各种规模的模型(从80亿到5300亿个参数不等),可使用新增的训练数据定期更新,为企业提供丰富的选择。此外,企业客户可以使用 NeMo 服务所包含的信息检索能力,在他们实时的专有数据上增强 LLMs,通过自定义模型,为市场情报、企业搜索、聊天机器人和客户服务等提供准确的生成式 AI 应用。
Picasso用于构建和部署生成式 AI 驱动的图像、视频和3D应用。这些应用具有先进的文本转图像、文本转视频和文本转3D的能力,可通过简单的云API提高创作、设计和数字模拟方面的生产力。
包括Adobe、Gettyimage和Shutterstock等领先的视觉内容公司正与 NVIDIA 合作,使用 Picasso 服务构建自定义模型,提高创意专业人士的生产力。
以Adobe为例,Adobe正与NVIDIA 合作共同开发新一代先进的生成式AI模型,其中一些模型将采取联合开发的方式,并通过Photoshop、Premiere Pro和After Effects等Adobe Creative Cloud的旗舰产品以及新的NVIDIA Picasso云服务推向市场,从而广泛覆盖第三方开发者。
BioNeMo是新推出的云服务模型,应用于医药行业。Bionemo包含可用于蛋白质结构预测、蛋白质生成、蛋白质性质预测、分子生成、分子对接等各个流程的模型,将帮助研究人员使用其专有数据创建、微调和服务自定义模型,来节省药物研发宝贵的时间与资金。
黄仁勋表示,目前Amgen正在使用BioNeMo加速其药物研发服务。其他BioNemo的抢先体验客户包括Alchemab Therapeutics、AstraZeneca、Evozyne、Innophore和Insilico。
此外,NVIDIA正在和全球最大的医疗技术提供商Medtronic一起为软件定义医疗设备构建一个AI平台。此次合作将为Medtronic系统创建一个涵盖手术导引和机器人辅助手术的通用平台。据Medtronic消息,其GI Genius系统已使用AI实现了结肠癌早期检测。
可以看到,生成式 AI已经能生成包括语音、文本、图像、视频和3D图形、蛋白质和化学物质等多种形式的内容。它的快速发展无疑将大大改变人类的生活、工作模式。
03.
用于大型语言模型和生成式AI工作负载的推理平台
而生成式AI的兴起需要更加强大的推理计算平台。黄仁勋表示,为开发人员提供最强大、灵活的推理计算平台将加快新服务的创造速度。
为帮助企业部署处于快速发展的生成式AI模型,英伟达也发布了用于AI视频、图像生成、大型语言模型部署和推荐器推理的推理平台。
NVIDIA L4适用于AI视频,可提供比CPU高出120倍的AI视频性能,同时能效提高了99%。
NVIDIA L40适用于图像生成,针对图形以及AI支持的2D、视频和3D图像生成进行了优化。
L40平台是NVIDIA Omniverse™的引擎,与上一代产品相比,其Stable Diffusion推理性能提高了7倍,Omniverse性能提高了12倍。
NVIDIA H100 NVL适用于大型语言模型部署,是规模化部署像ChatGPT这样的大型语言模型的理想平台。这款新的H100 NVL拥有94GB内存和Transformer引擎加速,在数据中心规模,与上一代A100相比,GPT-3上的推理性能提高多达12倍。
NVIDIA Grace Hopper适用于推荐模型,是图形推荐模型、矢量数据库和图神经网络的理想平台。
04.
Ominiverse元宇宙助力汽车产业数字化转型
元宇宙也是本次演讲的重要内容。
基于其Omniverse平台,英伟达表示将为部分企业提供NVIDIA Omniverse™ Cloud服务。而微软Azure则将成为Omniverse Cloud的首家云服务商。
NVIDIA与微软携手,为客户提供了一套可用于设计、开发、部署和管理工业元宇宙应用的全栈式云环境和平台功能。此外,客户还可通过Omniverse Cloud, 连接并使用NVIDIA合作伙伴生态系统的相关产品。
另外,两家公司还通过连接NVIDIA Omniverse与Teams、OneDrive、SharePoint等Microsoft 365应用,将生产力工具和3D协作平台相结合。
而在加速计算、AI和工业元宇宙的推动下,汽车行业也正在经历一场数字革命。尤其是元宇宙与AI的加持,使得汽车制造商可将产品生命周期的每个阶段数字化,包括概念造型、设计和工程、软件和电子、智能工厂、自动驾驶和零售等各个方面。关于Omniverse在汽车生产工业中的应用,我们此前也有过详细的介绍,参见《英伟达:元宇宙是未来》。
而本次演讲中,最具创新的便是宝马将在其全球生产网络中部署Omniverse Enterprise平台,包括其计划于2025年投入运营的匈牙利德布勒森电动汽车工厂。
在主旨演讲的展示视频中,黄仁勋与宝马集团董事会成员Milan Nedeljković一起,正式揭幕由NVIDIA Omniverse驱动的首座宝马虚拟工厂。
宝马集团在工厂投入运营前的两年间,便在虚拟工厂中开展工作,能够确保该工厂实现顺利运作与最佳效率。
由于宝马的工厂和工厂规划人员遍布世界各地,需要使用众多软件工具和流程来连接不同地区和时区的人员,这会带来局限性。
Omniverse平台使宝马团队能够在全球各地的虚拟工厂中开展协作。通过可实现实时全局变更的统一数据策略,宝马的各个团队能够共享各类更新。帮助其在虚拟世界中完成验证和测试、加快投产时间并提高工厂的效率。
吉利路特斯也正在利用Omniverse Enterprise构建工厂的数字孪生。
捷豹路虎正在使用Omniverse生成合成数据以训练AI模型,并基于真实驾驶场景来验证自动驾驶感知和控制算法。
此外,主旨演讲中,黄仁勋也表示比亚迪将拓宽NVIDIA DRIVE Orin™中央计算平台的应用范围,将其应用于更多新能源车型之中。
黄仁勋将这次GTC大会称为英伟达最重要的一届,也足可见AI在英伟达后续战略发展中的意义。
编后:
英伟达正将人工智能提升到普通人触手可及的地步。无论是它在芯片领域推动的进步还是在构建孪生数字世界方面呈现的场景,黄仁勋将AI描述成变成类似于铁、蒸汽机和PC一样推动时代变革的新生产工具。这当然也将对智能汽车的底层逻辑产生颠覆式的改变。黄仁勋提出的生成式AI概念可以像访问互联网一样方便,意味着AI已是生产力本身,无论是制造业还是软件工具,AI具备打通软硬件之间界限的能力。
今天黄仁勋展示了Omniverse平台对汽车制造环节的改造与影响,而在产品端展示有限。但如果我们反观微软在推动ChatGpt迅速成为旗下所有产品的底层技术,可见英伟达推动的这轮AI迭代也将会在消费端产生持续的影响。
智能汽车在智能驾驶、智联生态两个维度之外将新增智能情感和智能伴侣的新功能。
这就是AI来到iPhone时刻之后,对智能汽车最大的影响。
x
-
全球最大自动驾驶之城是怎么炼成的? 2024-03-04 10:24
-
15万有骁龙8295,16万配激光雷达,零跑C10发起“配置战” 2024-03-03 14:00
-
大众与小鹏合作首款车型曝光:纯电中型SUV,2026年上市 2024-02-29 15:05
-
英特尔宣布成立全新独立运营的FPGA公司——Altera 2024-03-01 12:47
-
哪吒汽车 All In AI,携手360集团推进大模型产品NETA GPT 上车 2024-03-01 17:21
-
15万有骁龙8295,16万配激光雷达,零跑C10发起“配置战” 2024-03-03 14:00