橘子百科-橘子都知道橘子百科-橘子都知道

顶的速度越来越快越叫的原因

顶的速度越来越快越叫的原因 “AI春晚”英伟达放大招:亮算力“杀器”、助游戏“捏人”;黄仁勋帮算账:GPU多买多省

  “AI热(rè)潮”最(zuì)大赢家之一、英伟达背(bèi)后的(de)那(nà)个(gè)身穿(chuān)黑色皮衣的(de)男人又(yòu)来了。

  前脚才交(jiāo)出亮眼业绩狂拉股价(jià),英伟达CEO黄仁(rén)勋(xūn)后(hòu)脚就在昨(zuó)日的COMPUTEX大会上(shàng)宣(xuān)布,“我们已到达生成(chéng)式AI引爆点。从此,全世界的每个(gè)角落,都(dōu)会有(yǒu)计算需(xū)求。”

  如(rú)今(jīn)英伟达掌握着全球多家科技公司“算力(lì)命脉”,而在这场(chǎng)大会上,黄仁勋激情演讲2个小时,甩出了多项重磅(bàng)新发布,包括(kuò)算力“杀(shā)器”DGX GH200超级计算机、针对游(yóu)戏的ACE代工服务、MGX服务器规(guī)范(fàn)等内容。

  算力“杀(shā)器”:DGX GH200超级计算(suàn)机+GH200超级芯片

  先看“集成了英伟达最先(xiān)进加(jiā)速计算和网络技术(shù)”的DGX GH200人工智能(néng)超(chāo)级计(jì)算(suàn)机

  这款超算专为大规模生成(chéng)式AI的(de)负载(zài)所设计,由256块GH200超级芯片(piàn)组成,拥(yōng)有1 exaflop超凡AI性能、144TB内(nèi)存(是英(yīng)伟(wěi)达目前(qián)DGX A100系统的近500倍)、150英里(lǐ)光纤(xiān)、2000多个风扇。

  DGX GH200重达40000磅(约合18143千(qiān)克),堪比(bǐ)四只成年大象的(de)体重(zhòng)。

  预计DGX GH200将于今年年(nián)底投入问(wèn)世,英伟达暂未公(gōng)布价格(gé),而谷歌云、Meta与微软将是首(shǒu)批用户

  同时,英伟达(dá)也(yě)正在打造自家(jiā)基于DGX GH200的大型AI超级计算机NVIDIA Helios,以支持其研究和开发团队的工(gōng)作。其中采用4个DGX GH200系统、1024颗Grace Hopper超级芯片,每个都(dōu)将(jiāng)与英伟(wěi)达(dá)Quantum-2 InfiniBand网(wǎng)络连接,带宽高达400Gb/s,将于今年年底上线。

  值(zhí)得一提(tí)的是,黄仁勋透露,DGX GH200集成的GH200 Grace Hopper超级芯片已进入(rù)全面生产

  “拉踩”CPU:成本、功(gōng)耗、处理数(shù)据(jù)量不(bù)如GPU

  在本次大会上,黄仁(rén)勋还“拉踩”了一波CPU。他从功(gōng)耗、处理数据量等方(fāng)面,指出使用GPU胜(shèng)过CPU。

  举例来说,花费(fèi)1000万(wàn)美元,可以建设一个有960颗CPU的数据(jù)中心,其可(kě)处(chù)理1X LMM(大语言模型(xíng))数据量,需要11GWh功耗;

  同(tóng)样成本下,也可以(yǐ)建设(shè)一个(gè)有48个GPU的数据中心,其可(kě)处(chù)理44X LLM数据量(liàng),仅需(xū)要3.2GWh功耗。

  若只想处理1X LMM数据量(liàng),则只(zhǐ)需40万美元,便(biàn)可拥有一(yī)个搭载2个(gè)GPU、功(gōng)耗仅(jǐn)0.13GWh的数据中心。

  “买越多(duō),省越多(duō)(The more you buy, the more you save)。”黄(huáng)仁勋(xūn)再次(cì)表(biǎo)示。

  同时,他也列出(chū)了数据中心成(chéng)本公式(shì):数据中心总持有(yǒu)成本=f[成本(芯片、系统、硬件生态(tài)系(xì)统)、吞吐量(GPU、Algo软件、网络、系统软(ruǎn)件(jiàn)、软件生(shēng)态系统(tǒng))、使用率(Algo Lib, 软件生态(tài)系统(tǒng))、采购运(yùn)营、生命周期最佳化(huà)、电力]

  顶的速度越来越快越叫的原因rong>ACE代工服务(wù):用AI激活NPC生命

  游戏一(yī)直是备(bèi)受关注的一大AI应(yīng)用(yòng)落地领域(yù)。英伟达也在大会上宣布,推出面向游戏的(de)定制(zhì)AI模型代工服务NVIDIA Avatar Cloud Engine(ACE)

  它能赋予(yǔ)非玩(wán)家角色(sè)(NPC)更智能(néng)且不断进化(huà)的对(duì)话技能,中(zhōng)间(jiān)件(jiàn)、工具和(hé)游(yóu)戏(x顶的速度越来越快越叫的原因ì)开发者可(kě)使用它来构建(jiàn)和部署定制的语音、对话和动画AI模型

  其中包括(kuò):英(yīng)伟达(dá)NeMo,使用专有数(shù)据构建、定(dìng)制和部署语言(yán)模型;英伟(wěi)达(dá)Riva,用于自动(dòng)语音识别(bié)和文本转语音实现实时(shí)语音对话;英伟达(dá)Omniverse Audio2Face,用于即时(shí)创建(jiàn)游戏角色表情动画,以匹配任何语(yǔ)音轨道。

  开发人员(yuán)可选择集(jí)成(chéng)整个NVIDIA ACE for Games解(jiě)决方(fāng)案,也可仅使用需要的组件(jiàn)。

  新参考工(gōng)作流程:帮助建设数(shù)字化(huà)智能工厂(chǎng)

  黄仁勋表示,全球电(diàn)子制(zhì)造商(shāng)正在(zài)使用一种全新的综(zōng)合参(cān)考工作流程推进工业数字(zì)化工作,该(gāi)工作流(liú)程结(jié)合了英伟达用于生成式(shì)AI、3D协作、仿真和自主机器(qì)的技术,包括:

  英伟(wěi)达(dá)Omniverse,其(qí)连(lián)接了顶级计算机辅助设计应用以及生成式AI的API和前沿框(kuāng)架;用于模拟和测试机器人的英伟达Isaac Sim应用程序;英伟(wěi)达Metropolis视觉AI框架,用于自动光学检(jiǎn)测。

  同时,黄仁勋现场展示了一个完全数(shù)字化的智能工厂的演示。

  目(mù)前富(fù)士康工业互联网、宜鼎国(guó)际、和硕、广(guǎng)达和纬(wěi)创正在使用这一参考工作流(liú)程,具体用例(lì)包括电路板(bǎn)质保(bǎo)检(jiǎn)测点自动化、光学检测自动(dòng)化、建设(shè)虚拟工(gōng)厂、模拟协(xié)作机器人、构建及运营(yíng)数字孪(luán)生等。

  MGX服务器(qì)规范:快速高效构建百余(yú)种(zhǒng)服务器配(pèi)置

  英伟达发布NVIDIA MGX服务器(qì)规范,为(wèi)系(xì)统制造(zào)商提(tí)供(gōng)模块(kuài)化参考架构,满足各种规(guī)模的数据中心需求。系统制造商可(kě)使用(yòng)它快速且(qiě)经济高(gāo)效地构建100多种(zhǒng)服(fú)务器配置,以(yǐ)适应广泛的AI、HPC及NVIDIA Omniverse应用(yòng)。

  MGX支持英伟达全(quán)系列GPU、CPU、DPU和网(wǎng)络适配(pèi)器、各种x86、完整(zhěng)软件堆栈及Arm处(chù)理器(qì),还可集成(chéng)到(dào)云和企业(yè)数据(jù)中心中。

  华硕、和硕、QCT、超微(Supermicro)等都将(jiāng)采用MGX构(gòu)建下(xià)一代加(jiā)速计算(suàn)机,可将开发成本(běn)削(xuē)减多达(dá)3/4,并将开发(fā)时(shí)间缩短(duǎn)2/3至仅需6个月

  其中,QCT和超(chāo)微基(jī)于MGX的设计将(jiāng)于(yú)8月面世。超微昨(zuó)日公布的ARS-221GL-NR系(xì)统将采(cǎi)用Grace CPU,而QCT的S74G-2U系统将采用Grace Hopper。

  推出(chū)Spectrum-X网络平台 构(gòu)建超(chāo)大规模生成式AI超(chāo)级计算机Israel-1

  另外,黄仁勋宣布推出(chū)NVIDIA Spectrum-X网络平台,旨在提高基于以太网的AI云(yún)的性(xìng)能(néng)和效率。

  相比传统以太网结(jié)构,Spectrum-X可实(shí)现1.7倍的整体AI性能和能效(xiào)提升,并具有(yǒu)高度通用性,可用于各(gè)种AI应用。它使用完全基(jī)于标准(zhǔn)的(de)以太网,并可与基于以(yǐ)太网的堆栈互(hù)操作。该(gāi)平台(tái)支持256个200Gb/s端口,通过单个交换机连接(jiē),或在两层leaf-spine拓(tuò)扑中提供16000个端口,以支持(chí)AI云增(zēng)长和扩(kuò)展(zhǎn),在保(bǎo)持性能(néng)的同(tóng)时最大限(xiàn)度减少网络延迟(chí)。

  全球领先(xiān)云计(jì)算提(tí)供商正(zhèng)在采用Spectrum-X平台扩展生(shēng)成式(shì)AI服务,而Spectrum-X、Spectrum-4交换机、BlueField-3 DPU等已在戴尔(ěr)、联想等系统制造商处提供。

  此外,作为(wèi)Spectrum-X参考设(shè)计的(de)蓝图和测试(shì)平台,英(yīng)伟达正构建一台超(chāo)大规模(mó)生成式AI超级计算机(jī)Israel-1。这台AI超算价值数亿(yì)美元,将(jiāng)采(cǎi)用戴尔PowerEdge XE9680服务器(qì)、英伟(wěi)达HGX H100超级计(jì)算平台、内(nèi)置BlueField-3 DPU和(hé)Spectrum-4交(jiāo)换机的(de)Spectrum-X平台。

  结语

  “40年来,我们创(chuàng)造了PC、互(hù)联网、移动、云(yún),现在是人工智能(néng)时代。你会创造什么(me)?不管是什么,都要像我们一(yī)样追赶它。要奔跑,不要走。要么为了食物奔跑,要么作为(wèi)食(shí)物(wù)奔(bēn)跑。”

  在(zài)5月27日(rì)的台湾大学(xué)发表了毕业典礼演(yǎn)讲上,黄仁勋再次强调了掌握(wò)AI技术的重(zhòng)要(yào)性:很多人(rén)担心,AI会抢走(zǒu)自己的工作。但真正(zhèng)会(huì)抢走你(nǐ)饭(fàn)碗的,是掌(zhǎng)握了(le)AI技术的人。

  他表示(shì),从各方面(miàn)来看,AI的兴盛是计(jì)算(suàn)机产(chǎn)业的再生契机。在下(xià)个十(shí)年,我(wǒ)们的产业将使用新型AI电脑,取代价值(zhí)万亿美元的传统电脑。

  而从昨日(rì)大(dà)会上黄仁勋的展示(shì)中(zhōng),人工智能时(shí)代的未来轮廓(kuò)似乎已逐(zhú)渐浮(fú)现。

未经允许不得转载:橘子百科-橘子都知道 顶的速度越来越快越叫的原因

评论

5+2=