绿茶通用站群绿茶通用站群

印第安人还存在吗,印第安人现在还有没有

印第安人还存在吗,印第安人现在还有没有 “AI春晚”英伟达放大招:亮算力“杀器”、助游戏“捏人”;黄仁勋帮算账:GPU多买多省

  “AI热潮(cháo)”最(zuì)大赢(yíng)家之(zhī)一、英伟达背后的(de)那(nà)个身穿黑色皮衣的男人又来了。

  前脚才交(jiāo)出亮眼业绩狂(kuáng)拉股价,英伟达CEO黄仁勋(xūn)后脚就在昨日的COMPUTEX大会上宣布(bù),“我(wǒ)们已到达生成式AI引爆点。从此,全(quán)世界的每个角(jiǎo)落,都会有计(jì)算需(xū)求。”

  如今英伟(wěi)达(dá)掌(zhǎng)握着全(quán)球多(duō)家(jiā)科技(jì)公司“算力命脉(mài)”,而在(zài)这(zhè)场大会上,黄(huáng)仁勋激情演讲2个小时,甩出了多项重磅新发布(bù),包括算力(lì)“杀器”DGX GH200超级计算机(jī)、针(zhēn)对游戏的ACE代(dài)工服务、MGX服(fú)务器(qì)规范等内容。

  算力“杀器”:DGX GH200超级计算机+GH200超级芯片(piàn)

  先看(kàn)“集成了英伟(wěi)达(dá)最先进加(jiā)速计算(suàn)和网络技术”的DGX GH200人工智能超级计算机

  这(zhè)款超算专为(wèi)大规模生成(chéng)式AI的负载所(suǒ)设(shè)计,由256块GH200超级芯片组成(chéng),拥有1 exaflop超(chāo)凡AI性(xìng)能、144TB内(nèi)存(是英伟(wěi)达目前DGX A100系统的近500倍)、150英里光纤、2000多个(gè)风扇。

  DGX GH200重达40000磅(bàng)(约合(hé)18143千克),堪比四只成年大象的体重。

  预计DGX GH200将于今年年(nián)底投入问(wèn)世,英(yīng)伟达暂未公(gōng)布(bù)价格,而谷(gǔ)歌云(yún)、Meta与(yǔ)微软将是首批用(yòng)户(hù)

  同时,英伟(wěi)达也正在打造自家基(jī)于DGX GH200的大型AI超级计算机(jī)NVIDIA Helios,以支(zhī)持其(qí)研究(jiū)和开发团(tuán)队的工作。其中采用(yòng)4个DGX GH200系统(tǒng)、1024颗Grace Hopper超级芯片,每个都(dōu)将(jiāng)与英伟达Quantum-2 InfiniBand网络连接(jiē),带宽高达400Gb/s,将于今年年(nián)底上线。

  值(zhí)得一提的是,黄(huáng)仁勋透露,DGX GH200集(jí)成的GH200 Grace Hopper超级芯(xīn)片已(yǐ)进入全(quán)面生产

  “拉踩”CPU:成本、功耗、处(chù)理数(shù)据量不如GPU

  在本次大会(huì)上,黄(huáng)仁勋还“拉踩”了一波CPU。他(tā)从功耗、处理(lǐ)数据(jù)量(liàng)等方面,指出使用(yòng)GPU胜过CPU。

  举例来说,花费1000万美(měi)元(yuán),可以建(jiàn)设一(yī)个(gè)有960颗CP印第安人还存在吗,印第安人现在还有没有U的数据中心,其可处理1X 印第安人还存在吗,印第安人现在还有没有LMM(大语言模型(xíng))数据量,需要11GWh功耗;

  同样(yàng)成本下,也可以建(jiàn)设一个(gè)有(yǒu)48个GPU的数据中心(xīn),其可(kě)处(chù)理44X LLM数据量,仅需要3.2GWh功耗。

  若只想处理1X LMM数据量,则只需40万美(měi)元,便可拥(yōng)有一(yī)个搭载2个GPU、功耗仅0.13GWh的(de)数据(jù)中(zhōng)心(xīn)。

  “买越(yuè)多,省越多(The more you buy, the more you save)。”黄(huáng)仁勋(xūn)再次表示。

  同(tóng)时(shí),他也列出了(le)数据中心成本公式:数据中(zhōng)心总(zǒng)持有成(chéng)本=f[成本(běn)(芯(xīn)片、系(xì)统、硬件生(shēng)态(tài)系(xì)统(tǒng))、吞吐量(GPU、Algo软件、网络、系统软件、软(ruǎn)件生态(tài)系统)、使用率(Algo Lib, 软(ruǎn)件生态系统(tǒng))、采购运营、生命周期最佳化、电(diàn)力]

  ACE代工(gōng)服务:用AI激活NPC生命

  游戏一直是备受(shòu)关注(zhù)的(de)一大AI应(yīng)用落地领域。英(yīng)伟达(dá)也在(zài)大会上宣布,推(tuī)出(chū)面向游戏的定制AI模型(xíng)代工服务NVIDIA Avatar Cloud Engine(ACE)

  它能(néng)赋予非玩家角色(NPC)更(gèng)智(zhì)能且不断进(jìn)化的(de)对(duì)话(huà)技能(néng),中间件、工具和游戏开发者可使用它来构建和部署定制(zhì)的语音、对(duì)话和(hé)动画AI模型

  其中(zhōng)包括:英伟达(dá)NeMo,使用(yòng)专有数据构建、定制和部署(shǔ)语言(yán)模型;英伟达Riva,用于自动语音识别和文本(běn)转语音实现(xiàn)实时语音对话;英伟达Omniverse Audio2Face,用于即时创建游戏角色表情动画,以(yǐ)匹(pǐ)配任何语(yǔ)音(yīn)轨道(dào)。

  开发(fā)人员可选择集(jí)成整个NVIDIA ACE for Games解决(jué)方案,也(yě)可仅使用需要(yào)的(de)组件。

  新参考(kǎo)工作流程:帮助建(jiàn)设数字(zì)化智(zhì)能工厂

  黄仁勋表示,全球电子制(zhì)造商正在使(shǐ)用一(yī)种全新的综合参考(kǎo)工作流(liú)程推进工业数字化工作,该工作流(liú)程结(jié)合(hé)了英伟达用于生(shēng)成式AI、3D协作、仿真(zhēn)和自主机器的技术(shù),包括:

  英伟(wěi)达Omniverse,其连接了(le)顶级计算机辅(fǔ)助(zhù)设计应(yīng)用以及(jí)生成式AI的API和前沿框(kuāng)架;用于(yú)模拟(nǐ)和测试(shì)机器人的(de)英(yīng)伟(wěi)达Isaac Sim应用程(chéng)序(xù);英伟达Metropolis视(shì)觉AI框(kuāng)架,用于自动光学检测(cè)。

  同(tóng)时,黄仁勋现(xiàn)场展示了一个(gè)完全数(shù)字(zì)化的智(zhì)能(néng)工厂的演(yǎn)示。

  目前富(fù)士康(kāng)工业(yè)互(hù)联网、宜鼎国际、和硕、广达和纬创正在使用这一参考工作流程,具(jù)体用例包括电路板质保检测点(diǎn)自动化、光(guāng)学检(jiǎn)测自(zì)动(dòng)化、建设虚拟工厂、模拟协作机器人、构建及运营数字孪(luán)生(shēng)等。

  MGX服务(wù)器规(guī)范(fàn):快速高效构建(jiàn)百(bǎi)余种服务器(qì)配置

  英伟(wěi)达发布NVIDIA MGX服务器规(guī)范,为系统制造商提供(gōng)模块化参考(kǎo)架构,满(mǎn)足各种规模的数据(jù)中心需求。系统制(zhì)造商可使用它快速(sù)且(qiě)经济高效(xiào)地构建100多种服务器(qì)配置(zhì),以适应广(guǎng)泛的(de)AI、HPC及NVIDIA Omniverse应(yīng)用。

  MGX支持英伟达全(quán)系列GPU、CPU、DPU和(hé)网络(luò)适配(pèi)器、各种(zhǒng)x86、完(wán)整软(ruǎn)件堆(duī)栈及Arm处(chù)理器,还可(kě)集成到云和企业数据中心中。

  华(huá)硕、和(hé)硕、QCT、超(chāo)微(wēi)(Supermicro)等都将采用MGX构建下一(yī)代加速计(jì)算(suàn)机(jī),可将开发成本削减多达3/4,并(bìng)将(jiāng)开发(fā)时间(jiān)缩短2/3至仅需6个月

  其(qí)中,QCT和超微基(jī)于MGX的设计(jì)将于8月面世(shì)。超微昨(zuó)日公布的ARS-221GL-NR系统将采(cǎi)用Grace CPU,而QCT的S74G-2U系统将采用Grace Hopper。

  推出Spectrum-X网(wǎng)络(luò)平(píng)台 构(gòu)建超(chāo)大(dà)规模生成式(shì)AI超(chāo)级计算机Israel-1

  另外,黄仁(rén)勋宣布推出(chū)NVIDIA Spectrum-X网络平台,旨在(zài)提(tí)高(gāo)基于以太网的AI云的性(xìng)能和效率(lǜ)。

  相比(bǐ)传(chuán)统以太网(wǎng)结构(gòu),Spectrum-X可实现(xiàn)1.7倍的整体AI性能和能效提升(shēng),并具有高度通用性,可用于各(gè)种AI应(yīng)用。它使用完(wán)全(quán)基于标准的以太(tài)网(wǎng),并可与基于(yú)以(yǐ)太网(wǎng)的堆栈互操作。该平台支持256个200Gb/s端(duān)口(kǒu),通过单个交换机(jī)连(lián)接,或在两层leaf-spine拓扑中提供16000个端口(kǒu),以(yǐ)支(zhī)持AI云增长和扩展,在保持性能的同(tóng)时最大(dà)限度减少网(wǎng)络(luò)延迟。

  全(quán)球领先云计算提供商正在(zài)采(cǎi)用Spectrum-X平(píng)台(tái)扩展生成式AI服务,而Spectrum-X、Spectrum-4交(jiāo)换(huàn)机、BlueField-3 DPU等已在戴(dài)尔、联想(xiǎng)等系统制造商(shāng)处提(tí)供。

  此外,作为(wèi)Spectrum-X参考(kǎo)设计的(de)蓝(lán)图和测试平台(tái),英伟(wěi)达正构建一台超大规模生成式(shì)AI超级(jí)计算机Israel-1。这台AI超算价值数亿(yì)美(měi)元(yuán),将采(cǎi)用戴尔PowerEdge XE9680服务器、英(yīng)伟达HGX H100超级计算平台、内置BlueField-3 DPU和Spectrum-4交换机的Spectrum-X平台。

  结语(yǔ)

  “40年来,我们创造了PC、互(hù)联网、移(yí)动、云,现在是(shì)人工智能(néng)时代。你会创(chuàng)造什(shén)么?不管是什么,都要(yào)像我(wǒ)们(men)一(yī)样追赶它。要奔跑(pǎo),不(bù)要走。要么为了食物奔跑,要么作为食物奔(bēn)跑。”

  在5月27日的台湾大学发表(biǎo)了毕业(yè)典礼演讲上,黄仁勋(xūn)再(zài)次强(qiáng)调(diào)了掌握AI技术的重要(yào)性:很多人担心,AI会抢走自(zì)己(jǐ)的(de)工(gōng)作。但真正会(huì)抢走你饭碗的,是掌握了AI技术的(de)人。

  他(tā)表示,从(cóng)各(gè)方面来看,AI的兴盛是(shì)计算机产(chǎn)业(yè)的再生契(qì)机(jī)。在下个十年,我们的产(chǎn)业将(jiāng)使用新型AI电脑(nǎo),取代价(jià)值(zhí)万亿美(měi)元的传(chuán)统电脑。

  而从昨日大会(huì)上黄仁勋(xūn)的展示中,人工智能时(shí)代的未来轮廓似(shì)乎(hū)已逐渐(jiàn)浮现。

未经允许不得转载:绿茶通用站群 印第安人还存在吗,印第安人现在还有没有

评论

5+2=