日本免费在线一区二区-国产欧美日韩一区在线-国产男女猛烈无遮挡性视频网站-人妻内射视频免费看-女自慰喷水自慰不卡无广告-女生被男生操喷水的视频在线看-黑夜在线拖拽不卡第一页-av一区二区三区亚洲-亚洲国产精品成人婷婷色

歡迎訪問(wèn)深圳市中小企業(yè)公共服務(wù)平臺(tái)電子信息窗口

英偉達(dá)Rubin平臺(tái)量產(chǎn):六芯片協(xié)同,推理成本驟降10倍

2026-01-06 來(lái)源:電子工程專輯
827

關(guān)鍵詞: 英偉達(dá) Rubin平臺(tái)

當(dāng)?shù)貢r(shí)間1月5日,英偉達(dá)在CES2026展會(huì)上發(fā)布了NVIDIA Rubin平臺(tái),正式開啟了下一代人工智能時(shí)代包含六款全新芯片,旨在打造一臺(tái)性能卓越的人工智能超級(jí)計(jì)算機(jī)。

作為繼Hopper、Blackwell之后的最新一代AI計(jì)算平臺(tái),NVIDIA Rubin不僅是一次硬件升級(jí),更是一場(chǎng)由六款全新芯片深度協(xié)同構(gòu)建的系統(tǒng)級(jí)革命。其核心目標(biāo)直指當(dāng)前AI發(fā)展的最大瓶頸:高昂的推理成本與訓(xùn)練效率。

據(jù)英偉達(dá)方面數(shù)據(jù),Rubin平臺(tái)可將每個(gè)Token的推理成本降低高達(dá)10倍,訓(xùn)練混合專家(MoE)模型所需的GPU數(shù)量減少至四分之一。

Rubin平臺(tái)的突破性在于其“全棧協(xié)同設(shè)計(jì)”理念——不再孤立優(yōu)化單一芯片,而是將Vera CPU、Rubin GPU、NVLink 6交換機(jī)、ConnectX-9 SuperNIC、BlueField-4 DPU和Spectrum-6以太網(wǎng)交換機(jī)六大組件無(wú)縫集成,形成一臺(tái)性能驚人的AI超級(jí)計(jì)算機(jī)。

“Rubin的推出恰逢其時(shí),因?yàn)槿斯ぶ悄艿挠?xùn)練和推理計(jì)算需求正呈爆炸式增長(zhǎng),”英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛表示。“憑借我們每年推出新一代人工智能超級(jí)計(jì)算機(jī)的節(jié)奏,以及六款全新芯片的深度協(xié)同設(shè)計(jì),Rubin的推出標(biāo)志著我們向人工智能的下一個(gè)前沿領(lǐng)域邁出了巨大的一步。”

Rubin平臺(tái)以美國(guó)先驅(qū)天文學(xué)家Vera Florence Cooper Rubin的名字命名,她的發(fā)現(xiàn)改變了人類對(duì)宇宙的理解。該平臺(tái)包括NVIDIA Vera Rubin NVL72機(jī)架式解決方案和NVIDIA HGX Rubin NVL8系統(tǒng)。

英偉達(dá)介紹,Rubin平臺(tái)旨在滿足復(fù)雜AI工作負(fù)載的需求,其五項(xiàng)突破性技術(shù)包括:

第六代 NVIDIA NVLink:提供當(dāng)今大規(guī)模MoE模型所需的快速、無(wú)縫的GPU間通信。每個(gè)GPU提供3.6TB/s的帶寬,而Vera Rubin NVL72機(jī)架則提供260TB/s的帶寬——比整個(gè)互聯(lián)網(wǎng)的帶寬還要大。NVIDIA NVLink 6交換機(jī)內(nèi)置網(wǎng)絡(luò)內(nèi)計(jì)算能力,可加速集體操作,并新增多項(xiàng)功能以增強(qiáng)可維護(hù)性和彈性,從而實(shí)現(xiàn)更快、更高效的大規(guī)模AI訓(xùn)練和推理。

NVIDIA Vera CPU:專為智能推理而設(shè)計(jì),NVIDIA Vera是面向大規(guī)模AI工廠的最高效能CPU。這款NVIDIA CPU采用88 個(gè) NVIDIA定制Olympus內(nèi)核,完全兼容Armv9.2架構(gòu),并具備超高速NVLink-C2C連接。Vera提供卓越的性能、帶寬和業(yè)界領(lǐng)先的能效,可支持各種現(xiàn)代數(shù)據(jù)中心工作負(fù)載。

NVIDIA Rubin GPU: Rubin GPU采用第三代Transformer引擎,具備硬件加速自適應(yīng)壓縮功能,可為AI推理提供50 petaflops的NVFP4計(jì)算能力。

第三代NVIDIA機(jī)密計(jì)算:Vera Rubin NVL72是首個(gè)提供NVIDIA機(jī)密計(jì)算的機(jī)架級(jí)平臺(tái),可在CPU、GPU和NVLink域中維護(hù)數(shù)據(jù)安全,從而保護(hù)全球最大的專有模型、訓(xùn)練和推理工作負(fù)載。

第二代RAS引擎:Rubin平臺(tái)涵蓋GPU、CPU和NVLink,具備實(shí)時(shí)健康檢查、容錯(cuò)和主動(dòng)維護(hù)功能,可最大限度地提高系統(tǒng)效率。機(jī)架采用模塊化、無(wú)線纜托盤設(shè)計(jì),組裝和維護(hù)速度比Blackwell快18倍。

目前,NVIDIA Rubin已全面投入生產(chǎn),基于Rubin的產(chǎn)品將于2026年下半年通過(guò)合作伙伴推出。

盡管Rubin尚未正式出貨,但已獲得全球頂級(jí)生態(tài)支持。AWS、谷歌云、微軟Azure、甲骨文OCI四大云廠商將于2026年下半年率先上線Rubin實(shí)例;CoreWeave、Lambda、Nebius等AI原生云服務(wù)商同步跟進(jìn)。微軟更宣布在其下一代“Fairwater AI超級(jí)工廠”中大規(guī)模部署Vera Rubin NVL72系統(tǒng),支撐其Copilot+生態(tài)。

硬件方面,戴爾、HPE、聯(lián)想、超微、思科等服務(wù)器廠商將推出基于Rubin的HGX NVL8(8-GPU)和DGX SuperPOD參考架構(gòu),覆蓋從企業(yè)私有云到國(guó)家級(jí)AI實(shí)驗(yàn)室的全場(chǎng)景需求。