中國推出無GPU超算“靈晟”,搭載245萬個國產(chǎn)CPU核心
關(guān)鍵詞: 靈晟 超級計算機 Armv9架構(gòu) LX2處理器
近日,中國國家超級計算深圳中心(NSCC)部署了一臺名為靈晟(LineShine)的超級計算機,其性能高達1.54 ExaFLOPS(百億億次)。這臺超級計算機采用了大量基于Armv9架構(gòu)的LX2處理器,每個處理器擁有304個CPU核心。
與傳統(tǒng)超級計算機不同的是,LineShine超級計算機主要使用CPU來完成通用任務(wù)和協(xié)調(diào)工作,而不是依賴GPU進行大規(guī)模并行計算。
據(jù)了解,LineShine系統(tǒng)由20480個計算節(jié)點構(gòu)成,每個節(jié)點搭載2顆基于ARMv9架構(gòu)的LX2處理器,全系統(tǒng)總計40960顆處理器、超過245萬個CPU核心。節(jié)點之間通過“靈渠”高速網(wǎng)絡(luò)互連,采用雙平面多軌胖樹拓撲結(jié)構(gòu),每個節(jié)點1.6 Tb/s的帶寬。
LineShine超級計算機的LX2處理器由中國自主研發(fā),其設(shè)計針對大規(guī)模AI和HPC工作負載進行了優(yōu)化。所有CPU核心均支持Arm SVE(可伸縮向量擴展)和SME(可伸縮矩陣擴展),可直接高效處理FP64、FP32、BF16、FP16、INT8等多種數(shù)據(jù)格式的AI訓(xùn)練與推理任務(wù)。每個LX2處理器在FP64/FP32精度下分別可提供高達60.3/120.6 TFLOPS的算力,在BF16/FP16精度下可提供240 TFLOPS算力,在INT8精度下可特供960 TOPS算力。
此外,LX2處理器還采用了一種獨特的內(nèi)存子系統(tǒng),結(jié)合了32GB的片上HBM(高帶寬內(nèi)存)和高達256GB的片外DDR5內(nèi)存。這種內(nèi)存配置有助于提高數(shù)據(jù)處理速度和效率。
類似架構(gòu)曾被用于富士通(Fujitsu)Arm架構(gòu)A64FX處理器,也就是“富岳”(Fugaku)超級計算機所采用的芯片。不過,LX2可能是業(yè)內(nèi)首款面向AI與HPC場景、采用此類混合內(nèi)存架構(gòu)的Armv9 CPU。(校對/趙月)