日本免费在线一区二区-国产欧美日韩一区在线-国产男女猛烈无遮挡性视频网站-人妻内射视频免费看-女自慰喷水自慰不卡无广告-女生被男生操喷水的视频在线看-黑夜在线拖拽不卡第一页-av一区二区三区亚洲-亚洲国产精品成人婷婷色

歡迎訪問深圳市中小企業(yè)公共服務(wù)平臺電子信息窗口

Day-0支持|摩爾線程完成智譜GLM-5.1極速適配,高效支撐長程任務(wù)與代碼生成

2026-04-08 來源:摩爾線程
191

關(guān)鍵詞: 摩爾線程 GLM-5.1 智譜 國產(chǎn)算力 AI生態(tài)

今日,摩爾線程在其旗艦級AI訓(xùn)推一體全功能GPU MTT S5000上,成功實現(xiàn)了對智譜新一代旗艦?zāi)P虶LM-5.1的Day-0極速適配,提供推理部署和訓(xùn)練復(fù)現(xiàn)全流程支持。

依托MUSA軟件棧強大的生態(tài)兼容性,摩爾線程技術(shù)團隊基于高性能 SGLang-MUSA推理引擎及TileLang-MUSA算子編程語言,采用PD分離架構(gòu)完成深度調(diào)優(yōu),在 MTT S5000 上實現(xiàn) GLM-5.1 的高效、高精度推理。這一成果彰顯了國產(chǎn)算力基礎(chǔ)設(shè)施對前沿 SOTA 模型的快速響應(yīng)能力,也為行業(yè)樹立了軟硬協(xié)同應(yīng)對復(fù)雜 AI 推理場景的新標(biāo)桿。

GLM-5.1是智譜迄今最智能的旗艦?zāi)P停彩悄壳叭蜃顝姷拈_源模型。GLM-5.1大大提高了代碼能力,在最接近真實軟件開發(fā)的SWE-bench Pro基準(zhǔn)測試中超過GPT-5.4、Claude Opus 4.6,刷新全球最佳成績。值得一提的是,在模型整體性能大幅提升外,GLM-5.1還在長程任務(wù)(Long Horizon Task)處理能力上實現(xiàn)了顯著突破。和當(dāng)前分鐘級交互的模型不同,GLM-5.1能夠在一次任務(wù)中獨立、持續(xù)工作超過8小時,期間自主規(guī)劃、執(zhí)行、自我進化,最終交付完整的工程級成果。

針對GLM-5.1的長程任務(wù)與代碼生成特性,摩爾線程基于自研MUSA架構(gòu)與SGLang-MUSA、TileLang-MUSA等關(guān)鍵技術(shù),完成了系統(tǒng)性的算子適配與推理性能調(diào)優(yōu)。MTT S5000單卡AI算力(稠密)可達1000 TFLOPS,支持FP8到FP64全精度計算,其原生FP8加速顯著提升推理效率;結(jié)合高效KV Cache管理,有效支撐極長上下文的顯存需求;同時,PD分離架構(gòu)進一步解耦Prefill與Decode階段,降低長序列生成中的干擾,保障持續(xù)任務(wù)的高吞吐與低延遲。此外,MTT S5000提供784GB/s的卡間互聯(lián)帶寬,為大規(guī)模部署帶來彈性擴展能力。通過軟硬協(xié)同優(yōu)化,MTT S5000能夠穩(wěn)定承接GLM-5.1的長程任務(wù)吞吐與工程級代碼推理表現(xiàn)。

從GLM-4.7到GLM-5.1,摩爾線程已連續(xù)實現(xiàn)發(fā)布當(dāng)日極速適配。這既體現(xiàn)了MUSA架構(gòu)對主流AI生態(tài)的深度兼容,更標(biāo)志著國產(chǎn)全功能GPU已具備大模型“從適配到部署”的全鏈路支撐能力。摩爾線程將持續(xù)夯實算力底座,助力開發(fā)者快速應(yīng)用前沿模型,共建更成熟的國產(chǎn)AI生態(tài)。