一女被两男吃奶添下A片V|一级特黄特色|免费国产麻豆传|当今社会现象|国产精品日韩精品久久99|韩国深夜成人节目|成人做爰www免费看视频韩国

歡迎訪問深圳市中小企業(yè)公共服務(wù)平臺電子信息窗口

DeepSeek-V4預(yù)覽版百萬上下文成標配,華為昇騰首發(fā)適配國產(chǎn)算力

2026-04-24 來源:電子工程專輯
982

關(guān)鍵詞: DeepSeek-V4 開源模型 超長上下文 華為昇騰

4月24日,中國人工智能公司DeepSeek正式發(fā)布并開源全新系列模型DeepSeek-V4預(yù)覽版。 

該系列包含Pro與Flash兩個版本,均支持百萬字(1M)超長上下文。官方表示,V4在Agent能力、世界知識和推理性能三大維度上達到國內(nèi)與開源領(lǐng)域領(lǐng)先水平,其中Pro版本性能可比肩世界頂級閉源模型。

雙版本矩陣:旗艦對標頂尖,F(xiàn)lash普惠經(jīng)濟

DeepSeek-V4采用MoE(混合專家)架構(gòu),按性能與成本劃分為兩個版本。

DeepSeek-V4-Pro:總參數(shù)1.6萬億,激活參數(shù)490億,預(yù)訓練數(shù)據(jù)33萬億tokens。官方定位其為性能比肩頂級閉源模型的旗艦版本。在Agentic Coding評測中,V4-Pro達到當前開源模型最佳水平,內(nèi)部評測反饋使用體驗優(yōu)于Anthropic Sonnet 4.5,交付質(zhì)量接近Opus 4.6非思考模式,但仍與Opus 4.6思考模式存在一定差距。在世界知識測評中,V4-Pro大幅領(lǐng)先其他開源模型,僅稍遜于Google Gemini-Pro-3.1;在數(shù)學、STEM及競賽型代碼評測中,其超越所有已公開評測的開源模型,取得比肩世界頂級閉源模型的成績。官方技術(shù)報告指出,V4-Pro-Max(最大推理能力模式)在標準推理基準上總體約落后前沿閉源模型3–6個月。

DeepSeek-V4-Flash:總參數(shù)2840億,激活參數(shù)130億,預(yù)訓練數(shù)據(jù)32萬億tokens。該版本定位為更快捷、經(jīng)濟的輕量化選項,世界知識儲備略遜于Pro,但推理能力接近。由于參數(shù)與激活規(guī)模更小,其API服務(wù)在速度與成本上具備明顯優(yōu)勢。在Agent評測中,F(xiàn)lash在簡單任務(wù)上與Pro表現(xiàn)相當,高難度任務(wù)仍有差距。

1M上下文從“高端功能”變?yōu)椤盎A(chǔ)設(shè)施”

DeepSeek-V4在底層架構(gòu)上實現(xiàn)了重大創(chuàng)新。模型采用全新的Token維度注意力壓縮機制,結(jié)合自研DSA稀疏注意力技術(shù)(DeepSeek Sparse Attention),并引入CSA(Compressed Sparse Attention)與HCA(Heavily Compressed Attention)混合注意力架構(gòu)。據(jù)官方技術(shù)報告披露,在1M token場景下,V4-Pro的單token推理FLOPs僅為前代V3.2的27%,KV緩存用量僅為10%。

這一架構(gòu)創(chuàng)新的直接結(jié)果是:1M超長上下文將成為DeepSeek所有官方服務(wù)的標配。 一年前,百萬級上下文還是少數(shù)閉源旗艦?zāi)P偷膶倌芰?;如今DeepSeek將其以開源形式普惠化,并同步開放API服務(wù),開發(fā)者僅需修改model參數(shù)即可調(diào)用,接口兼容OpenAI ChatCompletions與Anthropic兩套標準。

功能層面,兩個版本均支持非思考模式與思考模式(可通過reasoning_effort參數(shù)設(shè)定high/max檔位),并支持Json Output、Tool Calls、對話前綴續(xù)寫等能力。此外,V4系列針對Claude Code、OpenClaw、OpenCode、CodeBuddy等主流Agent產(chǎn)品進行了專項適配與優(yōu)化。

華為昇騰首發(fā),CANN生態(tài)遷移

業(yè)界長期關(guān)注DeepSeek-V4是否會使用國產(chǎn)算力。從官方發(fā)布信息來看,DeepSeek-V4明確與華為昇騰合作。 華為云MaaS模型即服務(wù)平臺已為開發(fā)者提供免部署、一鍵調(diào)用DeepSeek-V4-Flash API的Tokens服務(wù)。昇騰CANN也于發(fā)布當日進行了DeepSeek V4在昇騰平臺的首發(fā)直播。

據(jù)多家媒體報道,DeepSeek-V4將運行于華為昇騰950系列芯片,技術(shù)架構(gòu)從英偉達CUDA生態(tài)向華為CANN框架進行底層遷移。DeepSeek官方在API定價頁備注稱:“受限于高端算力,目前Pro的服務(wù)吞吐十分有限,預(yù)計下半年昇騰950超節(jié)點批量上市后,Pro的價格會大幅下調(diào)。”

這一消息直接刺激了國產(chǎn)AI芯片板塊。發(fā)布當日,海光信息上漲6.77%,寒武紀漲超3%,中芯國際港股漲7.96%,華虹半導(dǎo)體港股漲12.20%,科創(chuàng)芯片ETF易方達漲2.87%。 據(jù)悉,寒武紀已基于vLLM推理框架完成對DeepSeek-V4的Day 0適配,適配代碼已開源至GitHub社區(qū)。市場觀點認為,V4等國產(chǎn)模型積極適配昇騰等國產(chǎn)AI算力芯片,有助于形成國內(nèi)“模型—芯片—云”的AI商業(yè)閉環(huán)。

開源與低價并行,閉源模型承壓

DeepSeek-V4以MIT許可證開源發(fā)布,模型權(quán)重已在Hugging Face、ModelScope平臺開放,配套58頁技術(shù)報告同步公開。

這一定價與開源策略,與幾乎同期發(fā)布的OpenAI GPT-5.5形成鮮明反差——GPT-5.5 API定價為每百萬輸出token 30美元(約合人民幣218元),而DeepSeek-V4-Pro輸出定價為每百萬token 24元人民幣,F(xiàn)lash版本更是低至2元人民幣。

海外開發(fā)者社區(qū)對此反應(yīng)強烈。有網(wǎng)友評價稱:“在24小時內(nèi)發(fā)布了兩個前沿模型,但商業(yè)模式完全相反。昨天GPT-5.5以30美元/百萬輸出token的價格推出,今天DeepSeek V4則以MIT許可發(fā)布。智能的成本底線剛剛崩塌,每一家AI產(chǎn)品公司都必須重新思考它們的利潤結(jié)構(gòu)?!?/span>

 

資本市場的反應(yīng)同樣直接。在DeepSeek-V4發(fā)布當日,港股大模型概念股智譜(02513.HK)跌超6.8%,Minimax(00100.HK)跌超4.6%,跌勢在消息發(fā)布后明顯擴大。

結(jié)語

DeepSeek-V4的發(fā)布,不僅是一次模型能力的迭代,更是一次對行業(yè)規(guī)則的重新定義:它將百萬字長上下文從“旗艦專屬”變?yōu)椤盎A(chǔ)設(shè)施”,將頂級推理能力以開源形式交付,并將國產(chǎn)算力納入核心供應(yīng)鏈。在OpenAI持續(xù)抬高閉源模型價格天花板的背景下,DeepSeek選擇以“開源+極致性價比”的路線,迫使全球AI產(chǎn)業(yè)鏈重新審視成本結(jié)構(gòu)與商業(yè)邏輯。

正如DeepSeek在發(fā)布文末所引用的《荀子》之言——“不誘于譽,不恐于誹,率道而行,端然正己”——這家中國AI公司正試圖以長期主義的技術(shù)務(wù)實,推動大模型能力真正走向普惠。