一女被两男吃奶添下A片V|一级特黄特色|免费国产麻豆传|当今社会现象|国产精品日韩精品久久99|韩国深夜成人节目|成人做爰www免费看视频韩国

歡迎訪問深圳市中小企業(yè)公共服務(wù)平臺電子信息窗口

登錄| 注冊

DeepSeek-V4預(yù)覽版百萬上下文成標配，華為昇騰首發(fā)適配國產(chǎn)算力

2026-04-24 來源：電子工程專輯

982

關(guān)鍵詞： DeepSeek-V4 開源模型超長上下文華為昇騰

4月24日，中國人工智能公司DeepSeek正式發(fā)布并開源全新系列模型DeepSeek-V4預(yù)覽版。

該系列包含Pro與Flash兩個版本，均支持百萬字（1M）超長上下文。官方表示，V4在Agent能力、世界知識和推理性能三大維度上達到國內(nèi)與開源領(lǐng)域領(lǐng)先水平，其中Pro版本性能可比肩世界頂級閉源模型。

雙版本矩陣：旗艦對標頂尖，F(xiàn)lash普惠經(jīng)濟

DeepSeek-V4采用MoE（混合專家）架構(gòu)，按性能與成本劃分為兩個版本。

DeepSeek-V4-Pro：總參數(shù)1.6萬億，激活參數(shù)490億，預(yù)訓練數(shù)據(jù)33萬億tokens。官方定位其為性能比肩頂級閉源模型的旗艦版本。在Agentic Coding評測中，V4-Pro達到當前開源模型最佳水平，內(nèi)部評測反饋使用體驗優(yōu)于Anthropic Sonnet 4.5，交付質(zhì)量接近Opus 4.6非思考模式，但仍與Opus 4.6思考模式存在一定差距。在世界知識測評中，V4-Pro大幅領(lǐng)先其他開源模型，僅稍遜于Google Gemini-Pro-3.1；在數(shù)學、STEM及競賽型代碼評測中，其超越所有已公開評測的開源模型，取得比肩世界頂級閉源模型的成績。官方技術(shù)報告指出，V4-Pro-Max（最大推理能力模式）在標準推理基準上總體約落后前沿閉源模型3–6個月。

DeepSeek-V4-Flash：總參數(shù)2840億，激活參數(shù)130億，預(yù)訓練數(shù)據(jù)32萬億tokens。該版本定位為更快捷、經(jīng)濟的輕量化選項，世界知識儲備略遜于Pro，但推理能力接近。由于參數(shù)與激活規(guī)模更小，其API服務(wù)在速度與成本上具備明顯優(yōu)勢。在Agent評測中，F(xiàn)lash在簡單任務(wù)上與Pro表現(xiàn)相當，高難度任務(wù)仍有差距。

1M上下文從“高端功能”變?yōu)椤盎A(chǔ)設(shè)施”

DeepSeek-V4在底層架構(gòu)上實現(xiàn)了重大創(chuàng)新。模型采用全新的Token維度注意力壓縮機制，結(jié)合自研DSA稀疏注意力技術(shù)（DeepSeek Sparse Attention），并引入CSA（Compressed Sparse Attention）與HCA（Heavily Compressed Attention）混合注意力架構(gòu)。據(jù)官方技術(shù)報告披露，在1M token場景下，V4-Pro的單token推理FLOPs僅為前代V3.2的27%，KV緩存用量僅為10%。

這一架構(gòu)創(chuàng)新的直接結(jié)果是：1M超長上下文將成為DeepSeek所有官方服務(wù)的標配。一年前，百萬級上下文還是少數(shù)閉源旗艦?zāi)Ｐ偷膶倌芰?；如今DeepSeek將其以開源形式普惠化，并同步開放API服務(wù)，開發(fā)者僅需修改model參數(shù)即可調(diào)用，接口兼容OpenAI ChatCompletions與Anthropic兩套標準。

功能層面，兩個版本均支持非思考模式與思考模式（可通過reasoning_effort參數(shù)設(shè)定high/max檔位），并支持Json Output、Tool Calls、對話前綴續(xù)寫等能力。此外，V4系列針對Claude Code、OpenClaw、OpenCode、CodeBuddy等主流Agent產(chǎn)品進行了專項適配與優(yōu)化。

華為昇騰首發(fā)，CANN生態(tài)遷移

業(yè)界長期關(guān)注DeepSeek-V4是否會使用國產(chǎn)算力。從官方發(fā)布信息來看，DeepSeek-V4明確與華為昇騰合作。華為云MaaS模型即服務(wù)平臺已為開發(fā)者提供免部署、一鍵調(diào)用DeepSeek-V4-Flash API的Tokens服務(wù)。昇騰CANN也于發(fā)布當日進行了DeepSeek V4在昇騰平臺的首發(fā)直播。

據(jù)多家媒體報道，DeepSeek-V4將運行于華為昇騰950系列芯片，技術(shù)架構(gòu)從英偉達CUDA生態(tài)向華為CANN框架進行底層遷移。DeepSeek官方在API定價頁備注稱：“受限于高端算力，目前Pro的服務(wù)吞吐十分有限，預(yù)計下半年昇騰950超節(jié)點批量上市后，Pro的價格會大幅下調(diào)。”

這一消息直接刺激了國產(chǎn)AI芯片板塊。發(fā)布當日，海光信息上漲6.77%，寒武紀漲超3%，中芯國際港股漲7.96%，華虹半導(dǎo)體港股漲12.20%，科創(chuàng)芯片ETF易方達漲2.87%。據(jù)悉，寒武紀已基于vLLM推理框架完成對DeepSeek-V4的Day 0適配，適配代碼已開源至GitHub社區(qū)。市場觀點認為，V4等國產(chǎn)模型積極適配昇騰等國產(chǎn)AI算力芯片，有助于形成國內(nèi)“模型—芯片—云”的AI商業(yè)閉環(huán)。

開源與低價并行，閉源模型承壓

DeepSeek-V4以MIT許可證開源發(fā)布，模型權(quán)重已在Hugging Face、ModelScope平臺開放，配套58頁技術(shù)報告同步公開。

這一定價與開源策略，與幾乎同期發(fā)布的OpenAI GPT-5.5形成鮮明反差——GPT-5.5 API定價為每百萬輸出token 30美元（約合人民幣218元），而DeepSeek-V4-Pro輸出定價為每百萬token 24元人民幣，F(xiàn)lash版本更是低至2元人民幣。

海外開發(fā)者社區(qū)對此反應(yīng)強烈。有網(wǎng)友評價稱：“在24小時內(nèi)發(fā)布了兩個前沿模型，但商業(yè)模式完全相反。昨天GPT-5.5以30美元/百萬輸出token的價格推出，今天DeepSeek V4則以MIT許可發(fā)布。智能的成本底線剛剛崩塌，每一家AI產(chǎn)品公司都必須重新思考它們的利潤結(jié)構(gòu)?！?/span>

資本市場的反應(yīng)同樣直接。在DeepSeek-V4發(fā)布當日，港股大模型概念股智譜（02513.HK）跌超6.8%，Minimax（00100.HK）跌超4.6%，跌勢在消息發(fā)布后明顯擴大。

結(jié)語

DeepSeek-V4的發(fā)布，不僅是一次模型能力的迭代，更是一次對行業(yè)規(guī)則的重新定義：它將百萬字長上下文從“旗艦專屬”變?yōu)椤盎A(chǔ)設(shè)施”，將頂級推理能力以開源形式交付，并將國產(chǎn)算力納入核心供應(yīng)鏈。在OpenAI持續(xù)抬高閉源模型價格天花板的背景下，DeepSeek選擇以“開源+極致性價比”的路線，迫使全球AI產(chǎn)業(yè)鏈重新審視成本結(jié)構(gòu)與商業(yè)邏輯。

正如DeepSeek在發(fā)布文末所引用的《荀子》之言——“不誘于譽，不恐于誹，率道而行，端然正己”——這家中國AI公司正試圖以長期主義的技術(shù)務(wù)實，推動大模型能力真正走向普惠。

相關(guān)文章

行業(yè)動態(tài)

機構(gòu)：全球4月電動汽車需求連續(xù)第二個月增長

鴻?；貞?yīng)美國威州廠遭黑客入侵：目前正恢復(fù)生產(chǎn)

中科院：上海微系統(tǒng)所新型柔性單晶硅電池隨天舟十號開展太空實驗

熱讀文章

苗圩出席統(tǒng)籌推進疫情防控和產(chǎn)業(yè)轉(zhuǎn)型升級促進制造業(yè)通信業(yè)穩(wěn)定發(fā)展發(fā)布會

一圖讀懂2020年《政府工作報告》

工業(yè)富聯(lián)：擬7763萬美元收購鴻海精密美國子公司相關(guān)資產(chǎn)