2025-09-29 18:40:08
每經(jīng)編輯|黃勝
9月29日,DeepSeek-V3.2-Exp模型正式在Hugging Face平臺(tái)發(fā)布并開源。
該版本作為邁向下一代架構(gòu)的重要中間步驟,在 V3.1-Terminus 的基礎(chǔ)上引入了團(tuán)隊(duì)自研的 DeepSeek Sparse Attention (DSA) 稀疏注意力機(jī)制,旨在對(duì)長(zhǎng)文本的訓(xùn)練和推理效率進(jìn)行探索性優(yōu)化與驗(yàn)證。這種架構(gòu)能夠降低計(jì)算資源消耗并提升模型推理效率。
目前,華為云已完成對(duì) DeepSeek-V3.2-Exp模型的適配工作,最大可支持160K長(zhǎng)序列上下文長(zhǎng)度。

隨著新模型服務(wù)成本的顯著降低,DeepSeek 同步采取了重磅舉措:大幅下調(diào)官方 API 價(jià)格,降價(jià)幅度超過 50%,新價(jià)格已即刻生效。目前,官方 App、網(wǎng)頁(yè)端和小程序均已同步更新至 DeepSeek-V3.2-Exp 版本。
每日經(jīng)濟(jì)新聞綜合公開消息
封面圖片來源:每日經(jīng)濟(jì)新聞
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
瞄準(zhǔn)未來產(chǎn)業(yè),成都落下量子科技產(chǎn)業(yè)版圖關(guān)鍵一子
當(dāng)AI深度重塑經(jīng)濟(jì)增長(zhǎng)模式,我們?nèi)绾胃谩榜{馭”它?
蓉光閃耀,聚愛同行!150余場(chǎng)全國(guó)助殘日活動(dòng)開啟成都美好初夏
對(duì)話柏林駐華商務(wù)聯(lián)絡(luò)處首席代表李怡燃:中德經(jīng)貿(mào)合作向好,雙方企業(yè)攜手開發(fā)第三市場(chǎng)將是新趨勢(shì)
對(duì)話謝菲爾德外事負(fù)責(zé)人尼克·漢密爾頓:百聞不如一見,成都和謝菲爾德有許多相似的地方
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP