999精品,丝袜综合,大陆老熟妇性,中国老女人AV,亚洲精品国产第一区二区三区

當(dāng)前熱門:“價(jià)格屠夫”DeepSeek上線,新模型成本下降超50%
發(fā)布時(shí)間:2025-09-29 20:32:46 文章來源:第一財(cái)經(jīng)資訊
當(dāng)前位置: 主頁 > 資訊 > 財(cái)經(jīng) > 正文


(資料圖片)

被稱為“價(jià)格屠夫”的DeepSeek再次揮刀降價(jià)了。

9月29日晚間,DeepSeek宣布正式發(fā)布 DeepSeek-V3.2-Exp模型,性能仍是穩(wěn)步提升,但出乎意料的是,調(diào)用價(jià)格大幅降低,尤其輸出價(jià)格大降75%,業(yè)界人士表示“這很難卷得過”。DeepSeek提到,在新價(jià)格政策下,開發(fā)者調(diào)用DeepSeek API的成本將降低50%以上。

具體來看,輸入價(jià)格上,緩存命中時(shí),DeepSeek-V3.2-Exp從0.5元/百萬tokens降至0.2元/百萬tokens,緩存未命中的價(jià)格則從4元/百萬tokens降為2元/百萬tokens;輸出價(jià)格上,從12元/百萬tokens直接降到了3元/百萬tokens。

降價(jià)原因方面,DeepSeek介紹是得益于新模型服務(wù)成本的大幅降低。V3.2-Exp是一個(gè)實(shí)驗(yàn)性(Experimental)的版本,作為邁向新一代架構(gòu)的中間步驟,在 V3.1-Terminus 的基礎(chǔ)上這一模型引入了 DeepSeek Sparse Attention(一種稀疏注意力機(jī)制),針對長文本的訓(xùn)練和推理效率進(jìn)行了探索性的優(yōu)化和驗(yàn)證。

簡單來說,因?yàn)閷?shí)現(xiàn)了細(xì)粒度稀疏注意力機(jī)制,在幾乎不影響模型輸出效果的前提下,可以實(shí)現(xiàn)長文本訓(xùn)練和推理效率的大幅提升。

DeepSeek介紹,為了嚴(yán)謹(jǐn)?shù)卦u估引入稀疏注意力帶來的影響,團(tuán)隊(duì)將 DeepSeek-V3.2-Exp 的訓(xùn)練設(shè)置與 V3.1-Terminus 進(jìn)行了嚴(yán)格的對齊。在各領(lǐng)域的公開評測集上,DeepSeek-V3.2-Exp 的表現(xiàn)與 V3.1-Terminus 基本持平。

目前,DeepSeek-V3.2-Exp 模型已在Huggingface與魔搭開源,官方App、網(wǎng)頁端、小程序均已同步更新為DeepSeek-V3.2-Exp。API 的模型版本已經(jīng)更新為 DeepSeek-V3.2-Exp,訪問方式保持不變。

此外,為支持社區(qū)研究,DeepSeek 還開源了新模型研究中設(shè)計(jì)和實(shí)現(xiàn)的 GPU 算子,包括 TileLang 和 CUDA 兩種版本。團(tuán)隊(duì)建議社區(qū)在進(jìn)行研究性實(shí)驗(yàn)時(shí),優(yōu)先使用基于 TileLang 的版本,以便于調(diào)試和快速迭代。

值得一提的是,就在9月22日,DeepSeek才發(fā)布了DeepSeek-V3.1-Terminus模型,Terminus在拉丁語里是終點(diǎn)、界限的意思,當(dāng)時(shí)業(yè)界猜測這是否會(huì)是V3系列的終極版本,并期待下一個(gè)發(fā)布的將是大版本更新,目前看起來這個(gè)猜測并不成立。

在年初海內(nèi)外出圈后,DeepSeek每一次更新都成為業(yè)界矚目的焦點(diǎn),但這幾個(gè)月以來DeepSeek幾次更新都是小版本的迭代,關(guān)于V4和R2的呼聲也越來越多。在DeepSeek這次 X平臺上的官宣帖子下,就有海外網(wǎng)友詢問“什么時(shí)候可以期待下一個(gè)V4和R2的版本”,很快有網(wǎng)友回復(fù)表示,結(jié)合這次發(fā)布來看近期并不會(huì)看到。

標(biāo)簽: 調(diào)用 exp 價(jià)格屠夫 深度思考按鈕 deepseek

最近更新