消息稱(chēng)DeepSeek R2下月發(fā):成本較GPT降97%
- 來(lái)源:快科技
- 作者:雪花
- 編輯:liyunfei
4月29日消息,據(jù)國(guó)內(nèi)媒體報(bào)道稱(chēng),深度求索可能會(huì)在下個(gè)月有所行動(dòng),推出下一代AI大模型DeepSeek-R2。
報(bào)道稱(chēng),DeepSeek-R2大模型將會(huì)采用一種更先進(jìn)的混合專(zhuān)家模型(MoE),其結(jié)合了更加智能的門(mén)控網(wǎng)絡(luò)層(Gating Network)以?xún)?yōu)化高負(fù)載推理任務(wù)的性能。
有分析師預(yù)計(jì),DeepSeek-R2的定價(jià)可能顯著低于OpenAI同類(lèi)產(chǎn)品,預(yù)示著其可能顛覆現(xiàn)有AI服務(wù)的定價(jià)模式。
此外,還有相關(guān)消息顯示,DeepSeek-R2預(yù)計(jì)比GPT-4成本下降97%;并且是在昇騰卡上做的訓(xùn)練,主打一個(gè)全方位全產(chǎn)業(yè)鏈的自主可控。
據(jù)相關(guān)人士透露的情況,DeepSeek-R2的總參數(shù)量可能會(huì)達(dá)到1.2萬(wàn)億,比DeepSeek-R1的6710億參數(shù)增加大約一倍。
DeepSeek-R2是一款基于華為昇騰910B(Ascend 910B)芯片集群訓(xùn)練的模型,在FP16精度下達(dá)到512PetaFLOPS的計(jì)算能力,芯片使用效率為82%。
據(jù)華為實(shí)驗(yàn)室統(tǒng)計(jì),這個(gè)性能相當(dāng)于英偉達(dá)上一代A100訓(xùn)練集群的91%左右。至于這些是不是真實(shí)的,還有待觀察,但看起來(lái)確實(shí)更強(qiáng)大、更自主了。

- 知情人士稱(chēng)哪吒汽車(chē)App斷網(wǎng)因流量欠費(fèi) 假期無(wú)人看管
- 抖音“五一”消費(fèi)數(shù)據(jù):住宿、家庭餐團(tuán)購(gòu)量增長(zhǎng)超七成
- 豐田章男:若生產(chǎn)太多電動(dòng)汽車(chē)反而會(huì)增加碳排放
- 美國(guó)AI企業(yè)網(wǎng)生Z世代調(diào)查 80%能接受與AI結(jié)婚
- 工信部推廣“二次號(hào)碼煥新” 注銷(xiāo)后一鍵解綁互聯(lián)網(wǎng)賬號(hào)
- 百度網(wǎng)盤(pán)將發(fā)布“星盤(pán)”:明星入駐網(wǎng)盤(pán)分享生活點(diǎn)滴
玩家點(diǎn)評(píng) (0人參與,0條評(píng)論)
熱門(mén)評(píng)論
全部評(píng)論