郭晨凱 制圖
“剛剛我還在用DeepSeek-R1模型測(cè)試本地知識(shí)庫(kù),它的文本生成能力比預(yù)期的更好?!?月6日,心動(dòng)公司媒體公關(guān)總監(jiān)陳承對(duì)上海證券報(bào)記者說(shuō)。
1月20日,DeepSeek正式發(fā)布DeepSeek-R1模型,并同步開源模型權(quán)重。DeepSeek模型的橫空出世掀起行業(yè)浪潮,多家公司迎來(lái)“破圈時(shí)刻”:在軟件端,一批上市公司宣布接入DeepSeek,加速自身AI應(yīng)用產(chǎn)品升級(jí);在硬件端,端側(cè)AI迎來(lái)加速發(fā)展契機(jī),2025年或?qū)⒊霈F(xiàn)一波AI硬件創(chuàng)業(yè)浪潮。
在昆侖萬(wàn)維董事長(zhǎng)兼CEO方漢看來(lái),DeepSeek的高性價(jià)比模型證明了,只要算法先進(jìn),訓(xùn)練成本跟推理成本都可以大幅度下降。這將會(huì)刺激整個(gè)大模型行業(yè)快速落地,對(duì)于整個(gè)行業(yè)非常有益。從行業(yè)長(zhǎng)期發(fā)展來(lái)看,DeepSeek對(duì)下游應(yīng)用落地起到很好的促進(jìn)作用,所有和編程、數(shù)理推斷相關(guān)的行業(yè),如金融、互聯(lián)網(wǎng)、法律等領(lǐng)域,都會(huì)得到極大發(fā)展。
中小企業(yè)涌入 AI迎來(lái)“破圈時(shí)刻”
據(jù)了解,DeepSeek-R1的訓(xùn)練費(fèi)用不到OpenAI GPT-4o的十分之一,且API定價(jià)僅為OpenAI o1的三十分之一。這意味著中小企業(yè)和個(gè)人開發(fā)者也能夠輕松使用這種高性能的人工智能技術(shù)。
蟻智島科技采用DeepSeek的服務(wù)已有半年之久,見證了其版本從v1到v3再到R1的更迭。蟻智島科技CEO隋闊認(rèn)為,DeepSeek最核心的影響是讓AI“破圈”了,憑借產(chǎn)品硬實(shí)力,很多圈外人得以迅速了解這一產(chǎn)品形態(tài)。“春節(jié)回來(lái)后不少老板主動(dòng)聯(lián)系我,想加速推動(dòng)AI在企業(yè)的落地。雖然還是有理解上的差異,但是DeepSeek接受度大大提高?!?/p>
市場(chǎng)對(duì)于DeepSeek的濃厚興趣,也體現(xiàn)在各行各業(yè)的加速布局中。
上海鋼聯(lián)在2月5日發(fā)布的調(diào)研紀(jì)要中提到,DeepSeek-R1開源推理模型成本低、推理能力強(qiáng),對(duì)大宗商品語(yǔ)義理解的復(fù)雜性,能有更好的處理能力。公司表示,希望盡快把基于DeepSeek的“小鋼”做出來(lái),在一季度借助DeepSeek-R1快速蒸餾出全新的“宗師”模型,并切換“小鋼”的基座模型。
2月6日,智云健康宣布將DeepSeek-R1模型接入公司自研醫(yī)療人工智能系統(tǒng)“智云大腦”。這一舉措將增強(qiáng)智云醫(yī)療大腦的數(shù)據(jù)挖掘能力,提高慢病管理效率。
中信證券發(fā)布研報(bào)稱,DeepSeek是國(guó)內(nèi)AI生態(tài)級(jí)的突圍,有望帶動(dòng)國(guó)內(nèi)AI全產(chǎn)業(yè)的快速發(fā)展。同時(shí),其開源與低成本的特性亦有望賦能AI應(yīng)用廠商,加速推動(dòng)端側(cè)AI落地。
也有專家提出,未來(lái),大部分的企業(yè)或個(gè)人都可以輕松地本地化部署DeepSeek,隨后DeepSeek對(duì)于AIGC類公司的影響將逐漸下降。企業(yè)的競(jìng)爭(zhēng)力依然取決于自身的AI應(yīng)用場(chǎng)景與產(chǎn)品。
“行業(yè)需要在算法迭代與芯片制造和設(shè)計(jì)上更進(jìn)一步,才能真正進(jìn)入世界先進(jìn)水平之列?!狈綕h告訴記者。
隋闊表示,DeepSeek的“破圈”是一個(gè)利好,隨著算力、算法、數(shù)據(jù)等其他環(huán)節(jié)的迭代優(yōu)化,會(huì)有更大的應(yīng)用前景。DeepSeek開源了R1的訓(xùn)練方法和流程,大幅提升了訓(xùn)練效率,但如果企業(yè)要訓(xùn)練依舊是“天價(jià)”。蒸餾模型依舊更適合企業(yè),高質(zhì)量數(shù)據(jù)依舊是核心。
端側(cè)AI加速跑激活硬件生態(tài)
事實(shí)上,相較于AI軟件,此次由DeepSeek帶動(dòng)的端側(cè)AI加速發(fā)展,有望大幅激活A(yù)I硬件的商業(yè)化生態(tài)。
受訪的業(yè)內(nèi)人士告訴記者,端側(cè)AI能優(yōu)化硬件性能,提高運(yùn)算速度、降低延遲,同時(shí)實(shí)現(xiàn)更復(fù)雜任務(wù)與增強(qiáng)交互,并支持更多離線等應(yīng)用場(chǎng)景,全面提升AI硬件的能力與價(jià)值。2025年將是AI眼鏡、AI玩具等AI硬件行業(yè)發(fā)展的重要一年。
從技術(shù)層面來(lái)看,DeepSeek模型采用改進(jìn)的算法和架構(gòu),實(shí)現(xiàn)了算法、框架和硬件的優(yōu)化協(xié)同,提高了模型在端側(cè)設(shè)備上的運(yùn)行效率,使端側(cè)AI部署變得更加具有普惠性。同時(shí),通過(guò)知識(shí)蒸餾,將大模型的能力高效遷移到輕量化模型上,開發(fā)者可快速將其AI能力部署至硬件設(shè)備并針對(duì)場(chǎng)景定制化,降低了智能產(chǎn)品的AI功能集成門檻。
Rokid投資者關(guān)系負(fù)責(zé)人方雨晴表示,在智能眼鏡行業(yè),企業(yè)是否接入大模型主要取決于Token(詞元)價(jià)格、平臺(tái)穩(wěn)定性和響應(yīng)速度等因素。企業(yè)可以在前期選擇多個(gè)AI大模型供用戶自由選擇。從行業(yè)來(lái)看,AI軟硬件公司普遍期待DeepSeek等國(guó)產(chǎn)或開源大模型能有更好的發(fā)展,有助于降低行業(yè)開發(fā)周期和投入。據(jù)介紹,Rokid專注于AR智能眼鏡的軟硬件研發(fā),并已與通義千問(wèn)等多模態(tài)大模型建立合作關(guān)系。
華安證券研報(bào)表示,目前不少國(guó)內(nèi)手機(jī)整機(jī)廠商推出端側(cè)AI功能。基于DeepSeek-R1在推理能力上表現(xiàn)出色,該模型若能進(jìn)入AI智能終端,將形成具有強(qiáng)大AI功能的產(chǎn)品,有望提升用戶體驗(yàn),增強(qiáng)產(chǎn)品吸引力,在與其他廠商的競(jìng)爭(zhēng)中更具優(yōu)勢(shì)。
從產(chǎn)業(yè)鏈來(lái)看,DeepSeek也有利于SoC芯片和存儲(chǔ)等行業(yè)的發(fā)展。
“從行業(yè)的長(zhǎng)期發(fā)展來(lái)說(shuō),DeepSeek會(huì)催生上游的推理芯片跟訓(xùn)練芯片的大幅進(jìn)步?!狈綕h說(shuō)。
泰凌微副總經(jīng)理、COO金海鵬對(duì)記者表示,隨著蒸餾技術(shù)的成熟,可以預(yù)見在泰凌微AI芯片上運(yùn)行的模型也會(huì)更強(qiáng)大。不過(guò),這些目標(biāo)無(wú)法在短期內(nèi)達(dá)到,需要時(shí)間的積累。公司未來(lái)或?qū)⒃诩夹g(shù)適配與優(yōu)化、應(yīng)用場(chǎng)景融合與生態(tài)合作方面與DeepSeek有交集。從行業(yè)來(lái)看,DeepSeek推動(dòng)端側(cè)AI成本降低,使整個(gè)端側(cè)AI市場(chǎng)需求增長(zhǎng),從而將帶動(dòng)端側(cè)AI芯片公司的市場(chǎng)拓展。
在AI硬件的商業(yè)化落地中,有了DeepSeek也并非高枕無(wú)憂。
人形機(jī)器人被視為AI硬件應(yīng)用的終極集成形態(tài)。DeepSeek如果被植入人形機(jī)器人中,是否會(huì)迎來(lái)更大的商機(jī)?對(duì)此,國(guó)內(nèi)一家機(jī)器人公司的相關(guān)負(fù)責(zé)人認(rèn)為,DeepSeek屬于ChatGPT的大類別,目前還無(wú)法深度驅(qū)動(dòng)人形機(jī)器人。
陳承也表示,DeepSeek盡管在文本處理方面十分突出,但目前多模態(tài)功能尚屬短板,因而使用場(chǎng)景更聚焦于文本處理及其衍生場(chǎng)景。