最近,人工智能大模型初創(chuàng)公司Anthropic發(fā)布了Claude 3系列AI模型。根據(jù)基準(zhǔn)測試結(jié)果,Claude 3在各項(xiàng)指標(biāo)上全面超越了ChatGPT-4。圈內(nèi)不少人士評價(jià),Claude 3再一次刷新了會話式人工智能的新高度。
Anthropic是OpenAI的強(qiáng)勁對手,其創(chuàng)始團(tuán)隊(duì)成員就是從OpenAI出走的技術(shù)人員。而這家大模型初創(chuàng)公司的背后,站著的是谷歌和亞馬遜這兩大科技巨頭。風(fēng)起云涌的大模型世界中,受微軟支持的OpenAI目前在商業(yè)化探索中遙遙領(lǐng)先,但在捍衛(wèi)技術(shù)先進(jìn)性方面壓力并不小。
地表最強(qiáng)AI大模型易主
Claude 3 AI系列模型有三個,按能力由弱到強(qiáng)排列分別是Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus。其中,性能最強(qiáng)的Opus在基準(zhǔn)測試的多個核心指標(biāo)上都全面超越了ChatGPT-4和谷歌的Gemini 1.0 Ultra,榮登目前的AI大模型榜單榜首。
根據(jù)Anthropic的介紹,Opus擁有人類本科生水平的知識,在復(fù)雜任務(wù)上表現(xiàn)出接近人類水平的理解力和流利性。同時(shí),所有Claude 3模型在分析預(yù)測、內(nèi)容創(chuàng)建、代碼生成以及西班牙語、日語和法語等非英語語言的對話方面都顯示出更強(qiáng)的能力。
綜合來看,Claude 3具有以下幾個亮點(diǎn):
一是“記憶力”超群,支持超長文本。Claude 3系列模型在發(fā)布時(shí)最初將提供200K上下文窗口,并且能夠準(zhǔn)確回憶大量數(shù)據(jù)中的信息。200K上下文對話長度,相當(dāng)于15萬英文單詞,而此前OpenAI發(fā)布的GPT-4 Turbo,可支持的上下文窗口為128K。業(yè)內(nèi)人士分析,長文本的優(yōu)勢讓Claude可以在讀論文、寫小說等涉及字?jǐn)?shù)更多的任務(wù)上,更擅長理解和回答用戶的問題。
二是多模態(tài)能力強(qiáng),視覺能力突出。據(jù)介紹,Claude 3具有與其他領(lǐng)先模型相媲美的復(fù)雜視覺能力,可以處理各種視覺格式,包括照片、圖表、圖形和技術(shù)圖解。根據(jù)網(wǎng)友測評,Claude 3允許用戶上傳圖像和其他文檔,能夠“認(rèn)”出和描述圖里的內(nèi)容,回答用戶的問題。
三是兼顧安全性與易用性。Claude模型一直被視為“最安全”的模型,致力于降低虛假信息、隱私泄露等方面的風(fēng)險(xiǎn)。不過,此前的Claude 2.1和Claude 2.0曾因?yàn)檫^于“道德”和“守法”,受到了用戶的質(zhì)疑和吐槽。不少人抱怨,Claude像一個難以溝通的“老頑固”,無論是請求幫忙起草文件、完成翻譯任務(wù),Claude總是能找到各種理由拒絕執(zhí)行。
在一些用戶看來,Anthropic為了追求安全而犧牲了模型的性能,帶來諸多不便,導(dǎo)致使用體驗(yàn)不佳,不少人就表示將取消訂閱Claude 2.1或Claude 2.0,轉(zhuǎn)而使用ChatGPT或其他競品。
更新的Claude 3依然十分重視安全性,但也在易用好用方面進(jìn)行了優(yōu)化,拒絕回答無害問題的頻率要低得多。據(jù)Anthropic介紹,與前幾代模型相比,Opus、Sonnet和Haiku拒絕回答的可能性要小得多,顯示出對用戶請求更細(xì)致的理解,能夠識別出真正的危害。
國海證券研報(bào)表示,“我們認(rèn)為Claude 3對幻覺問題的處理方式可能成為或已成為行業(yè)共識,即如何平衡模型過度保守(拒絕回答某些問題)和正確回答問題而非“不懂裝懂”的兩種傾向。
在Anthropic發(fā)布Claude 3以后,許多科技圈人士都在喊話OpenAI,在線“催更”,表示期待GPT-4.5或者GPT-5的問世。不過,去年6月,OpenAI CEO山姆·奧特曼就曾公開表示,“我們可能會嘗試按順序推出GPT-5模型,但不會很快”。目前,OpenAI更受到外界關(guān)注的產(chǎn)品是其2月發(fā)布的文生視頻模型Sora。
目前Claude 3成功登頂AI大模型榜單的榜首,但在飛速進(jìn)化的大模型技術(shù)浪潮下,地表最強(qiáng)AI大模型的桂冠在未來恐怕也將頻繁易主。
硅谷大模型之爭的兩大陣營
Anthropic是什么來頭?
事實(shí)上,這是一家成立時(shí)間只有3年左右的年輕公司,其兩位創(chuàng)始人Dario Amodei和Daniela Amodei都是OpenAI的前員工,離職前分別擔(dān)任OpenAI的研究部門副總裁和安全與策略部門副總監(jiān)。據(jù)外媒報(bào)道,Dario Amodei離職創(chuàng)業(yè)時(shí),還挖走了十幾名OpenAI的員工,其中就包括GPT-3首席工程師Tom Brown。
值得注意的是,Dario Amodei和Daniela Amodei之所以選擇自己出來做大模型,正是因?yàn)閷penAI在技術(shù)還不夠安全的情況下就快速商業(yè)化感到不滿,其愿景是構(gòu)建可靠的、可解釋的、可操控的AI系統(tǒng),首要目標(biāo)就是AI安全。這便也能夠理解,為什么Claude系列模型如此重視安全性。
與OpenAI主要依賴微軟為其提供資金支持不同,Anthropic背后站著谷歌、亞馬遜、Salesforce、高通、韓國電信等多個投資方。亞馬遜在投資的同時(shí),還成為了Anthropic主要的云計(jì)算提供商。Anthropic也成為了全球最“吸金”的大模型創(chuàng)業(yè)公司之一,僅在2023年,Anthropic就完成了5輪融資,獲得了共計(jì)73億美元的融資。
OpenAI由于背靠金主微軟,與其他的硅谷科技巨頭及它們所支持的大模型初創(chuàng)公司形成了明顯的兩大陣營。Anthropic無疑是其中最能夠與OpenAI叫板和分庭抗禮的一家公司。一名業(yè)內(nèi)人士分析,Anthropic的核心成員正是最初做出了GPT-2、GPT-3的人,團(tuán)隊(duì)的研究能力很強(qiáng)。在OpenAI發(fā)布ChatGPT以前,Anthropic其實(shí)就已經(jīng)做出了Claude產(chǎn)品,“兩個團(tuán)隊(duì)的技術(shù)能力不相上下”。
不過雖然OpenAI和Anthropic在技術(shù)的較量上十分焦灼,但是在商業(yè)化能力方面,OpenAI則要明顯領(lǐng)先于Anthropic。據(jù)The Information報(bào)道,截至去年年底,OpenAI的年化收入已經(jīng)達(dá)到16億美元,管理層預(yù)計(jì)到2024年底年化收入可達(dá)50億美元。但是,Anthropic預(yù)計(jì)到2024年底的年化收入僅僅為8.5億美元。
不過值得注意的是,OpenAI和Anthropic在商業(yè)化路線上有比較明顯的差異。與OpenAI面向C端用戶推出產(chǎn)品相比,Anthropic對B端客戶似乎更感興趣。Anthropic聯(lián)合創(chuàng)始人此前在接受福布斯采訪時(shí)表示,Anthropic更像是一家企業(yè)公司,而非消費(fèi)者公司。
目前,已有多家知名企業(yè)基于Anthropic模型開發(fā)了產(chǎn)品,例如,著名資產(chǎn)管理公司Bridgewater Associates基于Anthropic模型,開發(fā)了一款用于自動生成圖表、財(cái)務(wù)數(shù)據(jù)、總結(jié)財(cái)務(wù)摘要的AI助手。而Anthropic其他的B端客戶,還包括Gitlab、Notion、Salesforce等公司。
責(zé)編:岳亞楠
校對:王朝全