在CES 2025主題演講中,英偉達(dá)大秀了一系列AI新品。
CES是消費(fèi)電子主場(chǎng),此次英偉達(dá)也是以消費(fèi)級(jí)顯卡GeForce RTX 50系列打頭陣,同時(shí)公布了巨型芯片Grace Blackwell NVLink72、小型超級(jí)計(jì)算機(jī)Project DIGITS、世界基礎(chǔ)模型平臺(tái)Cosmos等。
雖然是消費(fèi)端產(chǎn)品居多,但是技術(shù)新詞也不少。美西時(shí)間1月7日,CES開幕當(dāng)天,黃仁勛接受了21世紀(jì)經(jīng)濟(jì)報(bào)道等媒體的采訪,對(duì)前一日發(fā)布的新品進(jìn)一步解讀,也談到了AI的新趨勢(shì)。
當(dāng)黃仁勛踏進(jìn)采訪間,他率先拿起的是Project DIGITS,愛不釋手地說這很“cute”,并表示大家可以使用這臺(tái)AI超級(jí)計(jì)算機(jī)。
采訪中,黃仁勛也對(duì)DIGITS再釋義,DIGITS是“deep learning GPU intelligence training system”(深度學(xué)習(xí)GPU智能訓(xùn)練系統(tǒng))的縮寫。他坦言這款產(chǎn)品更適合科學(xué)家、開發(fā)者等使用,但是他認(rèn)為DIGITS潛力巨大,因?yàn)椤叭斯ぶ悄芸梢蚤_啟一個(gè)新篇章,它把世界上的計(jì)算機(jī)拋在后面”。
有意思的是,縱觀英偉達(dá)過去的發(fā)展歷史,其實(shí)他最早就是希望作為一家to C的公司,比如之前做游戲主機(jī)。但現(xiàn)實(shí)卻相反,他選擇了做算力的提供方?,F(xiàn)在,通過DIGITS這樣的“電腦主機(jī)”,又開拓了偏C端的AI PC路徑。
另一方面,隨著AI應(yīng)用不斷涌現(xiàn),推理成本也成為關(guān)注焦點(diǎn)。黃仁勛談道,英偉達(dá)通過不斷提升硬件性能(如Blackwell GPU系列)和優(yōu)化計(jì)算架構(gòu),大幅提高AI推理性能并降低成本。例如,新一代GPU的推理性能較上一代提升30到40倍,從而顯著降低了數(shù)據(jù)中心的運(yùn)行成本。此外,隨著算力增強(qiáng),訓(xùn)練和推理中的數(shù)據(jù)和模型精度不斷提高,也推動(dòng)了整個(gè)行業(yè)的發(fā)展。
此外,黃仁勛一如既往地看好機(jī)器人、自動(dòng)駕駛,他認(rèn)為未來幾乎所有的車都會(huì)具備自動(dòng)駕駛能力。同時(shí)黃仁勛對(duì)智能眼鏡和AI技術(shù)的結(jié)合表示感到興奮,這種設(shè)備可以通過云端的Cosmos模型支持,將復(fù)雜AI能力壓縮為小型模型,用于實(shí)時(shí)分析和交互。
黃仁勛。資料圖
迎接AI時(shí)代
記者:雖然英偉達(dá)發(fā)布了AI PC相關(guān)產(chǎn)品,但是今年相關(guān)產(chǎn)品銷量并未大幅增長,英偉達(dá)是否有能力改變這一現(xiàn)狀?
黃仁勛:AI的開發(fā)最早是在云端完成的。過去幾年里,英偉達(dá)的增長主要來自云端,云端AI已經(jīng)變得非常強(qiáng)大,尤其是在處理復(fù)雜的大型模型時(shí)。例如,這些模型非常龐大,適合在數(shù)據(jù)中心運(yùn)行和部署。
然而,我們?nèi)匀徽J(rèn)為,有許多設(shè)計(jì)師、軟件工程師、創(chuàng)作者和AI愛好者更喜歡在個(gè)人電腦上工作。問題在于,目前AI的大部分開發(fā)都需要在云端進(jìn)行,涉及大量的數(shù)據(jù)傳輸和計(jì)算,而這對(duì)很多人來說并不方便。
幸運(yùn)的是,Windows系統(tǒng)中的WSL 2(Windows Subsystem for Linux)提供了解決方案。這是一個(gè)虛擬化環(huán)境,可以在Windows上運(yùn)行第二操作系統(tǒng),并支持Docker容器。通過確保AI技術(shù)能夠在PC上的WSL 2環(huán)境中運(yùn)行,我們可以將云端的計(jì)算能力帶到個(gè)人電腦上。
我們正在努力推動(dòng)這一轉(zhuǎn)變,我認(rèn)為這就是正確的解決方案,我感到非常興奮,開發(fā)者們能夠利用Windows加上WSL 2在本地運(yùn)行AI模型。
記者:發(fā)布會(huì)宣布了諸多進(jìn)展,對(duì)于那些可能對(duì)AI缺乏了解的聽眾來說,你是否能用更簡單的方式解釋這些概念?
黃仁勛:作為一家科技公司,我們技術(shù)在影響并推動(dòng)未來的消費(fèi)者電子領(lǐng)域發(fā)展。昨天一個(gè)重要的宣布內(nèi)容是,我們推出了一個(gè)名為“Cosmos”的基礎(chǔ)模型。正如GPT專注于語言的基礎(chǔ)模型、Stable Diffusion專注于圖像,Cosmos是一種能夠理解物理世界的模型。
它可以理解摩擦力、慣性、物體存在感以及幾何和空間關(guān)系等物理屬性。這些是兒童都能理解的物理現(xiàn)象,但當(dāng)前的語言模型卻無法處理。我們相信需要一個(gè)能理解這個(gè)物理世界的基礎(chǔ)模型。
一旦Cosmos建立起來,它就能像GPT和Stable Diffusion那樣支持許多應(yīng)用。例如,您可以對(duì)Cosmos模型說,“告訴我這個(gè)房間里現(xiàn)在的情況”,它可以基于攝像頭看到的信息回答你。
總之,Cosmos是一個(gè)理解物理世界的模型。它的意義在于,只有讓AI理解物理環(huán)境,AI才能在現(xiàn)實(shí)世界中做出有意義的操作。自動(dòng)駕駛汽車需要理解物理世界,機(jī)器人也需要理解物理世界。因此,Cosmos這樣的模型是實(shí)現(xiàn)多模態(tài)的起點(diǎn)。
就像GPT模型推動(dòng)了人工智能應(yīng)用的發(fā)展,Llama對(duì)于人工智能的各種活動(dòng)至關(guān)重要,而Stable Diffusion則激發(fā)了圖像和視頻生成模型的發(fā)展一樣,我們期望Cosmos能夠成為推動(dòng)下一波人工智能創(chuàng)新的關(guān)鍵。
解決成本難題
記者:你提到了scaling law,特別是測(cè)試時(shí)間計(jì)算方面。但是計(jì)算成本變得非常昂貴,有些運(yùn)行需要耗費(fèi)數(shù)千美元。英偉達(dá)如何應(yīng)對(duì)這些高昂的成本?是否有解決方案可以讓推理計(jì)算更具成本效益?
黃仁勛:解決推理計(jì)算性能和成本問題的直接方法是提升我們的計(jì)算能力。這也是為什么我們推出了Blackwell GPU NVL 72,其推理性能相比Hopper提升了30到40倍。通過這種提升,我們將推理計(jì)算的單位成本降低了同等幅度,因?yàn)閿?shù)據(jù)中心的其他開銷基本保持不變。
從歷史上看,計(jì)算技術(shù)的進(jìn)步一直依賴于降低計(jì)算成本。過去20年,我們將邊際計(jì)算成本降低了約100萬倍,使得像機(jī)器學(xué)習(xí)這樣的技術(shù)成為可能。同樣的趨勢(shì)也會(huì)發(fā)生在推理階段:通過不斷提升性能,推理成本將會(huì)繼續(xù)下降。
此外,我們還有一種方式。今天,許多測(cè)試時(shí)間計(jì)算階段的輸出會(huì)變成預(yù)訓(xùn)練、后訓(xùn)練模型的輸入數(shù)據(jù)。這些數(shù)據(jù)會(huì)被用于后續(xù)的模型改進(jìn),這種方法不僅降低了訓(xùn)練和推理的綜合成本,還能讓模型變得更加智能。當(dāng)然,這一過程需要時(shí)間。因此,這三種scaling law將會(huì)并存一段時(shí)間。
一方面,我們會(huì)努力提升所有模型的智能水平,另一方面,人們會(huì)不斷提出更加復(fù)雜的問題,并期待得到更加智能的回答,這個(gè)循環(huán)將會(huì)持續(xù)不斷地進(jìn)行下去。
記者:我們注意到英偉達(dá)最新的旗艦顯卡RTX 5090和RTX 5080之間存在較大的性能差距。5090的核心數(shù)量是5080的兩倍,而價(jià)格也高出一倍。為什么會(huì)設(shè)計(jì)出這樣大的差距?
黃仁勛:原因很簡單,總有一些用戶想要“最好的”。如果我們提供稍差一點(diǎn)、便宜100美元的產(chǎn)品,他們也不在乎。對(duì)于他們來說,最重要的是品質(zhì)。當(dāng)然,2000美元的花費(fèi)不算小,但其價(jià)值是值得的。
但請(qǐng)記住,這些技術(shù)通常被用于家庭影院級(jí)的環(huán)境。這些用戶往往已經(jīng)在顯示器和音響系統(tǒng)上投入了上萬美元,因此他們也希望配備最好的GPU。我們的很多客戶都有這樣的需求,他們?cè)敢鉃榱双@得頂尖性能而投資更多。
拓展智能產(chǎn)品業(yè)務(wù)范圍
記者:你提到了Agent AI,像AWS、微軟、Salesforce這樣的公司,這些公司也有平臺(tái),你們是如何合作的?
黃仁勛:我們不是一家虛擬企業(yè)公司,而是一個(gè)科技平臺(tái)公司。我們將構(gòu)建工具包、庫和模型。我們關(guān)注ServiceNow、SAP、Oracle、Synopsys、Cadence和西門子等公司,他們?cè)诖怪鳖I(lǐng)域很專業(yè),但他們并不希望將精力投入到計(jì)算層和AI庫的開發(fā)上。因此,我們?yōu)樗麄兲峁┝诉@一解決方案。
我們開發(fā)了NIM和NEMO技術(shù),如果我們的CSP(云服務(wù)提供商)希望使用它們——實(shí)際上許多CSP已經(jīng)在使用了——他們可以用來訓(xùn)練他們的語言模型。我們?yōu)樾袠I(yè)創(chuàng)造了這些庫,這樣他們就不需要自己去做,不需要重復(fù)構(gòu)建這些東西了。
記者:自動(dòng)駕駛領(lǐng)域,與2017年相比,2025年行業(yè)有什么區(qū)別?2017年遇到的問題是什么?而2021年的技術(shù)創(chuàng)新是什么?
黃仁勛:首先,未來所有的移動(dòng)設(shè)備都會(huì)實(shí)現(xiàn)自動(dòng)化。在未來,大多數(shù)汽車你仍然可以選擇駕駛,但所有的汽車都有能力自動(dòng)駕駛。
5年前,這項(xiàng)技術(shù)是否能強(qiáng)大并不確定,但現(xiàn)在技術(shù),傳感器技術(shù)、計(jì)算機(jī)技術(shù)和軟件技術(shù)已經(jīng)非常成熟。我認(rèn)為現(xiàn)在有太多證據(jù)表明,新一代汽車,尤其是電動(dòng)汽車,幾乎每一輛都承諾具有自動(dòng)駕駛能力。這些技術(shù)不再是實(shí)驗(yàn)性質(zhì),而是正在廣泛落地。
特斯拉無疑是這個(gè)領(lǐng)域的領(lǐng)導(dǎo)者之一,但我們也看到來自中國的創(chuàng)新正在快速崛起。例如比亞迪、小鵬、蔚來、小米等公司展示了非常先進(jìn)的技術(shù)水平。這些公司在汽車行業(yè)中設(shè)立了新的標(biāo)準(zhǔn),證明了自動(dòng)駕駛和電動(dòng)車技術(shù)的潛力。
我認(rèn)為世界已經(jīng)發(fā)生了變化。雖然技術(shù)成熟的過程花費(fèi)了一些時(shí)間,我們的認(rèn)知也在不斷發(fā)展,但現(xiàn)在我認(rèn)為,自動(dòng)駕駛的未來已經(jīng)非常接近現(xiàn)實(shí)。