2024年的最后一天,阿里打響年內(nèi)大模型降價的第三槍。
12月31日,記者從阿里云平臺獲悉,通義千問視覺理解模型自2024年12月31日10點起全線降價,降價幅度超80%。其中,Qwen-VL-Plus輸入價格每千tokens從0.008元降至0.0015元,降幅達81.3%,創(chuàng)下全網(wǎng)最低價格;更高性能的Qwen-VL-Max輸入價格每千tokens從0.02元降至0.003元,降幅高達85%。按照最新價格,1塊錢可最多處理約600張720P圖片,或1700張480P圖片。
Qwen-VL是阿里在2023年8月推出的具備圖文理解能力的多模態(tài)大模型,基于通義千問語言模型開發(fā)。今年年初,阿里發(fā)布了Qwen-VL-Plus和Qwen-VL-Max,升級后的Qwen-VL視覺水平大幅提升,對很多圖片的理解水平接近人類。據(jù)阿里介紹,在多個權(quán)威評測基準上,Qwen-VL的表現(xiàn)超越了包括GPT-4V和Gemini在內(nèi)的所有業(yè)界開源模型,尤其在文檔分析(DocVQA)和中文圖像相關任務(MM-Bench-CN)上。
多模態(tài)大模型是結(jié)合文本、圖像、音頻等多種模態(tài)信息進行學習和理解的人工智能模型。人工智能發(fā)展的進化方向是變得“更像人”,這決定了大模型不能停留在單一模態(tài),需要像人類一樣能夠理解和處理不同模態(tài)的信息。而隨著多模態(tài)技術的不斷迭代進步,大模型也將在具身智能、自動駕駛等領域開拓新的應用場景,擁有更高的智能水平。
通義千問團隊曾表示,阿里一直以來都把開發(fā)與人類一樣能聽、能看、能理解、能溝通的通用AI模型作為目標,所有多模態(tài)大模型的迭代更新,最重要的價值就在于與落地應用相融合,重塑各個行業(yè)。據(jù)了解,Qwen-VL是阿里云百煉平臺增長最快的模型,它能識別不同分辨率和長寬比的圖片,能理解20分鐘以上長視頻,還具備自主操作手機和機器人的視覺智能體能力,可應用于手機、汽車等各類終端視覺識別場景。
值得注意的是,這次是阿里年內(nèi)第三次對大模型進行降價。5月21日,阿里云發(fā)布降價公告,將旗下通義千問的多款商業(yè)化及開源模型進行大幅降價。其中,對標GPT-4的商業(yè)化模型Qwen-Long的API(應用程序編程接口)輸入價格從0.02元/千tokens降至0.0005元/千tokens,直降97%;輸出價格從0.02元/千tokens降至0.002元/千tokens,直降90%。
9月19日,在阿里2024云棲大會期間,阿里云百煉平臺上的三款通義千問主力模型再次降價。其中,Qwen-Turbo的價格低至每百萬輸入tokens 0.3元,較之前直降85%,Qwen-Plus和Qwen-Max的輸入價格則分別降價80%和50%。
當前,國內(nèi)大模型市場競爭區(qū)域白熱化,尤其是最近“大模型性價比之王”DeepSeek的出圈,讓大家看到了降低大模型訓練成本的更多可能性。數(shù)據(jù)顯示,在此前的兩輪降價中,阿里云百煉的付費客戶數(shù)都獲得了可觀的增長。業(yè)內(nèi)人士分析稱,大模型廠商的降價不僅是針對競爭對手,更是為拓展市場份額、提升客戶黏性而采取的務實決策。
責編:萬健祎
校對:高源