經(jīng)濟(jì)觀察網(wǎng) 記者 陳奇杰 繼字節(jié)跳動(dòng)、騰訊云等大模型廠商之后,5月21日,阿里云也加入大模型價(jià)格戰(zhàn),宣布通義千問(wèn)9款商業(yè)化和開源模型降價(jià)。
經(jīng)濟(jì)觀察網(wǎng)整理發(fā)現(xiàn),這9款大模型整體推理輸入價(jià)格降幅為67%—97%,有2款開源模型提供七天免費(fèi)優(yōu)惠。其中,通義千問(wèn)GPT-4(美國(guó)人工智能公司OpenAI的大語(yǔ)言模型)級(jí)主力模型Qwen-Long的API(應(yīng)用程序編程接口)輸入價(jià)格,從0.02元每千tokens(大模型文本中的最小單位)降至0.0005元每千tokens,降幅為97%。
阿里云介紹,Qwen-Long是通義千問(wèn)的長(zhǎng)文本增強(qiáng)版模型,最高支持1千萬(wàn)tokens長(zhǎng)文本輸入,降價(jià)后價(jià)格約為GPT-4的1/400。對(duì)比來(lái)看,GPT-4、Gemini 1.5 Pro(谷歌公司旗下大模型)、Claude 3 Sonnet(人工智能初創(chuàng)公司Anthropic旗下大模型)和Ernie-4.0(文心一言4.0)每千tokens輸入價(jià)格分別為0.22元、0.025元、0.022元和0.12元,均遠(yuǎn)高于Qwen-long。
降價(jià)當(dāng)日,阿里云智能集團(tuán)資深副總裁、公共云事業(yè)部總裁劉偉光在阿里云AI智領(lǐng)者峰會(huì)上稱,阿里云這次大幅降低大模型推理價(jià)格,目的就是希望加速AI應(yīng)用的爆發(fā)。阿里云預(yù)計(jì)未來(lái)大模型API的調(diào)用量會(huì)有成千上萬(wàn)倍的增長(zhǎng)。他還認(rèn)為,不管是開源模型還是商業(yè)化模型,公共云+API將成為企業(yè)使用大模型的主流方式。
2024年被認(rèn)為是AI應(yīng)用元年。但在業(yè)界看來(lái),推理成本過(guò)高依然制約著大模型規(guī)模化應(yīng)用。降價(jià)有助于吸引更多的產(chǎn)品使用者,除了阿里云,近期國(guó)內(nèi)外已有多家大模型廠商下調(diào)了旗下大模型產(chǎn)品的價(jià)格。
5月11日,智譜AI宣布,為了讓更多人都能使用該公司的入門級(jí)模型產(chǎn)品,GLM-3 Turbo 模型的調(diào)用價(jià)格由5元每百萬(wàn)tokens調(diào)整為1元每百萬(wàn)tokens;5月13日,OpenAI發(fā)布性能更強(qiáng)大的GPT-4o模型,API調(diào)用價(jià)格降低了50%;5月15日,字節(jié)跳動(dòng)首次對(duì)外公布大模型產(chǎn)品動(dòng)態(tài),并把旗下豆包大模型的計(jì)價(jià)單位從分降到了厘;日前,騰訊云也在官網(wǎng)下調(diào)了混元大模型的推理輸入價(jià)格。