21世紀(jì)經(jīng)濟(jì)報(bào)道記者孔海麗 北京報(bào)道
北京時(shí)間1月25日夜間,OpenAI一口氣奉上多項(xiàng)更新,新推出了2個(gè)嵌入模型,更新了3種模型的版本,并降低了多個(gè)模型及API的使用價(jià)格。
整體來說,系列更新主打一個(gè)“性能更強(qiáng)、價(jià)格更低”,這是普及科技產(chǎn)品的必經(jīng)之路。不可否認(rèn)的是,OpenAI的探索引領(lǐng)著大模型的走向,但這家明星獨(dú)角獸公司,也以其一貫的快速前行,持續(xù)給同行帶來了更多壓力。
新推出兩種嵌入模型
OpenAI發(fā)布了兩種新的嵌入模型,嵌入模型主要面向開發(fā)者端,提供更強(qiáng)力的技術(shù)支持。
其中,小型文本嵌入模型text-embedding-3-small的特點(diǎn)是更小、更高效,大型文本嵌入模型text-embedding-3-large的特點(diǎn)是更大、更強(qiáng)。
所謂“嵌入(embedding)”,是指自然語言或代碼等內(nèi)容中的數(shù)字序列。嵌入,使機(jī)器在學(xué)習(xí)模型和其他算法時(shí),可以輕松理解內(nèi)容之間的關(guān)系并執(zhí)行聚類或檢索等任務(wù),為ChatGPT和Assistants API中的知識(shí)檢索等應(yīng)用程序以及許多檢索增強(qiáng)生成(RAG)開發(fā)工具提供支持。
本次新發(fā)布的小型文本嵌入模型text-embedding-3-small,前身是發(fā)布于2022年12月的text-embedding-ada-002模型。OpenAI表示,與其前身相比,text-embedding-3-small的常用多語言檢索基準(zhǔn)(MTEB)平均得分從31.4%提高到44.0%,在英語任務(wù)中,MTEB的平均得分從61.0%增加到62.3%。
價(jià)格方面,text-embedding-3-small僅為上一代模型的五分之一,每個(gè)tokens的價(jià)格從0.0001美元降至0.00002美元。(注:在大語言模型中,tokens是文本的最小單位,通常指1個(gè)單詞、1個(gè)標(biāo)點(diǎn)符號(hào)、1個(gè)數(shù)字等。)
大型文本嵌入模型text-embedding-3-large被OpenAI描述為“性能最佳的新型號(hào)”,可以創(chuàng)建高達(dá)3072維的嵌入,在MIRACL庫中,text-embedding-3-large的平均得分從31.4%提高到54.9%,而在MTEB測試中,平均得分從61.0%提高到64.6%,售價(jià)為0.00013美元/1000 tokens。
不過,正如同ChatGPT調(diào)用的內(nèi)容有時(shí)間局限,OpenAI聲明,嵌入模型也缺乏對2021年9月之后所發(fā)生事件的了解。
經(jīng)典模型“價(jià)格更低、更勤快”
除了推出新的嵌入模型,OpenAI還加強(qiáng)了兩大經(jīng)典模型——GPT-4Turbo和GPT-3.5Turbo的功能,并修復(fù)了一些Bug。
OpenAI稱,將于下周推出新的GPT-3.5Turbo型號(hào),該模型將進(jìn)行各種功能的改進(jìn),比如格式響應(yīng)的準(zhǔn)確性更高,價(jià)格還將進(jìn)一步降低。據(jù)OpenAI透露,這已經(jīng)是該公司第三次對GPT-3.5Turbo進(jìn)行降價(jià)。新模型的輸入價(jià)格降低了50%,輸出價(jià)格降低了25%。
GPT-3.5Turbo是大多數(shù)人使用ChatGPT時(shí)調(diào)用的模型,幾乎等同于行業(yè)“金標(biāo)準(zhǔn)”。API表現(xiàn)上,GPT-3.5Turbo在許多任務(wù)中會(huì)比GPT-4成本更低、速度更快。
OpenAI提到,此次也發(fā)布了新版GPT-4Turbo預(yù)覽模型。與以前的預(yù)覽模型相比,該版本可以更徹底地完成代碼生成等任務(wù),旨在減少模型未完成任務(wù)的“懶惰”情況。
行業(yè)人士戲稱,大模型從開發(fā)人員那里不僅學(xué)到了知識(shí),還汲取到了“懶惰”的壞習(xí)慣。如今新版本模型旨在去除這種“取其糟粕”的繼承。
此外,OpenAI本次更新中提到了新的審核模型——text-moderation-007,被其稱為“迄今為止最強(qiáng)大的審核模型”,將為安全工作保駕護(hù)航,免費(fèi)的審核API允許開發(fā)人員識(shí)別可能有害的文本。
接下來的幾個(gè)月,OpenAI還計(jì)劃全面推出具有視覺功能的GPT-4Turbo,并進(jìn)一步提高開發(fā)人員查看API使用情況和管理API密鑰的能力。
隨著簡化模型、完善基礎(chǔ)設(shè)施的推進(jìn),OpenAI持續(xù)提升性能并穩(wěn)步降低產(chǎn)品價(jià)格,在其他人工智能大模型公司的追趕下,這也保證了OpenAI對用戶的吸引力。
對于其他企業(yè)來說,在保證自身開發(fā)節(jié)奏的前提下,也可以持續(xù)從OpenAI的業(yè)務(wù)動(dòng)作中汲取靈感,趕上甚至超越OpenAI是一件值得努力的事情。