經(jīng)濟(jì)觀察網(wǎng) 記者 任曉寧
9月6日下午,百川智能在北京發(fā)布Baichuan 2系列開源大模型,這些模型可免費(fèi)商用,百川智能創(chuàng)始人兼CEO王小川說,其開源模型已經(jīng)全面超越了LLaMA2的性能。
LLaMA2發(fā)布于今年7月19日,由美國(guó)互聯(lián)網(wǎng)大廠Meta推出,當(dāng)時(shí)在全球引起轟動(dòng),外界評(píng)價(jià)說,LLaMA2的開源將可能影響大模型最終格局。
Baichuan 2開源大模型主要包括Baichuan2-7B和Baichuan2-13B,二者分別為70億參數(shù)和130億參數(shù)。王小川說,其70億參數(shù)模型在英文評(píng)測(cè)級(jí)上,已經(jīng)能夠齊平LLaMA2的130億參數(shù)模型,能夠做到“以小博大”。
同為大模型創(chuàng)業(yè)者的瀾舟科技創(chuàng)始人兼CEO周明也來到百川智能發(fā)布會(huì),周明說,國(guó)外開源模型更多是支持英文為主的西方語(yǔ)言,對(duì)中文的支持要么不足,要么不太友好。他認(rèn)為,Baichuan2兩款模型,對(duì)中文用戶的支持非常友好,而且它的性能在很多方面都超越了英文同等尺寸模型,因此是對(duì)中國(guó)大模型領(lǐng)域研究和應(yīng)用的利好消息。
Baichuan 2大模型建立在上一代產(chǎn)品基礎(chǔ)上,王小川解釋說,跟第一代相比,新產(chǎn)品文科、理科能力均得到提升,此外,其代碼能力、安全能力、邏輯、語(yǔ)義理解也有明顯的提升。
百川智能上一代大模型開源后下載量超過500萬次,有200多家企業(yè)申請(qǐng)?jiān)囉冒俅ㄩ_源模型,包括云廠商、科技制造公司、消費(fèi)公司等。在百川智能列出的名單里,阿里云、蔚來汽車、美的集團(tuán)都是合作伙伴。
百川智能成立于今年4月10日,4個(gè)月時(shí)間內(nèi)已發(fā)布了3款大模型產(chǎn)品,也是國(guó)內(nèi)首批通過《生成式人工智能服務(wù)管理暫行辦法》備案的8家大模型公司之一。此次百川智能又快速推出了2代產(chǎn)品,王小川解釋說,因?yàn)榘俅ㄖ悄苤坝兴阉骰颍虼颂烊欢萌绾螐娜f億網(wǎng)頁(yè)中間去精選最好的頁(yè)面,可以做到去重、反垃圾。在數(shù)據(jù)處理中,百川智能也借鑒了之前搜索的經(jīng)驗(yàn),能小時(shí)級(jí)完成千億數(shù)據(jù)的清洗和去重工作。
京公網(wǎng)安備 11010802028547號(hào)