當(dāng)?shù)貢r(shí)間周四,英國(guó)初創(chuàng)公司Synthesia的AI技術(shù)迎來(lái)重大升級(jí),該公司創(chuàng)建的第四代人工智能(AI)虛擬人現(xiàn)在可以準(zhǔn)確表達(dá)人類的情感了。Synthesia聲稱,它最新的虛擬人EXPRESS-1模糊了虛擬世界和真實(shí)人物之間的界限,也是世界上首款表情豐富的AI虛擬形象。
在發(fā)布的演示視頻中,工作人員輸入不同表達(dá)情緒的文字,如“我很高興、我很傷心和我很沮喪”,之后AI虛擬人能夠以對(duì)應(yīng)的情緒朗讀文本。
EXPRESS-1能根據(jù)文本做出皺眉、微笑、驚訝等表情,這使其能夠像真正的演員一樣,用正確的語(yǔ)調(diào)、肢體語(yǔ)言和口型來(lái)表演對(duì)應(yīng)的劇本。
此外,EXPRESS-1可實(shí)時(shí)預(yù)測(cè)每一個(gè)動(dòng)作和面部表情,精準(zhǔn)匹配聲音和口型,驚人的人性化表演在行業(yè)中樹立了新的標(biāo)準(zhǔn)。
據(jù)Synthesia介紹,EXPRESS-1不僅僅只是簡(jiǎn)單地模仿人類的語(yǔ)言,而且能夠理解上下文,可隨時(shí)調(diào)整自己的表現(xiàn),表達(dá)出了一定程度的同理心和理解能力。
Synthesia成立于2017年,平臺(tái)的主營(yíng)業(yè)務(wù)是幫助用戶使用AI技術(shù)創(chuàng)建視頻,視頻中的虛擬化身能以130多種不同的語(yǔ)言作企業(yè)介紹、培訓(xùn)視頻等,無(wú)論是看起來(lái)還是聽起來(lái)都像真人。
制作視頻的過(guò)程相對(duì)簡(jiǎn)單,只需要提供文本稿件、選擇虛擬主播化身、設(shè)置場(chǎng)景和背景音樂等,Synthesia就可以自動(dòng)完成視頻的制作,這可以幫助用戶免除制作視頻過(guò)程中大量的成本。
目前,該公司的技術(shù)已被超過(guò)5.5萬(wàn)家企業(yè)使用,去年6月份,Synthesia獲得了約9000萬(wàn)美元的融資,估值達(dá)到10億美元,正式晉升為“獨(dú)角獸”企業(yè),其投資者包括Accel、英偉達(dá)和FirstMark Capital等。
Synthesia表示,考慮到其AI虛擬人極強(qiáng)的表現(xiàn)力以及易操作性,很有可能被不法分子濫用,因此已經(jīng)采取了包括限制內(nèi)容類型等措施。
另外,該公司還加入了內(nèi)容溯源與真實(shí)性聯(lián)盟,通過(guò)實(shí)施內(nèi)容憑證和數(shù)字水印技術(shù),提高AI生成內(nèi)容的透明度,幫助人們區(qū)分人類創(chuàng)作的內(nèi)容和AI生成的內(nèi)容。
來(lái)源:財(cái)聯(lián)社 作者:牛占林