鳳凰網(wǎng)科技訊 7月26日,在WAIC世界人工智能大會期間,百度公司對外展示了其在數(shù)字人領(lǐng)域的最新研發(fā)成果——新一代數(shù)字人技術(shù)NOVA。該技術(shù)依托百度慧播星平臺發(fā)布,旨在顯著提升數(shù)字人在直播場景下的綜合表現(xiàn)力與互動能力。
NOVA技術(shù)核心優(yōu)勢體現(xiàn)在三個方面。首先,該技術(shù)基于文心大模型4.5構(gòu)建的大師級劇本模式,能夠自動生成高質(zhì)量直播腳本,通過多模態(tài)技術(shù)協(xié)同實現(xiàn)數(shù)字人在直播環(huán)境中的形態(tài)、神情、聲音和容貌的精準(zhǔn)統(tǒng)一。
在智能交互層面,NOVA配備的AI決策系統(tǒng)能夠?qū)崟r分析直播數(shù)據(jù)流,通過多智能體調(diào)度機(jī)制完成觀眾問答互動,同時結(jié)合實時熱點生成具有個性化風(fēng)格的直播內(nèi)容。
技術(shù)復(fù)刻效率成為該方案的突出亮點。根據(jù)百度介紹,NOVA僅需采集10分鐘的真人樣本數(shù)據(jù),即可完成對目標(biāo)對象聲音特征、動作習(xí)慣以及表達(dá)氛圍的全面復(fù)刻,實現(xiàn)高度還原的數(shù)字人形象。
該技術(shù)此前已在商業(yè)場景中得到驗證。羅永浩數(shù)字人直播間運用該技術(shù)創(chuàng)造了5500萬元的商品交易總額,展現(xiàn)了數(shù)字人直播的商業(yè)潛力。
百度方面透露,NOVA技術(shù)計劃于今年10月面向全行業(yè)開放使用。屆時,普通商家和個人用戶將能夠獲得專業(yè)級的數(shù)字人直播能力。目前,該技術(shù)已啟動邀請測試階段,率先在教育培訓(xùn)、健康醫(yī)療等十余個垂直行業(yè)的內(nèi)容創(chuàng)作者和商家中進(jìn)行應(yīng)用試點。
上一篇:阿里巴巴:人到中年
下一篇:沒有了