“大家好,,歡迎來(lái)到科大訊飛官方直播間,我是你們的主播茜茜,?!?/span>
“我是茜茜的妹妹西西,別忘記點(diǎn)個(gè)‘關(guān)注’哦,,今天晚上福利可是很多的,。”
……
5月15日,,真人主播茜茜牽手“孿生妹妹”亮相科大訊飛抖音直播間,。這對(duì)“雙胞胎主播”雖然是樣貌相同的“姐妹花”,但西西借助科大訊飛新推出的“AI虛擬人直播系統(tǒng)”,,不僅復(fù)刻了真人主播茜茜的外在,,還賦予了其驅(qū)動(dòng)的能力,從而能夠?qū)崿F(xiàn)虛擬主播實(shí)時(shí)直播,。
AI虛擬主播性格可定制,、角色能多選
當(dāng)下,越來(lái)越多的AI虛擬主播走進(jìn)了大眾視野,,在直播間,、短視頻平臺(tái)等頻頻“出道”,憑借多維度、全感官,、沉浸式的交互體驗(yàn),,成為時(shí)下的“主播熱選”,集“萬(wàn)千寵愛(ài)于一身”,。
“科大訊飛AI虛擬主播依托語(yǔ)音識(shí)別,、人臉建模、口唇預(yù)測(cè),、音頻驅(qū)動(dòng)等自主關(guān)鍵技術(shù),,支持用戶通過(guò)文本或者語(yǔ)音輸入驅(qū)動(dòng)虛擬人進(jìn)行直播,從而實(shí)現(xiàn)智能驅(qū)動(dòng),,快速便捷地進(jìn)行虛擬直播,。”科大訊飛研究院執(zhí)行院長(zhǎng)劉聰告訴科技日?qǐng)?bào)記者,。
劉聰表示,科大訊飛基于大數(shù)據(jù)多模態(tài)預(yù)訓(xùn)練的語(yǔ)種及說(shuō)話人無(wú)關(guān)的口唇驅(qū)動(dòng)框架,,在保證高真實(shí)度的口唇合成效果的同時(shí),,還可以實(shí)現(xiàn)不同類型語(yǔ)音,包括不同語(yǔ)種,、方言,、音色的口唇驅(qū)動(dòng),讓虛擬主播無(wú)懼時(shí)空限制,,哪怕是在臥室的床邊也能進(jìn)行直播,,而且隨時(shí)可以與真人主播“無(wú)縫切換”,方式更加靈活,、多變,。“而‘AI虛擬人直播系統(tǒng)’還擁有豐富的場(chǎng)景庫(kù),,可以根據(jù)直播內(nèi)容,、虛擬人‘性格’等自由定制,打造專屬的虛擬人直播間,?!眲⒙斦f(shuō)。
據(jù)介紹,,科大訊飛“AI虛擬人直播系統(tǒng)”擁有豐富的形象庫(kù),,不僅能根據(jù)受眾喜好、需求個(gè)性化選擇五官“捏臉”,,創(chuàng)造一個(gè)全新的虛擬人,,還可以根據(jù)不同場(chǎng)景賦予其相應(yīng)的形象氣質(zhì),或2D或3D、或半身或全身,、或“鹽”或“甜”……“科大訊飛先進(jìn)的語(yǔ)音合成技術(shù),,還能為虛擬人定制個(gè)性化語(yǔ)音庫(kù),還原真人主播的聲音或是定制特色聲音,。多語(yǔ)種技術(shù)更是讓AI虛擬主播既支持中英混合播報(bào),,又支持日、韓,、泰,、越等多國(guó)語(yǔ)言,國(guó)際范兒十足,?!眲⒙斦f(shuō)。
可用于多個(gè)行業(yè),,未來(lái)也能“走進(jìn)”尋常人家
記者在采訪中了解到,,AI虛擬主播還可針對(duì)不同需求提供多端接口,并能面向多個(gè)場(chǎng)景提供垂直且完善的解決方案,,可用于媒體,、金融、文旅,、政企等多行業(yè),,提供音視頻內(nèi)容自動(dòng)化生產(chǎn)、智能交互的AI產(chǎn)品服務(wù),,輔助實(shí)現(xiàn)自動(dòng)化,、智能化的客戶價(jià)值。
其中,,在媒體新聞場(chǎng)景中,,可針對(duì)海量的音視頻內(nèi)容實(shí)現(xiàn)新聞內(nèi)容的音視頻生產(chǎn)自動(dòng)化。只要輸入文字即可“一站式”生產(chǎn)成品視頻,,尤其是對(duì)重大,、突發(fā)新聞等更新頻率較高的內(nèi)容播報(bào),能顯著提升效率,。目前,,央視新聞、人民日?qǐng)?bào)數(shù)字傳播,、合肥電視臺(tái)等媒體,,與科大訊飛共同打造的AI虛擬主播均已“上崗”,表現(xiàn)出色,。
“以‘虛擬人為載體的新一代人機(jī)交互’將快速進(jìn)化,,我們需要在感知,、理解、表達(dá)等多個(gè)維度持續(xù)取得技術(shù)突破,,讓人機(jī)交互體驗(yàn)得到跨越式的提升,。簡(jiǎn)單來(lái)說(shuō),就是我們希望虛擬人越來(lái)越聰明,,Ta們懂情感,、有個(gè)性,能夠幫助人類協(xié)助我們的工作和生活,?!眲⒙攲?duì)虛擬人未來(lái)發(fā)展充滿信心。
劉聰認(rèn)為,,從生產(chǎn)生活到奧運(yùn)賽場(chǎng),,人工智能早已不是沒(méi)有言語(yǔ)、冷冰冰的技術(shù),,而是飽含溫情,、賦能萬(wàn)物的科技力量?;贏I虛擬人交互平臺(tái)底座研發(fā)的“AI虛擬人直播系統(tǒng)”,,未來(lái)將會(huì)逐漸開放上百個(gè)虛擬形象、上千個(gè)音庫(kù),,提供多模感知、多維表達(dá),、情感貫穿,、自主定制的特色服務(wù),讓虛擬主播的形象更真實(shí),、情感更靈動(dòng),、交互更智能。
AI如同水和電一樣已融入百姓生活,。劉聰表示,,未來(lái)通過(guò)將技術(shù)與產(chǎn)品和應(yīng)用場(chǎng)景深度融合,虛擬人也能“走進(jìn)”尋常人家,,給人們的工作和生活帶來(lái)更便捷的服務(wù),,成為人類的親密伙伴。
(編輯:映雪)
