2月4日,央視新聞AI手語(yǔ)主播上崗,她將在冬奧會(huì)新聞播報(bào)、賽事直播和現(xiàn)場(chǎng)采訪中,為聽(tīng)障人士送上實(shí)時(shí)手語(yǔ)翻譯服務(wù)。
這位由“百度智能云曦靈”數(shù)字人平臺(tái)打造的首個(gè)AI手語(yǔ)主播,已在剛剛開(kāi)啟的冰雪賽事中上線,她提供的手語(yǔ)服務(wù),讓聽(tīng)障人士可以快捷獲取賽事資訊,感受賽事精彩。
從“段子手”朱廣權(quán)與AI手語(yǔ)主播在線pk的視頻可看到,AI手語(yǔ)主播的“手速”沒(méi)有被朱廣權(quán)的超快語(yǔ)速難住。她的專業(yè)能力是怎樣練成的?
手語(yǔ)數(shù)字人的本質(zhì)是解決翻譯問(wèn)題,難點(diǎn)在于,手語(yǔ)并非按照語(yǔ)言逐字翻譯,而要根據(jù)語(yǔ)句整體意思進(jìn)行語(yǔ)言精煉和語(yǔ)序調(diào)整。同時(shí),為幫助聽(tīng)障人士更好理解,還需實(shí)時(shí)配合表情和唇語(yǔ)。
這就要求AI手語(yǔ)數(shù)字人必須解決信息凝練度、低時(shí)延和精細(xì)化三方面極其復(fù)雜的技術(shù)難題。也就是說(shuō),AI手語(yǔ)主播不僅要有高精度的數(shù)字人形象,更要擁有能夠語(yǔ)音識(shí)別、手語(yǔ)翻譯和手語(yǔ)表達(dá)的AI大腦。
AI手語(yǔ)主播的AI大腦依托于百度智能云。為保證AI手語(yǔ)主播具備高可懂度的手語(yǔ)表達(dá)能力和精準(zhǔn)連貫的呈現(xiàn)效果,通過(guò)百度自主研發(fā)的機(jī)器翻譯技術(shù),百度智能云構(gòu)建出一套精確的手語(yǔ)翻譯引擎,可懂度達(dá)85%以上,媲美主流的中英、中日等方向的機(jī)器翻譯結(jié)果;結(jié)合百度自研的語(yǔ)音識(shí)別技術(shù),可將冰雪賽事的文字及音視頻內(nèi)容,快速精準(zhǔn)地轉(zhuǎn)化為手語(yǔ);通過(guò)專為手語(yǔ)優(yōu)化的自然動(dòng)作引擎,完成AI手語(yǔ)主播的動(dòng)作驅(qū)動(dòng),實(shí)時(shí)演繹為數(shù)字人的動(dòng)作、表情和唇語(yǔ);百度智能云基于《國(guó)家通用手語(yǔ)詞典》規(guī)范建立的規(guī)模龐大的手語(yǔ)動(dòng)作庫(kù),保證了手語(yǔ)表達(dá)的動(dòng)作準(zhǔn)確性;而用百度首創(chuàng)的4D掃描數(shù)據(jù)進(jìn)行訓(xùn)練,可讓AI手語(yǔ)主播的表情自然生動(dòng),口型生成準(zhǔn)確度高達(dá)98.5%。如此復(fù)雜的數(shù)字人研發(fā),百度智能云只用了不到2個(gè)月。
目前,數(shù)字人尚未實(shí)現(xiàn)規(guī)?;a(chǎn)業(yè)落地,主要原因在于制作技術(shù)門檻高、周期長(zhǎng)、成本高。百度集團(tuán)副總裁吳甜曾說(shuō):“百度希望通過(guò)領(lǐng)先的全棧AI能力,把虛擬人的生產(chǎn)周期縮短到小時(shí)級(jí)別,降低生產(chǎn)成本,并且用AI驅(qū)動(dòng)生成內(nèi)容。”
2021年12月,百度發(fā)布了集數(shù)字人生產(chǎn)、內(nèi)容創(chuàng)作、業(yè)務(wù)配置服務(wù)為一體的智能數(shù)字人平臺(tái)“百度智能云曦靈”,基于人像驅(qū)動(dòng)、智能對(duì)話、語(yǔ)音交互、智能推薦四大技術(shù)引擎,讓數(shù)字人“能聽(tīng)、能說(shuō)、能理解、可互動(dòng)”,讓相關(guān)企業(yè)能以低成本快速定制2D卡通、真人形象及3D卡通、超寫實(shí)數(shù)字人像,實(shí)現(xiàn)對(duì)話服務(wù)、內(nèi)容創(chuàng)作全流程業(yè)務(wù)配置,極大降低了數(shù)字人開(kāi)發(fā)難度。
比如,在百度智能云曦靈平臺(tái)上傳一張照片,就能快速生成一個(gè)可被AI驅(qū)動(dòng)的2D數(shù)字人像。如今,2D數(shù)字人的生產(chǎn)流程已從一個(gè)星期縮短到半個(gè)小時(shí),3D數(shù)字人的生成也已從兩三個(gè)月壓縮到一兩周的時(shí)間。
與此同時(shí),數(shù)字人個(gè)性化功能開(kāi)發(fā)也更加完善。比如,通過(guò)輕量化模型訓(xùn)練,用戶說(shuō)20句話即可生成屬于自己音色的數(shù)字人。百度AI人機(jī)交互實(shí)驗(yàn)室負(fù)責(zé)人李士巖說(shuō):“我們近一兩年的奮斗目標(biāo)是通過(guò)百度智能云曦靈平臺(tái)的開(kāi)放,讓每個(gè)人、每一家企業(yè)實(shí)現(xiàn)數(shù)字人自由。”
據(jù)了解,百度智能云曦靈已為諸多行業(yè)提供了一站式虛擬主持人、虛擬員工、虛擬偶像、品牌代言人的創(chuàng)建與運(yùn)營(yíng)服務(wù)。(劉 艷)
來(lái)源:科技日?qǐng)?bào)
責(zé)任編輯:莊婷婷
特別聲明:本網(wǎng)登載內(nèi)容出于更直觀傳遞信息之目的。該內(nèi)容版權(quán)歸原作者所有,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。如該內(nèi)容涉及任何第三方合法權(quán)利,請(qǐng)及時(shí)與ts@hxnews.com聯(lián)系或者請(qǐng)點(diǎn)擊右側(cè)投訴按鈕,我們會(huì)及時(shí)反饋并處理完畢。
- AI帶你暢游冬奧,曠視多維度加持科技奧運(yùn)2022-02-08
- 百度研究院發(fā)布2022科技趨勢(shì)預(yù)測(cè):AI技術(shù)成熱門2022-01-26
- 百度李彥宏:首款汽車機(jī)器人2022年亮相 集度2023年量產(chǎn)2021-12-27
已有0人發(fā)表了評(píng)論