參考消息網(wǎng)6月23日?qǐng)?bào)道 外媒稱,麻省理工學(xué)院的研究人員發(fā)明一種技術(shù),能夠僅憑借聲音描繪出人臉。
據(jù)阿根廷布宜諾斯艾利斯經(jīng)濟(jì)新聞網(wǎng)6月18日?qǐng)?bào)道,僅憑聲音就可以描繪出人臉,這聽(tīng)起來(lái)似乎匪夷所思?,F(xiàn)在一個(gè)名為Speech2Face的自主智能學(xué)習(xí)系統(tǒng)已經(jīng)將其變?yōu)楝F(xiàn)實(shí)。
據(jù)麻省理工學(xué)院的研究人員稱,這個(gè)系統(tǒng)實(shí)際上就是一個(gè)神經(jīng)網(wǎng)絡(luò)。他們搜集了來(lái)自YouTube等網(wǎng)站上的海量視頻,而所有視頻內(nèi)容都是人在講話。隨后他們利用這些資料對(duì)這個(gè)能夠自主智能學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)加以訓(xùn)練。通過(guò)訓(xùn)練,這個(gè)系統(tǒng)學(xué)習(xí)到了聲音和面部特征的相關(guān)聯(lián)系,掌握了講話者的一些基本特征,例如年齡、性別、種族和音色等。
報(bào)道稱,自主智能學(xué)習(xí)系統(tǒng)能夠利用聲音與面部特征的關(guān)系,根據(jù)少量聲音片段大致推測(cè)出一個(gè)從未見(jiàn)過(guò)的講話者的面容。
值得一提的是,該系統(tǒng)并不能準(zhǔn)確還原一個(gè)講話者的面容,而是只能根據(jù)學(xué)習(xí)到的基本特征大致模擬人臉圖像。
研究人員指出,這是因?yàn)樵撓到y(tǒng)的訓(xùn)練方向就是捕捉與年齡、性別等特征相關(guān)的視覺(jué)特點(diǎn),而這些特點(diǎn)屬于多位講話者的共性。在海量資料的基礎(chǔ)上,該系統(tǒng)只有在從未見(jiàn)過(guò)的講話者身上找到足夠多的共性之后,才能大致模擬出一幅人臉圖像。因此這幅圖像無(wú)法做到精確還原講話者的面容。
此外,雖然該系統(tǒng)的資料庫(kù)規(guī)模龐大,但畢竟無(wú)法涵蓋全世界所有人,因此該系統(tǒng)模擬出來(lái)的圖像仍需要進(jìn)一步調(diào)整和完善。
目前該系統(tǒng)面臨的最大挑戰(zhàn)就是如何給這個(gè)資料庫(kù)擴(kuò)容,進(jìn)而使其描繪的講話者面容更加接近原型,但這項(xiàng)任務(wù)絕非易事,仍需研究人員進(jìn)一步努力。(編譯/劉麗菲)
責(zé)任編輯:楊林宇
特別聲明:本網(wǎng)登載內(nèi)容出于更直觀傳遞信息之目的。該內(nèi)容版權(quán)歸原作者所有,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。如該內(nèi)容涉及任何第三方合法權(quán)利,請(qǐng)及時(shí)與ts@hxnews.com聯(lián)系或者請(qǐng)點(diǎn)擊右側(cè)投訴按鈕,我們會(huì)及時(shí)反饋并處理完畢。
- 最新國(guó)際新聞 頻道推薦
-
400多名飛行員起訴波音 指控其掩飾737MAX缺陷2019-06-24
- 進(jìn)入圖片頻道最新圖文
- 進(jìn)入視頻頻道最新視頻
- 一周熱點(diǎn)新聞
已有0人發(fā)表了評(píng)論