多視角4D人臉掃描系統(tǒng) 給AI裝一雙“慧眼”

2024年05月08日 17:25:31 來(lái)源：中國(guó)科學(xué)報(bào)

　　圖像識(shí)別、智能助手、虛擬人、文生視頻……技術(shù)的發(fā)展和創(chuàng)新讓人們進(jìn)一步向智能時(shí)代邁進(jìn)。然而，目前運(yùn)用人工智能(AI)技術(shù)呈現(xiàn)的圖像畫(huà)面大多是二維效果，在空間、時(shí)間和細(xì)節(jié)方面仍有較大上升空間。

　　如何為AI裝一雙“慧眼”，讓畫(huà)面更清、更細(xì)、更自然?

　　近日，《中國(guó)科學(xué)報(bào)》記者從中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院(以下簡(jiǎn)稱深圳先進(jìn)院)了解到，該院集成技術(shù)研究所(以下簡(jiǎn)稱集成所)機(jī)器視覺(jué)研究中心研究員宋展團(tuán)隊(duì)自主研發(fā)出多視角4D高精度人臉三維成像系統(tǒng)。相較傳統(tǒng)的3D人臉掃描技術(shù)，該系統(tǒng)在精度、分辨率和速度上均實(shí)現(xiàn)大幅提升，可應(yīng)用領(lǐng)域包括但不限于人臉識(shí)別、醫(yī)療診斷、影視特效等。

　　人臉掃描更快、更清、更細(xì)

　　據(jù)介紹，研究團(tuán)隊(duì)開(kāi)發(fā)的多視角4D人臉掃描系統(tǒng)，由3個(gè)不同近紅外波段的結(jié)構(gòu)光相機(jī)構(gòu)成，底層算法采用團(tuán)隊(duì)提出的高頻條紋位移編碼三維重建方法，可以實(shí)現(xiàn)1080P(1920×1080像素)分辨率下超過(guò)100幀每秒的三維掃描速度，基于GPU的高并行三維重建算法可實(shí)現(xiàn)高達(dá)300赫茲的實(shí)時(shí)重建速度，且深度成像誤差小于0.05毫米。

　　“每個(gè)深度相機(jī)都由一個(gè)近紅外結(jié)構(gòu)光投影光柵和一個(gè)工業(yè)相機(jī)組成。深度相機(jī)每重建一次，投影儀都要向被測(cè)物體投射一組預(yù)設(shè)高頻條紋圖案，并用相機(jī)拍下它們?cè)诒粶y(cè)物體上產(chǎn)生變形的圖案。最終，根據(jù)相機(jī)拍到的變形圖案分析得到深度信息，即3D信息。深度相機(jī)實(shí)現(xiàn)連續(xù)掃描，增加了時(shí)間軸信息，由此得到4D信息。”深圳先進(jìn)院集成所在讀碩士生吳迪解釋說(shuō)。

　　此外，為實(shí)現(xiàn)多角度更為完整的三維人臉動(dòng)態(tài)成像，該系統(tǒng)采用3種不同波段的近紅外光作為光源，既能避免人臉產(chǎn)生炫目，又能避免3套設(shè)備投影儀投射的圖案相互干擾，大大改善了成像完整性。

　　“近紅外光對(duì)人眼友好，但對(duì)皮膚具有一定的穿透性，使得投射的高頻光柵圖案模糊，降低了三維重建精度。”宋展表示。對(duì)此，研究團(tuán)隊(duì)采用了創(chuàng)新的圖像增強(qiáng)算法，結(jié)合高魯棒性的條紋編解碼算法突破，提高了解碼投射圖案的相位計(jì)算精度，從而提高了三維重建精度。與此同時(shí)，研究團(tuán)隊(duì)還要考慮算法的實(shí)時(shí)性和并行性，為3D動(dòng)態(tài)模型獲取、頭部姿態(tài)估計(jì)和面部表情遷移等基礎(chǔ)工作的研究提供高精度數(shù)據(jù)支持。

　　支撐AI生成更高質(zhì)量三維數(shù)據(jù)

　　宋展介紹，該系統(tǒng)在多個(gè)領(lǐng)域應(yīng)用前景廣闊。例如，在新型顯示技術(shù)領(lǐng)域，有望為全息投影、空氣成像等新型顯示技術(shù)以及AR顯示終端，提供三維數(shù)據(jù)采集設(shè)備;在影視領(lǐng)域，可實(shí)時(shí)捕捉演員的高精度面部表情，結(jié)合表情遷移技術(shù)，實(shí)現(xiàn)從真人的表情到卡通形象的表情遷移;在游戲領(lǐng)域，可捕捉用戶面部信息，結(jié)合視線追蹤技術(shù)，實(shí)現(xiàn)人機(jī)交互;在醫(yī)療領(lǐng)域，可幫助提供患者面部表情信息，助力醫(yī)療診斷等;在人形機(jī)器人領(lǐng)域，可為機(jī)器人提供更加精確、敏銳的4D視覺(jué)感知方法，讓其從只能干粗活變成干更多精細(xì)活。

　　AI技術(shù)的發(fā)展，很大程度上依賴于數(shù)據(jù)驅(qū)動(dòng)。

　　“二維平面上生成的圖像或視頻往往難以呈現(xiàn)真實(shí)世界的三維結(jié)構(gòu)，未來(lái)，AI技術(shù)生成的視頻將逐漸從二維向三維發(fā)展。想要生成更高質(zhì)量的三維視頻，離不開(kāi)三維數(shù)據(jù)的支撐。”宋展說(shuō)。

　　該系統(tǒng)可以為“3D+AI”研究提供真實(shí)、精細(xì)的高質(zhì)量三維數(shù)據(jù)，解決目前該研究領(lǐng)域高精度三維數(shù)據(jù)不足的問(wèn)題，為AI模型生成更高質(zhì)量的視頻提供實(shí)時(shí)、高精度、高分辨率的數(shù)據(jù)支撐。

　　據(jù)了解，目前，研究團(tuán)隊(duì)已將該技術(shù)運(yùn)用于電影特效、特種加工、面部3D診療、動(dòng)態(tài)3D視覺(jué)引導(dǎo)裝配等方面，并取得了良好的效果。

　　未來(lái)，研究團(tuán)隊(duì)將進(jìn)一步加強(qiáng)底層算法研究，提高編碼效率成像速度，降低硬件成本，研制模塊化高時(shí)空分辨率4D成像器件，并將其應(yīng)用于工業(yè)和信息通信等更多領(lǐng)域，為新質(zhì)生產(chǎn)力發(fā)展提供銳利的視覺(jué)成像技術(shù)支撐。（記者刁雯蕙）

　　《中國(guó)科學(xué)報(bào)》 (2024-05-08 第3版領(lǐng)域)(刁雯蕙)

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。

海報(bào)生成中...

即時(shí)

全球頂級(jí)AI創(chuàng)作社區(qū)回歸！海藝AI國(guó)內(nèi)首發(fā)“全民娛樂(lè)化創(chuàng)作

海藝AI的模型系統(tǒng)在國(guó)際市場(chǎng)上廣受好評(píng)，目前站內(nèi)累計(jì)模型數(shù)超過(guò)80萬(wàn)個(gè)，涵蓋寫(xiě)實(shí)、二次元、插畫(huà)、設(shè)計(jì)、攝影、風(fēng)格化圖像等多類型應(yīng)用場(chǎng)景，基本覆蓋所有主流創(chuàng)作風(fēng)格。

一加Ace 6T官宣：全球首發(fā)驍龍8 Gen5

真我GT8 Pro阿斯頓馬丁F1限量版開(kāi)售，16GB+1TB售價(jià)5499元

新聞

市場(chǎng)占比高達(dá)35.8%，阿里云引領(lǐng)中國(guó)AI云增長(zhǎng)

9月9日，國(guó)際權(quán)威市場(chǎng)調(diào)研機(jī)構(gòu)英富曼(Omdia)發(fā)布了《中國(guó)AI云市場(chǎng)，1H25》報(bào)告。中國(guó)AI云市場(chǎng)阿里云占比8%位列第一。

企業(yè)IT

華為坤靈發(fā)布IdeaHub千行百業(yè)體驗(yàn)官計(jì)劃，助力中小企

9月24日，華為坤靈召開(kāi)“智能體驗(yàn)，一屏到位”華為IdeaHub千行百業(yè)體驗(yàn)官計(jì)劃發(fā)布會(huì)。

3C消費(fèi)

雅馬哈推出兩款高端頭戴耳機(jī)YH-4000與YH-C3000

雅馬哈昨日宣布推出兩款頭戴式耳機(jī)，分別是平板振膜的YH-4000和動(dòng)圈原理的YH-C3000。

研究

IDC：2025上半年全球智能家居清潔機(jī)器人出貨量同比暴

IDC今日發(fā)布的《全球智能家居清潔機(jī)器人設(shè)備市場(chǎng)季度跟蹤報(bào)告，2025年第二季度》顯示，上半年全球智能家居清潔機(jī)器人市場(chǎng)出貨1,2萬(wàn)臺(tái)，同比增長(zhǎng)33%，顯示出品類強(qiáng)勁的市場(chǎng)需求。