国产猛男猛女超爽免费视频,国产精品一区二区不卡小说,免费调教小骚货视频,欧美日韩亚洲免费一区

3D重建是計(jì)算機(jī)視覺(jué)中的一個(gè)核心問(wèn)題，應(yīng)用于電影制作、視頻游戲的內(nèi)容制作、虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)、3D打印，等等。伯克利大學(xué)的研究團(tuán)隊(duì)提出根據(jù)單張彩色平面圖像重建出高質(zhì)量的3D幾何圖形的新方法，相比其他基線方法效果更好，也就是我們平時(shí)說(shuō)的3d打印照片建模。

從平面圖像重建3D幾何圖形是計(jì)算機(jī)視覺(jué)中的一個(gè)核心問(wèn)題。3D重建有許多應(yīng)用，例如電影制作、視頻游戲的內(nèi)容制作、虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)、3D打印，等等。這篇文章探討如何從單一的彩色圖像重建高質(zhì)量的3D幾何圖形，如下圖所示：

人類毫不費(fèi)勁就能理解物體和場(chǎng)景的形狀，哪怕我們看到的只是一張平面圖像。我們雙眼的結(jié)構(gòu)讓我們能夠感知深度，并不需要理解3D幾何。即使我們只看到一個(gè)物體的照片，我們也能對(duì)它的形狀有很好的理解。此外，我們還能夠理解例如物體背面的看不見(jiàn)的部分，這是了解物體形狀的重要能力。那么，人類是如何根據(jù)單個(gè)圖像推理其幾何形狀的呢？在人工智能方面提出的問(wèn)題是：我們可以怎樣教會(huì)機(jī)器這樣的能力？

形狀空間

從不明確的輸入重建幾何形狀的基本原理是，幾何形狀不是任意的，因此有些形狀更可能，有些則非常不可能。一般來(lái)說(shuō)，表面都是光滑的。在人造環(huán)境中，它們通常是分段的平面。例如，飛機(jī)通常有一個(gè)機(jī)身，機(jī)身兩側(cè)有兩個(gè)主翼，后方有一個(gè)垂直尾翼。人類能夠通過(guò)眼睛觀察世界，并動(dòng)手與世界互動(dòng)來(lái)獲取這樣的只是。在計(jì)算機(jī)視覺(jué)中，形狀不是任意的這一事實(shí)允許我們將一個(gè)對(duì)象類或多個(gè)對(duì)象類的所有可能形狀描述為一個(gè)低維的形狀空間（low dimensional shape space），這是從大量示例形狀獲取的。

使用CNN進(jìn)行體素預(yù)測(cè)

3D重建方面的一項(xiàng)最新工作[Choy et al. ECCV 2016, Girdhar et al. ECCV 2016]利用卷積神經(jīng)網(wǎng)絡(luò)（CNN）將物體的形狀預(yù)測(cè)為一個(gè)3D體積。作為輸出的3D體積被細(xì)分為體積元素，稱為體素（voxel），每個(gè)體素被確定為被占用或空著（即，分別屬于物體的內(nèi)部或外部）。輸入通常是一張彩色圖片，CNN使用一個(gè)上卷積解碼器架構(gòu)來(lái)預(yù)測(cè)占用體積（occupancy volume）。網(wǎng)絡(luò)被端到端地訓(xùn)練，并且由已知的真實(shí)占用體積進(jìn)行監(jiān)督，這些占用是從合成CAD模型數(shù)據(jù)集中獲取的。使用這種3D表示和CNN，可以學(xué)習(xí)能夠適用各種對(duì)象類的模型。

分層進(jìn)行表面預(yù)測(cè)

使用CNN預(yù)測(cè)占用體積的主要缺點(diǎn)是輸出的空間是三維的，因此它的分辨率具有指數(shù)函數(shù)級(jí)的增長(zhǎng)（cubic growth）。這個(gè)問(wèn)題限制了上述工作預(yù)測(cè)高質(zhì)量的幾何形狀，因此產(chǎn)生的是分辨率非常粗糙的體素網(wǎng)格（ voxel grids），例如32³（上圖）。在我們的工作中，我們認(rèn)為這是一個(gè)不必要的限制因素，因?yàn)閳D形的表面實(shí)際上只是二維的。我們利用表面的二維性質(zhì)，通過(guò)分層預(yù)測(cè)高分辨率體素，根據(jù)低分辨率的預(yù)測(cè)結(jié)果來(lái)推測(cè)表面。這個(gè)想法與八叉樹(shù)表示（octree representation）密切相關(guān)，八叉樹(shù)通常用于多視角立體視覺(jué)和深度圖融合（depth map fusion）來(lái)表示高分辨率的幾何形狀。

方法
基本的3D預(yù)測(cè)流程是將一張彩色圖像作為輸入，使用卷積編碼器將其先編碼為低維表示。然后，這個(gè)低維表示被解碼稱一個(gè)3D占用體積。我們的方法的主要想法被稱為分層表面預(yù)測(cè)（hierarchical surface prediction，HSP），是通過(guò)預(yù)測(cè)低分辨率體素開(kāi)始解碼。但是，與一般的方法相反，每個(gè)體素都被分類為自由空間（free space）或占用空間（occupied space），我們使用3個(gè)類：自由空間、占用空間和邊界。這允許我們以低分辨率分析輸出，并且只在有證據(jù)表明該輸出包含表面時(shí)預(yù)測(cè)該部分體積的更高分辨率。通過(guò)迭代這個(gè)細(xì)化的過(guò)程，我們可以分層第預(yù)測(cè)高分辨率體素網(wǎng)格（見(jiàn)下圖）。該方法的更多細(xì)節(jié)，請(qǐng)讀者閱讀技術(shù)論文。

實(shí)驗(yàn)

我們的實(shí)驗(yàn)主要是在合成的ShapeNet數(shù)據(jù)集上進(jìn)行的[Chang et al. arXiv 2015]。我們的研究的主要任務(wù)是根據(jù)單一的彩色圖像預(yù)測(cè)出高分辨率的3D圖形。我們將我們的方法與我們稱為low resolution hard（LR hard）和 low resolution soft（LR soft）的兩個(gè)基線進(jìn)行比較。這些基線以相同的低分辨率32³進(jìn)行預(yù)測(cè)，但訓(xùn)練數(shù)據(jù)的生成方式不同。LR hard 基線使用體素的二進(jìn)制分配。如果相應(yīng)的高分辨率體素中的至少一個(gè)被占用，則所有體素被標(biāo)記為被占用。LR soft基線使用分?jǐn)?shù)賦值，反映相應(yīng)高分辨率體素中占用體素的百分比。我們的HSP方法以256³的分辨率進(jìn)行預(yù)測(cè)。下圖中的結(jié)果顯示了與低分辨率基線相比，在生成3D圖形的表面質(zhì)量和高分辨率預(yù)測(cè)的完整性方面的好處。我們的論文中討論了更多實(shí)驗(yàn)和定量結(jié)果。

以上文章轉(zhuǎn)自新智元

国产猛男猛女超爽免费视频,国产精品一区二区不卡小说,免费调教小骚货视频,欧美日韩亚洲免费一区

解決3D重建難題，伯克利大學(xué)根據(jù)單張平面彩圖重建高精度3D結(jié)構(gòu)

行業(yè)快訊

熱門活動(dòng)

最新職位

品牌企業(yè)

推薦產(chǎn)品

作者其他文章

国产猛男猛女超爽免费视频,国产精品一区二区不卡小说,免费调教小骚货视频,欧美日韩亚洲免费一区

解決3D重建難題，伯克利大學(xué)根據(jù)單張平面彩圖重建高精度3D結(jié)構(gòu)

行業(yè)快訊

熱門活動(dòng)

最新職位

品牌企業(yè)

推薦產(chǎn)品

作者其他文章

解決3D重建難題，伯克利大學(xué)根據(jù)單張平面彩圖重建高精度3D結(jié)構(gòu)