卷積神經(jīng)網(wǎng)絡(luò)四種卷積類型

UsherChen 發(fā)布于2019-04-25 18:32 / 2280人閱讀

摘要：實際的反卷積會使卷積過程恢復(fù)。轉(zhuǎn)置卷積層執(zhí)行常規(guī)卷積，但恢復(fù)其空間變換。轉(zhuǎn)換卷積，沒有填充，步幅為，內(nèi)核為轉(zhuǎn)置卷積不會這樣做。在神經(jīng)網(wǎng)絡(luò)中，我們通常使用稱為深度可分離卷積的東西。

使用內(nèi)核大小為3，步長為1和填充的2D卷積

一般卷積

首先，我們需要就定義卷積層的一些參數(shù)達成一致。

卷積核大?。↘ernel Size）：卷積核定義了卷積的大小范圍，二維卷積核最常見的就是 3*3 的卷積核。

步長（Stride）：步長定義了當卷積核在圖像上面進行卷積操作的時候，每次卷積跨越的長度。在默認情況下，步長通常為 1，但我們也可以采用步長是 2 的下采樣過程，類似于 MaxPooling 操作。

填充（Padding）：卷積層采用一定數(shù)量的輸入通道（I），并且設(shè)計特定數(shù)量的輸出通道（O）。每一層所需的參數(shù)可以通過 I*O*K 來進行計算，其中 K 等于卷積核的數(shù)量。

輸入和輸出管道（Input & Output Channels）：卷積層采用一定數(shù)量的輸入通道

擴張的卷積

使用3內(nèi)核進行2D卷積，擴展率為2且無填充

擴張的卷積為卷積層引入另一個參數(shù)，稱為擴張率。這定義了卷積核中值之間的間距。擴張率為2的3x3內(nèi)核與5x5內(nèi)核具有相同的視野，而僅使用9個參數(shù)。想象一下，獲取一個5x5內(nèi)核并刪除每一個第二列和第二行（間隔刪除），就是我們介紹的卷積。

這以相同的計算成本提供了更寬的視野。擴張卷積在實時分割領(lǐng)域中特別受歡迎。如果您需要廣泛的視野并且無法承受多個卷積或更大的核，請使用它們。

轉(zhuǎn)置卷積

（又稱解卷積或分數(shù)跨度卷積）

有些消息來源使用名稱deconvolution，這是不合適的，因為它不是解卷積。為了使事情更糟，確實存在解卷積，但它們在深度學(xué)習(xí)領(lǐng)域并不常見。實際的反卷積會使卷積過程恢復(fù)。想象一下，將圖像輸入到單個卷積層中。現(xiàn)在取出輸出，將它扔進一個黑盒子里然后再出現(xiàn)原始圖像。這個黑盒子進行反卷積。它是卷積層的數(shù)學(xué)逆。

轉(zhuǎn)置卷積有點類似，因為它產(chǎn)生與假設(shè)的反卷積層相同的空間分辨率。但是，對值執(zhí)行的實際數(shù)學(xué)運算是不同的。轉(zhuǎn)置卷積層執(zhí)行常規(guī)卷積，但恢復(fù)其空間變換。

2D卷積，沒有填充，步幅為2，內(nèi)核為3

此時你應(yīng)該很困惑，讓我們看一個具體的例子。將5×5的圖像送入卷積層。步幅設(shè)置為2，填充停用，內(nèi)核為3x3。這導(dǎo)致2x2圖像。

如果我們想要反轉(zhuǎn)這個過程，我們需要逆數(shù)學(xué)運算，以便從我們輸入的每個像素生成9個值。然后，我們以2的步幅遍歷輸出圖像。這將是反卷積。

轉(zhuǎn)換2D卷積，沒有填充，步幅為2，內(nèi)核為3

轉(zhuǎn)置卷積不會這樣做。的共同點是它保證輸出也是5x5圖像，同時仍然執(zhí)行正常的卷積操作。為此，我們需要在輸入上執(zhí)行一些花哨的填充。

正如您現(xiàn)在可以想象的那樣，此步驟不會從上面顛倒過程。至少不涉及數(shù)值。

它只是從之前重建空間分辨率并執(zhí)行卷積。這可能不是數(shù)學(xué)逆，但對于編碼器 - 解碼器架構(gòu)，它仍然非常有用。這樣我們就可以將圖像的升級與卷積相結(jié)合，而不是進行兩個多帶帶的處理。

可分離的卷積

在可分離的卷積中，我們可以將內(nèi)核操作分成多個步驟。讓我們將卷積表示為y = conv（x，k），其中y是輸出圖像，x是輸入圖像，k是核。簡單。接下來，假設(shè)k可以通過以下公式計算：k = k1.dot（k2）。這將使它成為可分離的卷積，因為我們可以通過用k1和k2進行2個1D卷積來得到相同的結(jié)果，而不是用k進行2D卷積。

Sobel X和Y濾鏡

以Sobel內(nèi)核為例，它通常用于圖像處理。你可以通過乘以向量[1,0，-1]和[1,2,1] .T得到相同的內(nèi)核。在執(zhí)行相同操作時，這將需要6個而不是9個參數(shù)。上面的例子顯示了所謂的空間可分卷積，據(jù)我所知，它不用于深度學(xué)習(xí)。

編輯：實際上，通過堆疊1xN和Nx1內(nèi)核層，可以創(chuàng)建與空間可分離卷積非常相似的東西。這最近在一個名為EffNet的架構(gòu)中使用，顯示了有希望的結(jié)果。

在神經(jīng)網(wǎng)絡(luò)中，我們通常使用稱為深度可分離卷積的東西。這將執(zhí)行空間卷積，同時保持通道分離，然后進行深度卷積。在我看來，通過一個例子可以較好地理解它。

假設(shè)我們在16個輸入通道和32個輸出通道上有一個3x3卷積層。詳細情況是，32個3x3核遍歷16個通道中的每個通道，產(chǎn)生512（16x32）個特征映射。接下來，我們通過添加它們來合并每個輸入通道中的1個特征圖。由于我們可以做32次，我們得到了我們想要的32個輸出通道。

對于同一示例中的深度可分離卷積，我們遍歷16個通道，每個通道有1個3x3內(nèi)核，為我們提供了16個特征映射?，F(xiàn)在，在合并任何東西之前，我們遍歷這16個特征映射，每個特征映射有32個1x1卷積，然后才開始將它們加在一起。這導(dǎo)致656（16x3x3 + 16x32x1x1）參數(shù)與上面的4608（16x32x3x3）參數(shù)相反。

該示例是深度可分離卷積的特定實現(xiàn)，其中所謂的深度乘數(shù)為1.這是迄今為止這種層的最常見設(shè)置。我們這樣做是因為空間和深度信息可以解耦的假設(shè)?？匆幌耎ception模型的表現(xiàn)，這個理論似乎有效。由于其有效使用參數(shù)，深度可分離卷積也用于移動設(shè)備。

聲明：本文版權(quán)歸原作者所有，文章收集于網(wǎng)絡(luò)，為傳播信息而發(fā)，如有侵權(quán)，請聯(lián)系小編及時處理，謝謝！

歡迎加入本站公開興趣群

商業(yè)智能與數(shù)據(jù)分析群

興趣范圍包括各種讓數(shù)據(jù)產(chǎn)生價值的辦法，實際應(yīng)用案例分享與討論，分析工具，ETL工具，數(shù)據(jù)倉庫，數(shù)據(jù)挖掘工具，報表系統(tǒng)等全方位知識

QQ群：81035754

云服務(wù)器 GPU云服務(wù)器卷積神經(jīng)網(wǎng)絡(luò) python卷積網(wǎng)絡(luò) 卷積神經(jīng)網(wǎng)絡(luò)圖像識別卷積網(wǎng)絡(luò)gpu并行實例

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://m.hztianpu.com/yun/4861.html

發(fā)表評論

登陸后可評論

0條評論

UsherChen

男|高級講師

我要關(guān)注我要私信

TA的文章

智能計算基礎(chǔ)平臺安全架構(gòu)設(shè)計與思考

閱讀 960·2021-11-23 09:51
Private-Hosting：德國vps，AMD Ryzen 9 3900x，1核/1GB內(nèi)存/2

閱讀 1205·2021-11-15 17:57
云主機網(wǎng)站如何備份-云主機如何備份？

閱讀 1719·2021-09-22 15:24
強烈推薦這款神器，把網(wǎng)站轉(zhuǎn)pdf還能編程高級定制！【建議收藏】

閱讀 866·2021-09-07 09:59
帶加載進度的Web圖片懶加載組件Lazyload

閱讀 2299·2019-08-29 15:10
viewport 的理解

閱讀 1908·2019-08-29 12:47
如何使用HTML5自定義數(shù)據(jù)屬性

閱讀 819·2019-08-29 12:30
動態(tài)網(wǎng)站SEO解決方案經(jīng)驗匯總

閱讀 3457·2019-08-26 13:51

成人无码视频,亚洲精品久久久久av无码,午夜精品久久久久久毛片,亚洲中文字幕日韩无码

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

卷積神經(jīng)網(wǎng)絡(luò)四種卷積類型

相關(guān)文章