国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

深度學習背景下的神經(jīng)網(wǎng)絡(luò)架構(gòu)演變

MorePainMoreGain / 1583人閱讀

摘要:我想重溫過去幾年深度學習背景下的神經(jīng)網(wǎng)絡(luò)設(shè)計史。卷積神經(jīng)網(wǎng)絡(luò)成為深度學習的主力,深度學習是可以完成有用任務(wù)的大型神經(jīng)網(wǎng)絡(luò)的新名字。和的開始探索減少深度神經(jīng)網(wǎng)絡(luò)的計算負擔,提出了第一個架構(gòu)。

深度神經(jīng)網(wǎng)絡(luò)和深度學習是強大、流行的算法。它們的成功常常源于神經(jīng)網(wǎng)絡(luò)架構(gòu)的精心設(shè)計。

我想重溫過去幾年深度學習背景下的神經(jīng)網(wǎng)絡(luò)設(shè)計史。

我們(譯者注:Alfredo Canziani、Adam Paszke、Eugenio Culurciello)在預(yù)印本文庫上發(fā)表的An Analysis of Deep Neural Network Models for Practical Applications對本文提到的所有神經(jīng)網(wǎng)絡(luò)進行了更深入的分析和比較,可供參考。其中一張代表性的圖片:

上圖展示了在多個流行的神經(jīng)網(wǎng)絡(luò)架構(gòu)的top-1較精確度和單個前饋傳播所需要的運算量。

LeNet5

Yann LeCun在1994年提出的LeNet5,是首次出現(xiàn)的卷積神經(jīng)網(wǎng)絡(luò)之一,推動了深度學習領(lǐng)域的發(fā)展。

LeNet5的架構(gòu)是基礎(chǔ)性的,特別是其中的兩大洞見:圖像特征分布在整張圖像上,基于可學習參數(shù)的卷積是使用更少參數(shù)提取多個位置上的相似特征的有效方法。當時沒有用于訓練的GPU,CPU也很慢。因此能夠節(jié)省參數(shù)和計算在當時是一個關(guān)鍵優(yōu)勢。LeNet5和將每個像素作為一個大型多層神經(jīng)網(wǎng)絡(luò)的多帶帶輸入的做法截然相反。LeNet5說明,由于圖像是高度空間相關(guān)的,使用圖像的單個像素作為多帶帶輸入特征無法利用這些相關(guān)性。

LeNet5的特性:

卷積網(wǎng)絡(luò)使用一個3層的序列:卷積、池化、非線性——這可能是自這篇論文以來面向圖像的深度學習的關(guān)鍵特性!

使用卷積提取空間特征

使用映射的空間均值進行降采樣

tanh或sigmoids非線性

多層神經(jīng)網(wǎng)絡(luò)(MLP)作為最終的分類器

層間的稀疏連接矩陣以避免巨大的計算開銷

總之,這一網(wǎng)絡(luò)是近年來許多架構(gòu)的源頭,對這一領(lǐng)域中的許多人而言,這是一個真正的啟發(fā)。

空當

1998年到2010年是神經(jīng)網(wǎng)絡(luò)的孵化期。大多數(shù)人沒有注意到它們?nèi)找嬖鲩L的力量,而許多其他研究人員緩慢地取得進展。隨著手機拍攝和廉價數(shù)碼相機的興起,我們得到了越來越多的可用數(shù)據(jù)。算力也在不斷提高,CPU越來越快,GPU成為通用計算工具。這兩個趨勢推動了神經(jīng)網(wǎng)絡(luò)的進展,盡管進展速度很慢。數(shù)據(jù)和算力使神經(jīng)網(wǎng)絡(luò)解決的任務(wù)變得越來越有趣。

Dan Ciresan Net

2010年,Dan Claudiu Ciresan和Jurgen Schmidhuber發(fā)表的Dan Ciresan Net是最早的GPU神經(jīng)網(wǎng)絡(luò)實現(xiàn)之一。Dan Ciresan Net在NVIDIA GTX 280上實現(xiàn)了前饋傳播和反向傳播,神經(jīng)網(wǎng)絡(luò)不超過9層。

AlexNet

2012年,Alex Krizhevsky發(fā)表了AlexNet,LeNet更深、更廣的版本。AlexNet在困難的ImageNet競賽中遙遙領(lǐng)先。

AlexNet將LeNet的洞見擴展到一個大得多的網(wǎng)絡(luò),該網(wǎng)絡(luò)可以用于學習更復(fù)雜的對象和對象層級關(guān)系。這一工作的貢獻是:

使用ReLU作為非線性

使用dropout技術(shù)選擇性地忽略訓練中的單個神經(jīng)元,避免模型的過擬合

重疊較大池化(overlapping max pooling),避免平均池化(average pooling)的平均效應(yīng)

使用NVIDIA GTX 580 GPU減少訓練時間

當時,GPU比CPU提供了更多的核心,可以將訓練速度提升10倍,從而允許使用更大的數(shù)據(jù)集和更大的圖像。

AlexNet的成功開啟了一場小革命。卷積神經(jīng)網(wǎng)絡(luò)成為深度學習的主力,深度學習是“可以完成有用任務(wù)的大型神經(jīng)網(wǎng)絡(luò)”的新名字。

Overfeat

2013年12月,Yann LeCun領(lǐng)導的NYU實驗室提出了Overfeat,一個AlexNet的衍生物。這篇論文也提出了學習包圍盒,成為之后許多其他論文的主題。我認為學習切分對象比學習人工包圍盒更好。

VGG

Oxford的VGG網(wǎng)絡(luò)率先在每個卷積層中使用了更小的3x3過濾器,將其組合為卷積序列。

這看起來違背了LeNet的原則,在LeNet中,大型的卷積用來刻畫圖像的相似特征。VGG沒有使用AlexNet的9x9或11x11過濾器,VGG使用的過濾器開始變小了,和LeNet想要避免的不知名的1x1卷積太過接近了,至少在網(wǎng)絡(luò)的表層是這樣。然而,VGG的巨大進展是發(fā)現(xiàn)多個3x3卷積序列可以模擬更大、更具容受性的結(jié)構(gòu),例如5x5和7x7的卷積。這些想法也在近期的網(wǎng)絡(luò)架構(gòu)中得到了應(yīng)用,例如Inception和ResNet。

VGG網(wǎng)絡(luò)使用多個3x3卷積層來表示復(fù)雜的特征。注意上表VGG-E的3、4、5塊:多次使用256x256和512x512的3x3過濾器構(gòu)成序列,以提取更復(fù)雜的特征,以及這些特征的組合。這相當于3個大型的帶有512x512過濾器的卷積層!顯然這導向了大量的參數(shù),以及更強的學習能力。然而,由于很難訓練這些網(wǎng)絡(luò),需要將其拆分成逐層疊加的小型網(wǎng)絡(luò)。這是因為缺乏正則化模型的強力方法,某種程度上這限制了大量參數(shù)提供的巨大搜索空間。

VGG使用多層巨大的特征尺寸,因而運行時推斷的開銷很大。后來的Inception的瓶頸層降低了特征的數(shù)量,從而節(jié)省了計算開銷。

Network-in-network

Network-in-network(NiN,網(wǎng)中網(wǎng))提出了偉大而簡單的洞見,使用1x1卷積為卷積特征層提供更多的計算能力。

NiN架構(gòu)在每一卷積后使用空間MLP層,以便在另一層之前更好的組合特征。同樣,有人可能認為1x1卷積違背了LeNet的原則,但事實上1x1卷積確實有助于以更好的方式組合卷積特征,這無法通過簡單地堆疊更多的卷積層來達成。這和使用原始像素作為下一層的做法不同。這里1x1的卷積用來在空間上組合卷積后特征映射上的特征,所以它們實際上使用非常少的參數(shù),在所有像素間共享這些特征!

通過將卷積特征組合成更復(fù)雜的特征組,MLP的能力可以大大增強單個卷積特征的效用。最近的架構(gòu)同樣使用了這一想法,例如ResNet、Inception及其衍生物。

NiN也使用平均池化層作為最終的分類器的組成部分,另一個在之后的架構(gòu)中變得常見的做法。這是為了在分類前平均網(wǎng)絡(luò)對多張輸入圖像的反應(yīng)。

Google 和 Inception

Google的Christian Szegedy開始探索減少深度神經(jīng)網(wǎng)絡(luò)的計算負擔,提出了第一個Inception架構(gòu)GoogLeNet。

到2014年秋為止,深度學習模型在分類圖像與視頻幀方面變得極其有用。大多數(shù)懷疑者已經(jīng)放下了疑心,深度學習與神經(jīng)網(wǎng)絡(luò)這次是真的回歸了,并將持續(xù)下去。鑒于這些技術(shù)的用處,Google這樣的互聯(lián)網(wǎng)巨頭非常有興趣面向他們的服務(wù)器農(nóng)場設(shè)計高效的大規(guī)模部署架構(gòu)。

Christian考慮了很多在保持深度神經(jīng)網(wǎng)絡(luò)的較先進表現(xiàn)(例如在ImageNet上的表現(xiàn))的前提下,減輕其計算負擔的方式。或者維持現(xiàn)有的計算開銷的前提下改進表現(xiàn)。

他和他的團隊提出了Inception模塊:

乍看起來,這基本上是1×1、3×3、5×5卷積過濾器的并行組合。但是Inception的偉大洞見是用1×1的卷積塊(NiN)在昂貴的并行模塊之前減少特征的數(shù)量。這通常被稱為“瓶頸(bottleneck)”。下面的“瓶頸層(bottleneck layer)”一節(jié)將具體解釋。

GoogLeNet使用不帶inception模塊的主干作為初始層,之后是與NiN類似的一個平均池化層與softmax分類器。相比AlexNet和VGG,這個分類器的運算數(shù)量極少。這也促成了一種非常高效的網(wǎng)絡(luò)設(shè)計。

瓶頸層

受NiN的啟發(fā),Inception的瓶頸層減少了每一層的特征數(shù)量,從而減少了運算量;因此得以保持較低的推斷時間。在將數(shù)據(jù)傳入昂貴的卷積模塊前,特征的數(shù)量會減少,比方說,4倍。這大大節(jié)省了計算開銷,也導致了架構(gòu)的成功。

讓我們驗證下細節(jié)。假設(shè)你有256個特征輸入,256個特征輸出,同時假設(shè)Inception層只執(zhí)行3×3的卷積。這意味著總共要進行 256×256×3×3的卷積(589000次乘積累加(MAC)運算)。這可能超出了我們的計算預(yù)算,比方說,在Google服務(wù)器上花0.5毫秒運行該層。作為替代,我們決定減少需要卷積的特征的數(shù)量,比如減少到64(256/4)個。在這種情況下,我們首先進行256到64的1×1卷積,然后在所有Inception的分支上進行64次卷積,接著再使用一個64到256的1×1卷積。現(xiàn)在運算如下:

256×64×1×1 = 16000

64×64×3×3 = 36000

64×256×1×1 = 16000s

現(xiàn)在的計算量大約是70000,相比之前的約600000,幾乎減少了10倍。

而且,盡管我們進行了更少的運算,我們在此層上并沒有損失其概括性。事實證明瓶頸層在ImageNet這樣的數(shù)據(jù)集上的表現(xiàn)達到了較先進的水平,而且瓶頸層也被用于之后出現(xiàn)的一些架構(gòu),比如ResNet。

瓶頸層取得成功的原因是輸入特征是相關(guān)的,因此可通過1×1卷積適當結(jié)合以減少冗余。然后,對數(shù)量較少的特征進行卷積,并在下一層再次擴展成有意義的組合。

Inception V3(和V2)

Christian和他的團隊是非常高產(chǎn)的研究人員。2015年2月,他們引入了作為Inception V2的Batch-normalized Inception。批量歸一化(batch-normalization)在一層的輸出上計算所有特征映射的均值和標準差,基于這些值歸一化神經(jīng)網(wǎng)絡(luò)層的響應(yīng)。這相當于“漂白”了數(shù)據(jù),使所有神經(jīng)映射在同一范圍內(nèi)響應(yīng),同時均值為零。這有助于訓練,因為下一層不需要從輸入數(shù)據(jù)中學習偏移量,得以重點關(guān)注如何較好地結(jié)合特征。

2015年12月,他們發(fā)布了Inception模塊的新版本及相應(yīng)的架構(gòu)。這篇論文更好地解釋了原始的GoogLeNet架構(gòu),給出了更多設(shè)計選擇的細節(jié)。原本的想法如下:

平衡深度與寬度,小心地構(gòu)建網(wǎng)絡(luò),從而較大化進入網(wǎng)絡(luò)的信息流。每次池化前,增加特征映射。

當深度增加時,特征數(shù)量和網(wǎng)絡(luò)層寬度也同步增加。

在每一層增加寬度,以便在下一層之前增加特征的組合。

在可能的情況下只使用3×3的卷積,因為5×5和7×7的過濾器能分解為多個3×3的卷積。見下圖:

因此新的Inception模塊變?yōu)椋?/p>

過濾器也可以通過扁平化卷積分解為更復(fù)雜的模塊:

在進行inception運算時,inception模塊也可以通過提供池化縮減數(shù)據(jù)的尺寸。這基本上等于基于一個簡單的池化層并行跨距進行卷積操作。

Inception仍然使用池化層和softmax作為最終分類器。

ResNet

2015年12月,大約在Inception V3提出的同時,ResNet出世了,掀起了網(wǎng)絡(luò)架構(gòu)的革命。ResNet(殘差網(wǎng)絡(luò))的想法很簡單:將兩個連續(xù)的卷積層的輸出加上跳過了這兩層的輸入傳給下一層。

這和之前的一些想法(比如這個)類似。ResNet跳過了兩個網(wǎng)絡(luò)層,并應(yīng)用于更大規(guī)模的網(wǎng)絡(luò)。跳過2層是一個關(guān)鍵的直覺,因為跳過1層并沒有帶來多少提升。2層網(wǎng)絡(luò)可能被看成一個小型的分類器,或者一個網(wǎng)中網(wǎng)(Network-In-Network)!

這也是第一次訓練超過一百,甚至一千層的網(wǎng)絡(luò)。

具有海量網(wǎng)絡(luò)層的ResNet開始使用一個瓶頸層,與Inception的瓶頸層類似:

這一層首先使用輸出較小(通常是輸入的 1/4)的1×1卷積,接著是一3×3的層,再接著是更多特征的1×1層,從而減少每一層的特征數(shù)量。和在Inception模塊中的情形一樣,這允許保持運算量處于較低水平的前提下,提供豐富的特征組合。參考“瓶頸層”一節(jié)(“GoogLeNet和Inception”一節(jié)之后)。

ResNet在輸入(主干)上使用一個相當簡單的初始層:一個7x7的卷積層,之后是2個池化。和使用更復(fù)雜、不那么直觀的主干的Inception V3、V4大相徑庭。

Inception也使用池化層和softmax作為最終分類器。

每天都產(chǎn)生關(guān)于ResNet的更多洞見:

ResNet既可以被看成并行的模塊,也可以被看成序列化的模塊。輸入并行地進入多個模塊,而每個模塊的輸出以序列化的方式連接。

ResNet也可以被看成并行或連續(xù)模塊的多個系綜。

ResNet通常在相對較淺的20-30層的網(wǎng)絡(luò)塊上以并行的方式運行,而不是序列化地流過整個網(wǎng)絡(luò)。

當ResNet像RNN一樣把輸出反向傳播到輸入時,該網(wǎng)絡(luò)可以被看成更好的生物學上可解釋的皮層模型。

Inception V4

Christian與其團隊又提出了Inception的一個新版本。

Inception V4模塊主干之后的部分和Inception V3很相似:

Inception V4也結(jié)合了ResNet模塊:

不過,這次提出的方案,在我看來,不那么優(yōu)雅,也更復(fù)雜了,充滿了不那么透明的啟發(fā)。其中的選擇難以理解,作者也難以論證。

因此,基于這點考慮,我們認為ResNet更為優(yōu)秀,因為它是一個易于理解和修改的簡明清晰的網(wǎng)絡(luò)。

SqueezeNet

最近發(fā)表的SqueezeNet重新整理了ResNet與Inception之中的許多概念,表明一個更好的架構(gòu)設(shè)計無需復(fù)雜的壓縮算法就能實現(xiàn)較小的網(wǎng)絡(luò)尺寸和較少的參數(shù)數(shù)目。

ENet

我們組建了一個團隊,結(jié)合最近的架構(gòu)的所有特性,構(gòu)建一個非常高效的輕量網(wǎng)絡(luò),該網(wǎng)絡(luò)使用很少的參數(shù)和計算就能達到較先進的結(jié)果。該網(wǎng)絡(luò)架構(gòu)被稱為ENet,由Adam Paszke設(shè)計。我們已經(jīng)將其用于像素層次的標注和場景解析。這里是一些展示ENet效果的視頻。這些視頻展示的是在訓練集之外的數(shù)據(jù)上的表現(xiàn)。

這里是ENet的技術(shù)報告。ENet是一個由編碼器和解碼器組成的網(wǎng)絡(luò)。編碼器是一個常規(guī)的用于分類的CNN,解碼器是一個升采樣網(wǎng)絡(luò),將分類反向傳播到原始圖像尺寸以切分圖像。圖像切分只使用了神經(jīng)網(wǎng)絡(luò),沒有使用其他算法。

你可以看到,在所有的神經(jīng)網(wǎng)絡(luò)中,折算參數(shù)數(shù)量后,ENet的較精確度較高!

ENet從一開始就被設(shè)計為盡可能使用最小數(shù)目的資源。就此而言,它的尺寸很小,在16浮點精度下,編碼器和解碼器網(wǎng)絡(luò)總共只使用0.7 MB。即使在這樣小的尺寸下,ENet在切分精度上也達到或超過了其他純神經(jīng)網(wǎng)絡(luò)方案。

模塊分析

有一篇論文對各CNN模塊進行了系統(tǒng)分析,提出了一些有益的發(fā)現(xiàn):

使用ELU非線性,但不使用批量歸一化或ReLU。

應(yīng)用一個學習過的RGB彩色空間轉(zhuǎn)換。

使用線性學習率衰減策略。

使用平均和較大池化層的和。

使用約128或256的mini-batch大小。如果你的GPU無法承受這么大的batch,等比例縮小batch,并據(jù)此降低學習率。

使用全連接層作為卷積,并平均其預(yù)測以得出最后的結(jié)果。

計劃增加訓練集大小的時候,檢查下是否未曾到達高原。

數(shù)據(jù)的清潔度比數(shù)據(jù)的尺寸更重要。

如果你不能增加輸入圖像的尺寸,減少作為結(jié)果的層的跨距(stride),大致上效果一樣。

如果你使用的網(wǎng)絡(luò)是高度優(yōu)化的復(fù)雜架構(gòu),例如GoogLeNet,謹慎修改。

XCeption

Xception改進了inception模塊和架構(gòu),基于一個更為簡單優(yōu)雅的架構(gòu)達到了ResNet和Inception V4的表現(xiàn)。

Xception模塊如下所示:

這一網(wǎng)絡(luò)架構(gòu)上的簡單性和優(yōu)雅性將受到任何人的喜愛,如下所示:

這一架構(gòu)有36個卷積階段,和ResNet-34有些類似。Xception的模型和代碼和ResNet一樣簡單,比Inception好理解太多。

這里有一個Torch7的實現(xiàn)。這里則是一個Keras/TF的實現(xiàn)。

有趣的是,我們的工作使用了可分卷積過濾器,最近的Xception架構(gòu)受此啟發(fā),同樣使用了可分卷積過濾器。

MobileNets

2017年4月,出現(xiàn)了一個新的MobileNets架構(gòu)。該架構(gòu)使用可分卷積以減少參數(shù)數(shù)目。可分卷積和前文提及的Xception相同。論文聲稱大大減少了參數(shù)——據(jù)論文報告,F(xiàn)aceNet案例中參數(shù)減少了一半。下面是該模型的完整架構(gòu):

不幸的是,我們在實際應(yīng)用中測試了這個網(wǎng)絡(luò),發(fā)現(xiàn)在Titan Xp GPU上,batch尺寸為1張圖像的情況下,這一網(wǎng)絡(luò)異常緩慢。下面是單張圖片的推斷時間的比較:

resnet18: 0.002871

alexnet: 0.001003

vgg16: 0.001698

squeezenet: 0.002725

mobilenet: 0.033251

很清楚,MobileNets不是快速推斷的競爭者!它可能降低了網(wǎng)絡(luò)的參數(shù)數(shù)量和在硬盤上的尺寸,但并不可用。

其他值得關(guān)注的架構(gòu)

FractalNet使用遞歸架構(gòu),在此之前,沒有人在ImageNet上嘗試過遞歸架構(gòu)。FractalNet是ResNet的衍生物,或者說,ResNet的泛化版本。

未來

我們相信,打造神經(jīng)網(wǎng)絡(luò)架構(gòu)對深度學習領(lǐng)域的進展至關(guān)重要。我們強烈建議仔細閱讀并理解本文提到的所有論文。

但有人現(xiàn)在可能會想,為什么我們不得不花費這么多時間來打造架構(gòu),為什么我們不讓數(shù)據(jù)來告訴我們要使用什么架構(gòu),以及如何組合模塊。這個想法很好,但現(xiàn)在尚處于研究之中。這里有一些有趣的初步結(jié)果。

同時注意,我們這里主要討論了用于計算機視覺的架構(gòu)。其他領(lǐng)域也發(fā)展了類似的神經(jīng)網(wǎng)絡(luò)架構(gòu),研究所有其他任務(wù)的架構(gòu)演化也很有趣。

我們最近的論文比較了上述神經(jīng)網(wǎng)絡(luò)架構(gòu)及其計算性能,如果你對此感興趣,請參閱我們的論文。(論文鏈接:https://arxiv.org/abs/1605.07678)

致謝

本文受到了與Abhishek Chaurasia、Adam Paszke、Sangpil Kim、Alfredo Canziani及Purdue大學e-Lab的其他人的討論的啟發(fā)。

歡迎加入本站公開興趣群

商業(yè)智能與數(shù)據(jù)分析群

興趣范圍包括各種讓數(shù)據(jù)產(chǎn)生價值的辦法,實際應(yīng)用案例分享與討論,分析工具,ETL工具,數(shù)據(jù)倉庫,數(shù)據(jù)挖掘工具,報表系統(tǒng)等全方位知識

QQ群:81035754

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/4713.html

相關(guān)文章

  • 動靜內(nèi)容混合站點,怎樣用全站加速支持實際業(yè)務(wù)場景?

    摘要:為了優(yōu)化動靜混合站點和純動態(tài)站點的加速效果,阿里云推出了全站加速方案,通過智能區(qū)分動靜態(tài)請求,實現(xiàn)整站加速效果的全面提升。 摘要: 伴隨著近幾年O2O的爆發(fā),網(wǎng)絡(luò)已經(jīng)不僅是傳統(tǒng)的展示企業(yè)品牌的渠道,而逐漸演變成為嫁接企業(yè)和用戶之間服務(wù)和交流的橋梁,我們開始賦予網(wǎng)絡(luò)更多的功能,比如購物、出行、學習、娛樂等等。 同時,網(wǎng)絡(luò)內(nèi)容形態(tài)的進階發(fā)展,網(wǎng)頁內(nèi)容已經(jīng)從靜態(tài)的圖片、文字向短視頻、直播演變...

    sherlock221 評論0 收藏0
  • 架構(gòu) - 收藏集 - 掘金

    摘要:淺談秒殺系統(tǒng)架構(gòu)設(shè)計后端掘金秒殺是電子商務(wù)網(wǎng)站常見的一種營銷手段。這兩個項目白話網(wǎng)站架構(gòu)演進后端掘金這是白話系列的文章。 淺談秒殺系統(tǒng)架構(gòu)設(shè)計 - 后端 - 掘金秒殺是電子商務(wù)網(wǎng)站常見的一種營銷手段。 不要整個系統(tǒng)宕機。 即使系統(tǒng)故障,也不要將錯誤數(shù)據(jù)展示出來。 盡量保持公平公正。 實現(xiàn)效果 秒殺開始前,搶購按鈕為活動未開始。 秒殺開始時,搶購按鈕可以點擊下單。 秒殺結(jié)束后,按鈕按鈕變...

    Riddler 評論0 收藏0
  • 深度學習不再是煉丹術(shù)!谷歌給出首個神經(jīng)網(wǎng)絡(luò)訓練理論證明

    摘要:谷歌發(fā)布的一篇論文給出了較早的關(guān)于深度神經(jīng)網(wǎng)絡(luò)訓練相關(guān)的理論證明,實驗觀察結(jié)果也為初步解釋梯度下降強于貝葉斯優(yōu)化奠定了基礎(chǔ)。 谷歌 AI 發(fā)布的一篇論文給出了較早的關(guān)于深度神經(jīng)網(wǎng)絡(luò)訓練相關(guān)的理論證明,實驗觀察結(jié)果也為初步解釋梯度下降強于貝葉斯優(yōu)化奠定了基礎(chǔ)。神經(jīng)網(wǎng)絡(luò)的理論面紗,正逐步被揭開。原來,神經(jīng)網(wǎng)絡(luò)實際上跟線性模型并沒那么大不同!谷歌 AI 的研究人員日前在 arxiv 貼出一篇文章,...

    zorro 評論0 收藏0
  • 像玩樂高一樣拆解Faster R-CNN:詳解目標檢測的實現(xiàn)過程

    摘要:這一切始于年的一篇論文,其使用了稱為的算法用來提取感興趣候選區(qū)域,并用一個標準的卷積神經(jīng)網(wǎng)絡(luò)去分類和調(diào)整這些區(qū)域。 本文詳細解釋了 Faster R-CNN 的網(wǎng)絡(luò)架構(gòu)和工作流,一步步帶領(lǐng)讀者理解目標檢測的工作原理,作者本人也提供了 Luminoth 實現(xiàn),供大家參考。Luminoth 實現(xiàn):https://github.com/tryolabs/luminoth/tree/master/l...

    taoszu 評論0 收藏0
  • Tensorflow進行時間序列分析

    摘要:在這篇博客文章中,我將討論使用深度學習的方法對時間序列數(shù)據(jù)進行分類,而無需手動設(shè)計特征。卷積神經(jīng)網(wǎng)絡(luò)第一步是將數(shù)據(jù)投射到具有一定形狀的數(shù)組中,其中是訓練期間批次中的示例數(shù),是時間序列的長度在我們的情況下為,并且是進行測量的通道的數(shù)量。 摘要:2017年深度學習框架關(guān)注度排名tensorflow以絕對的優(yōu)勢占領(lǐng)榜首,本文通過使用tensorflow優(yōu)化過去一個使用特征提取方法的框架,證實...

    sourcenode 評論0 收藏0

發(fā)表評論

0條評論

最新活動
閱讀需要支付1元查看
<