国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

【10大深度學習框架實驗對比】Caffe2最優,TensorFlow排第6

import. / 2939人閱讀

摘要:表示,的賈揚清對他的這一項目給予了很多幫助,賈揚清告訴他,的好幾個網絡,較大瓶頸都是,如果想要實現一流的性能,賈揚清建議較好使用異步,這樣會有很大的幫助。,和則是默認啟用這項功能。

微軟數據科學家Ilia Karmanov做了一個項目,使用高級API測試8種常用深度學習框架的性能(因為Keras有TF,CNTK和Theano,所以實際是10種)。Karmanov希望這個項目能夠幫助數據科學家更好地跨框架進行深度學習。

Karmanov表示,他這個項目的目標是創建一個深度學習框架的羅塞塔石碑,讓數據科學家能夠輕松地將他們在一個框架上的專長轉移到另一個框架上(而不是從頭開始學習)。具體說,就是在8種最常用的框架上構建同一個神經網絡。而且,有了這樣一個模型后,也就有了比較各個框架的基準,各個框架的訓練時間和默認選項也變得更加透明。

Karmanov發現,許多在線教程都使用低級別的API,雖然寫很詳細,但對于大多數用例而言,除非想要創建新的層,否則意義不大。因此,他在項目中使用了別的API,以便更容易地在框架之間進行比較。

結果證明,一旦使用更高級的API,不同框架的代碼結構實際上變得非常相似,并且可以粗略地表示為:

加載數據;x_train,x_test,y_train,y_test = cifar_for_library(channel_first=?, one_hot=?)

生成CNN符號(通常在最后的dense層上沒有激活)

指定損失(交叉熵與softmax一起),優化和初始化權重 + session

使用custom迭代器訓練訓練集中的mini-batch

從測試集中預測全新的mini-batch

評估準確性

本質上這里是在對一系列確定的數學運算(盡管是隨機初始化的)進行比較,因此在結果中比較各個框架的準確性并沒有什么意義。Karmanov將精度作為一個去匹配(而非對比)的指標,確保比較的是相同的模型架構。

結果:Caffe2、MXNet表現不俗

硬件是Nvidia K80 GPU,環境是Ubuntu,所有框架都是版本:

但是,比較訓練速度意義不大

雖然對10大常用框架進行了對比,但Karmanov進一步在他的Medium文章里解釋了,比較速度并沒有意義:

使用本地數據加載器可能會省掉幾秒鐘(實際上意義也不大),因為shuffle是異步執行的。但是,對于常規項目(而不是這里的這個實驗),數據不太可能放進RAM里,還需要大量的預處理和數據增強。這就是數據加載器派上用場的地方。Karmanov表示,Facebook的賈揚清對他的這一項目給予了很多幫助,賈揚清告訴他,Facebook的好幾個in-production網絡,較大瓶頸都是I/O,如果想要實現一流的性能,賈揚清建議較好使用異步I/O,這樣會有很大的幫助。

其次,Karmanov在這個示例中只使用了幾層(conv2d,max_pool2d,dropout,全連接層)。平時工作中的項目可能會有3D卷積、GRU,LSTMS等。

你能很輕松地添加自定義的層,這些層的運行速度會影響你選擇用什么框架。所以在這里比較速度也沒多大用。能夠用Python代碼編寫一個自定義層并快速執行它才是研究項目的關鍵

在實際應用中,你會用到TensorBoard這樣的高級日志來查看模型是否收斂,幫助調整超參數。但在這個例子中并不涉及。

10點心得

以下是Karmanov在所有框架上匹配訓練精度,參考Github上所有issue/Pull request后的一些見解:

1. 上面的框架(除了Keras),為了方便比較,都嘗試使用相同級別的API,所以都使用相同的生成函數。對于MXNet和CNTK,我嘗試了一個更高級別的API,使用框架的訓練生成器函數。這個例子中速度的提升是可以忽略的,因為整個數據集作為NumPy數組加載到RAM中,每個epoch完成的處理是就是一次shuffle。我懷疑框架的生成器運行了異步shuffle。奇怪的是,NXNet和CNTK似乎在batch級別而不是observation級別上shuffle,因此測試精度稍微降低(至少在10個epoch之后)。如果有IO,或者有預處理和數據增強的情況,custom生成器對性能的影響將會更大。

2. 啟用CuDNN的auto-tune/窮舉搜索參數(為固定大小的圖像選擇最有效的CNN算法)能夠大幅提升性能。在Caffe2,PyTorch和Theano,這個功能得手動開啟。CNTK,MXNet和Tensorflow則是默認啟用這項功能。Chainer是什么情況我還不清楚。揚清說,cudnnGet(默認)和cudnnFind之間的性能提升在Titan X GPU上要小得多;在這里,K80 +新的cudnn看來使問題更加突出了。在目標檢測時,不論組合為何,運行cudnnFind都嚴重影響了性能回歸,所以在目標檢測時應該禁用exhaustive_search

3. 使用Keras時,選擇與后端框架匹配的[NCHW]排序非常重要。CNTK是最先是針對通道(channel)運算的,但我不小心把Keras配置為最后用通道了。結果每個批次都必須改變順序,嚴重降低了性能。

4. Tensorflow,PyTorch,Caffe2和Theano需要向pooling層提供一個布爾值,表示有沒有在訓練(這對測試精度有很大影響,72%比77%)。在這種情況下,不應該使用dropout來進行測試。

5. TensorFlow有點煩人,需要做兩個調整:啟用TF_ENABLE_WINOGRAD_NONFUSED,以及將維度最先(而不是最后)提供給通道(data_format="channels_first")可以提升速度。啟用WINOGRAD進行卷積,當然也可以提升TF做后端的Keras

6. 對大多數函數而言,Softmax通常跟cross_entropy_loss() 捆綁在一起,如果你在最后的全連接層上需要激活,較好檢查一下,這樣可以節省時間避免做兩次

7. 不同框架的內核初始化函數可能會有所不同(我發現這對準確性有+/- 1%的影響),只要有可能我都會指定xavier/glorot

8. SGD-momentum的實現,我需要關閉unit_gain(在CNTK是默認打開的)來匹配其他框架的實現

9. Caffe2對網絡的第一層(no_gradient_to_input = 1)有一個額外的優化,通過不計算輸入的梯度,使速度有一個較小的提升。很可能,TensorFlow和MXNet是默認啟用這項功能的。但是,對于一些研究目的和像DeepDream這樣的項目,計算這個梯度可能還是有用的

10. 在max-pooling之后(而不是之前)應用ReLU激活意味著在降維后執行計算,這會省掉幾秒鐘的時間。在MXNet上面,這減少了3秒鐘的時間

Karmanov對整個開源社區,包括Caffe2作者、Facebook的賈揚清表示感謝,他在Github寫了更多心得體會,并歡迎你提供提升訓練時間的建議:

Github地址:https://github.com/ilkarman/DeepLearningFrameworks

Medium文章:https://medium.com/@iliakarmanov/neural-net-in-8-frameworks-lessons-learned-6a5e8e78b481

歡迎加入本站公開興趣群

商業智能與數據分析群

興趣范圍包括各種讓數據產生價值的辦法,實際應用案例分享與討論,分析工具,ETL工具,數據倉庫,數據挖掘工具,報表系統等全方位知識

QQ群:81035754

文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。

轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/4634.html

相關文章

  • 最新Github上各DL框架Star數量PK

    摘要:下圖總結了絕大多數上的開源深度學習框架項目,根據項目在的數量來評級,數據采集于年月初。然而,近期宣布將轉向作為其推薦深度學習框架因為它支持移動設備開發。該框架可以出色完成圖像識別,欺詐檢測和自然語言處理任務。 很多神經網絡框架已開源多年,支持機器學習和人工智能的專有解決方案也有很多。多年以來,開發人員在Github上發布了一系列的可以支持圖像、手寫字、視頻、語音識別、自然語言處理、物體檢測的...

    oogh 評論0 收藏0
  • Keras vs PyTorch:誰是「第一」深度學習框架

    摘要:第一個深度學習框架該怎么選對于初學者而言一直是個頭疼的問題。簡介和是頗受數據科學家歡迎的深度學習開源框架。就訓練速度而言,勝過對比總結和都是深度學習框架初學者非常棒的選擇。 「第一個深度學習框架該怎么選」對于初學者而言一直是個頭疼的問題。本文中,來自 deepsense.ai 的研究員給出了他們在高級框架上的答案。在 Keras 與 PyTorch 的對比中,作者還給出了相同神經網絡在不同框...

    _DangJin 評論0 收藏0
  • ArXiv最受歡迎開源深度學習框架榜單:TensorFlow第一

    摘要:但年月,宣布將在年終止的開發和維護。性能并非最優,為何如此受歡迎粉絲團在過去的幾年里,出現了不同的開源深度學習框架,就屬于其中典型,由谷歌開發和支持,自然引發了很大的關注。 Keras作者Fran?ois Chollet剛剛在Twitter貼出一張圖片,是近三個月來arXiv上提到的深度學習開源框架排行:TensorFlow排名第一,這個或許并不出意外,Keras排名第二,隨后是Caffe、...

    trilever 評論0 收藏0

發表評論

0條評論

import.

|高級講師

TA的文章

閱讀更多
最新活動
閱讀需要支付1元查看
<