摘要:潘新鋼等發現,和的核心區別在于,學習到的是不隨著顏色風格虛擬性現實性等外觀變化而改變的特征,而要保留與內容相關的信息,就要用到。
大把時間、大把GPU喂進去,訓練好了神經網絡。
接下來,你可能會迎來傷心一刻:
同學,測試數據和訓練數據,色調、亮度不太一樣。
同學,你還要去搞定一個新的數據集。
是重新搭一個模型呢,還是拿來新數據重新調參,在這個已經訓練好的模型上搞遷移學習呢?
香港中文大學-商湯聯合實驗室的潘新鋼、羅平、湯曉鷗和商湯的石建萍,給出了一個新選項。
他們設計了一種新的卷積架構,既能讓CNN提升它在原本領域的能力,又能幫它更好地泛化到新領域。
這個新架構叫做IBN-Net。
它在伯克利主辦的WAD 2018 Challenge中獲得了Drivable Area(可行駛區域)賽道的冠軍。相關的論文Two at Once: Enhancing Learning and Generalization Capacities via IBN-Net發表在即將召開的計算機視覺頂會ECCV 2018上。
給神經網絡加個buff
IBN-Net并不是一個像ResNet那樣獨立的神經網絡架構,它可以和其他深度學習模型結合起來使用,提升它們的性能,但不會增加計算成本。經典的DenseNet、ResNet、ResneXt、SENet等等,都能用它來助攻。
這就相當于給深度學習模型加了個buff,或者說,喂下了一顆大力丸。
同時,它還可以算是遷移學習的替代品。
在一個數據集上訓練好了模型,如果測試數據和訓練集風格、顏色上有點不一樣,或者換個數據集來測試,模型的性能就會大打折扣。
這時候,按套路就該遷移學習出場了,用新數據給訓練好的模型調參。
數據集這么多,現實世界更是豐富多彩,一個一個地去重新搭模型或者調參數,要多少工程師才夠用?
而IBN-Net就不需要新數據來調參,能自動讓模型更好地適應新的領域。
不怕加濾鏡,跨越次元壁
在圖像識別和語義分割任務上,IBN-Net都能幫深度學習模型提分。
比如在ImageNet上,加了IBN-Net(的各種變體),就能在同樣的參數設置,同樣的計算成本下,讓ResNet50的錯誤率下降0.5-1.5個百分點。
如果測試數據在原始ImageNet的基礎上再做一些變化,調整一下顏色亮度對比度,甚至用Cycle-GAN改改風格,基本款ResNet50錯誤率就會大幅上升。而加了IBN-Net的版本,錯誤率就能少上升一些,如上圖括號中的數據所示。
語義分割任務上也是一樣。
IBN-Net加持的ResNet50,能在現實世界的城市街道圖像數據集Cityscapes、虛擬世界的GTA5數據集上都取得比原版更好的成績。
想讓模型跨越虛擬與現實之間的次元壁,既能適應Cityscapes,也能用在GTA5上,IBN-Net也很擅長。
論文中說,將模型從Cityscapes遷移到GTA5,用IBN-Net能讓遷移后的性能少下降8.5%;從GTA5遷移到Cityscapes,則能少下降7.5%。
這種跨越次元壁的遷移可大有用處。比如說在自動駕駛領域,用游戲來初步訓練無人車是個常見的操作,可是把這樣訓練出來的算法搬到現實環境中,顯然要經過大量調整。
讓模型更快更好地適應不同環境的IBN-Net,簡直就是效率提升利器。
“IBN”究竟是什么?
要理解這個IBN-Net的架構,要先從兩種標準化方法IN(Instance Normalization,實例標準化)和BN(Batch Normalization,批標準化)。
它們都能讓神經網絡調參更簡單,用上更高的學習速率,收斂更快。如果你搭過圖像分類模型,batchnorm(BN)大概很熟悉了,而IN更多出現在風格遷移等任務上。與BN相比,IN有兩個主要的特點:第一,它不是用訓練批次來將圖像特征標準化,而是用單個樣本的統計信息;第二,IN能將同樣的標準化步驟既用于訓練,又用于推斷。
潘新鋼等發現,IN和BN的核心區別在于,IN學習到的是不隨著顏色、風格、虛擬性/現實性等外觀變化而改變的特征,而要保留與內容相關的信息,就要用到BN。
二者結合,就成了IBN-Net。
還可以根據需求,來調整IN和BN在模型中的搭配。
各種變體的具體情況,論文中有更清晰的描述。
論文:https://arxiv.org/pdf/1807.09441.pdf
代碼:XingangPan/IBN-Net
聲明:文章收集于網絡,如有侵權,請聯系小編及時處理,謝謝!
歡迎加入本站公開興趣群商業智能與數據分析群
興趣范圍包括各種讓數據產生價值的辦法,實際應用案例分享與討論,分析工具,ETL工具,數據倉庫,數據挖掘工具,報表系統等全方位知識
QQ群:81035754
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/4809.html
摘要:年,他把微軟的架構組織圖描繪成一幅血淋淋的景象,各大部門聚集在自己的小圈子里,部門間則槍口相向。目前,微軟人臉識別技術已幫助位走失兒童回家攝。年前,微軟亞洲研究院干脆成立了一個創新匯。還記得科技漫畫家Manu Cornet嗎?就是那位后來進入Google的軟件工程師。2011年,他把微軟的架構組織圖描繪成一幅血淋淋的景象,各大部門聚集在自己的小圈子里,部門間則槍口相向。Manu Cornet...
摘要:沒錯,火遍朋友圈的修圖工具的背后就是最近流行的四個字深度學習。這樣處理后得到的僅是圖片的紋理而不是整體布局。這就是提供給我們的修圖效果。以上用一句話概括就是,深度學習實現了藝術內容和藝術風格的分離與重構。 引子:有段子手言,地球上的人一半在用Pokemon Go追皮卡丘的時候,剩下的一半在用Prisma修圖!這款由俄羅斯創業團隊研發的圖片處理app,從研發到上線僅幾個月就用戶量驚人,更讓人驚...
閱讀 2060·2019-08-30 15:52
閱讀 2450·2019-08-29 18:37
閱讀 806·2019-08-29 12:33
閱讀 2850·2019-08-29 11:04
閱讀 1546·2019-08-27 10:57
閱讀 2104·2019-08-26 13:38
閱讀 2772·2019-08-26 12:25
閱讀 2460·2019-08-26 12:23