国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

火遍朋友圈的修圖工具Prisma背后是什么?其實是深度學習在作祟

EastWoodYang / 3346人閱讀

摘要:沒錯,火遍朋友圈的修圖工具的背后就是最近流行的四個字深度學習。這樣處理后得到的僅是圖片的紋理而不是整體布局。這就是提供給我們的修圖效果。以上用一句話概括就是,深度學習實現了藝術內容和藝術風格的分離與重構。

引子:有段子手言,地球上的人一半在用Pokemon Go追皮卡丘的時候,剩下的一半在用Prisma修圖!這款由俄羅斯創業團隊研發的圖片處理app,從研發到上線僅幾個月就用戶量驚人,更讓人驚訝的是,團隊僅僅只有四個人。這真的可能嗎?

如果你是因為標題黨而進來,謝謝并希望你離開的時候能獲得你想要的干貨;如果你已經猜到了答案,也謝謝你愿意進來驗證你的猜測。

沒錯,火遍朋友圈的修圖工具Prisma的背后就是最近流行的四個字:深度學習。啊對,深度學習就是弄一個深度神經網絡模型,很深很深的網絡模型,大概有19層那么深。(咦這個確實好深啊,貌似那個下圍棋的alphago也就13層~)

不是說干貨么,這就完了?當然不行。那咱能直接跑一個模型玩玩嗎?貌似也不太行。跑這樣一個神經網絡模型,需要你的計算機有一顆強大的心臟(較好有個GPU啥的),然后,你要安裝一堆lua,torch,caffe,cuda之類的玩意兒。你以為prisma和別的app一樣,是靠你那小手機就能搞的那么炫酷的嗎?非也,它的背后必須有一個強大的云服務器。不信你斷網,再拿prisma試試。

所以,prisma是把你的圖片壓縮好后,用網絡傳送到了他家服務器,然后處理結束再傳給了你。

嗯這還不是特別干的干貨,下面才進入正題。也許你會覺得有點枯燥,不過希望我盡量能講的通俗,你盡量能收點干貨,而那些繁瑣的數學公式和略晦澀的術語我會跳過。

下文參考自:A Neural Algorithm of Artistic Style(by Leon A. Gatys, Alexander S. Ecker, and Matthias Bethge)

在深度神經網絡的家族里,處理圖片最給力的模型叫卷積神經網絡(Convolutional Neural Network,簡稱CNN)。CNN的每一層結構和一般的NN不太一樣,它的每一層就像一個過濾器,分層次的處理輸入圖像。每經過一層,就會更抽象一些,術語上來說是對上一層的特征提取。所以,每一層都可以看作為一個特征映射(feature maps)。

當CNN被用來訓練識別物體(object recognition)時,研究者構造了一種網絡結構,它可以使物體信息逐層更明顯地提取出來,也就是說,這種網絡結構關心的是圖片內容(content)。每一層的feature maps都可以用來重構圖片,較深層次(high-level)的重構,如下圖第二排d,e,更多的捕捉內容而忽略像素,而較淺的,如下圖第二排a,b,c,僅僅是像素的復制。因此,研究者多采用較深的網絡結構來做內容重構(content representation)。

而CNN模型也同樣可以用來做風格重現(style representations)。這時,研究者使用一種原創設計的特征空間(feature space)來提取圖片的紋理信息(texture information)。feature space會加在每一層過濾層之上,它包含的是不同過濾層處理后的feature maps之間的相關性。這樣處理后得到的僅是圖片的紋理而不是整體布局(global arrangement)。如上圖第一排所示。同樣的,較深的網絡層可以更好的提取紋理而忽略內容。

論文研究者的發現是:content representations和style representations是可以分離的!并且重新組合后可以成為一張全新的圖片,它具備名畫(artwork)的風格和我們自己的照片的內容。這就是prisma提供給我們的修圖效果。同時,內容重現和風格重現在重構過程中是可以權衡的(trade-off)。所以,prisma也具備了百分比設置功能,即多大程度保留內容。

而其實這項技術在2015年8月左右就已經在github上開源了,搜索關鍵詞deepdream可以找到。而如今它真的成為了一款流行市場的互聯網產品,歷時將近一年。這從技術開發到面向市場的速率也非常驚人。再看自動駕駛技術,糅合人工智能,AR/VR等技術,雖然如今還事故頻頻,但相信不久也會技驚四座。

以上用一句話概括就是,深度學習實現了藝術內容和藝術風格的分離與重構。雖然這還談不上創造力,但也算art and science的完美結合!這不愧說—— Data scientist is the sexist job of 21st century.

歡迎加入本站公開興趣群

商業智能與數據分析群

興趣范圍包括各種讓數據產生價值的辦法,實際應用案例分享與討論,分析工具,ETL工具,數據倉庫,數據挖掘工具,報表系統等全方位知識

QQ群:81035754

文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。

轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/4368.html

相關文章

  • 最強GAN修圖魔術師:美顏生發摘眼鏡、草繪秒變真人臉

    摘要:該研究成果由韓國團隊發表于論文地址訓練數據恰當的訓練數據有助于提高網絡訓練性能。在將損失函數應用于輸入圖像之前,用輸入圖像替換了掩模外部的圖像的剩余部分。總體損失函數如下其中,發生器用進行訓練,鑒別器用進行訓練。 為一個設計師,是否整天因為繁瑣枯燥的修圖工作不勝其煩?現在,一款基于GAN的AI修圖大師可以將你從這類工作中解放出來。修輪廓、改表情、生發、加耳環、去眼鏡、補殘圖,你能想到的它都能...

    xialong 評論0 收藏0
  • 編程界也有修仙秘籍?程序員碼字3年終得《JavaScript 百煉成仙》

    摘要:百煉成仙走紅該書于年月出版,作者楊逸飛是一名從事開發六年的程序員,寫過諸多技術博客。作者在博客上對粉絲提出關于百煉成仙的問題進行了統一回復,該博文持續占據熱榜第二,熱度達。 剛接觸編程的小伙伴,估計都想過把枯燥無聊的編程教材變成小說讀的念頭,這不,說曹操曹操就來了,真的有程序員用寫修仙小說的...

    zzbo 評論0 收藏0
  • 前端每周清單第 48 期:Slack Webpack 構建優化,CSS 命名規范與用戶追蹤,Vue.

    摘要:發布是由團隊開源的,操作接口庫,已成為事實上的瀏覽器操作標準。本周正式發布,為我們帶來了,,支持自定義頭部與腳部,支持增強,兼容原生協議等特性變化。新特性介紹日前發布了大版本更新,引入了一系列的新特性與提升,本文即是對這些變化進行深入解讀。 showImg(https://segmentfault.com/img/remote/1460000012940044); 前端每周清單專注前端...

    sean 評論0 收藏0

發表評論

0條評論

EastWoodYang

|高級講師

TA的文章

閱讀更多
最新活動
閱讀需要支付1元查看
<