国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

AI 學會“腦補”:神經網絡超逼真圖像補完從 0 到 1

tulayang / 2519人閱讀

摘要:那些局部響應由小的通常神經補丁表示。概述我們尋求對損失函數進行了優化的修復圖像,其被表示為三個項的組合整體內容項,局部紋理項和項。我們的方法使用兩個聯合損失函數來解決未知圖像,即整體內容損失和局部紋理損失。

完勝 PS!新方法實現完美“腦補”

在分享照片之前,你可能會想進行一些修改,例如擦除分散注意力的場景元素,調整圖像中的物體位置以獲得更好的組合效果,或者把被遮擋的部分恢復出來。

這些操作,以及其他許多編輯操作,需要進行自動的孔洞填充(圖像補足),這是過去幾十年間計算機視覺和圖形領域的一個研究熱點。因為自然圖像固有的模糊性和復雜性,整體填充也是長期以來的難點。

但現在,這個問題終于得到了比較好的解決,證據就是下面這幅圖。

這項全新研究的主要貢獻是:

提出了一個聯合優化框架,可以通過用卷積神經網絡為全局內容約束和局部紋理約束建模,來虛構出缺失的圖像區域。

進一步介紹了基于聯合優化框架的用于高分辨率圖像修復的多尺度神經補丁合成算法。

在兩個公共數據集上評估了所提出的方法,并證明了其優于基線和現有技術的優勢。

克服現有方法局限,用深度學習風格轉移合成逼真細節

我們稍后會詳細介紹這項研究成果。在此之前,有必要補充一下背景知識。

現有的解決孔洞填充問題的方法分為兩組。第一組方法依賴于紋理合成技術,其通過擴展周圍區域的紋理來填充空白。這些技術的共同點是使用相似紋理的補丁,以從粗到精的方式合成孔洞的內容。有時,會引入多個尺度和方向,以找到更好的匹配補丁。Barnes et al.(2009) 提出了 PatchMatch,這是一種快速近似最近鄰補丁的搜索算法。

盡管這樣的方法有益于傳遞高頻紋理細節,但它們不抓取圖像的語義或全局結構。第二組方法利用大型外部數據庫,以數據驅動的方式虛構缺失的圖像區域。這些方法假定被相似上下文包圍的區域可能具有相似的內容。如果能找到和所查詢圖像具有足夠視覺相似度的圖像樣本,這種方法會非常有效,但是當查詢圖像在數據庫中沒有被很好地表示時,該方法可能會失敗。另外,這樣的方法需要訪問外部數據庫,這極大地限制了可能的應用場景。

最近,深度神經網絡被用于紋理合成和圖像的風格化(stylization)。特別需要指出,Phatak et al(2016)訓練了具有結合了和對抗性損失的編碼器 - 解碼器 CNN(Context Encoders)來直接預測丟失的圖像區域。這項工作能夠預測合理的圖像結構,并且評估非常快,因為孔洞區域的預測是在a single forward pass中進行的。雖然結果令人鼓舞,但有時這種方法的修復結果缺乏精細的紋理細節,在空白區域的邊界周圍會產生可見的偽跡。 這種方法也不能處理高分辨率圖像,因為當輸入較大時,和對抗性損失相關的訓練會有困難。

在最近的一項研究中,Li和Wand(2016)指出,通過對圖像進行優化(該圖像的中間層神經響應與內容圖像相似,底層卷局部響應模仿style圖像的局部響應),可以實現逼真的圖像stylization結果。那些局部響應由小的(通常3×3)神經補丁表示。 該方法證明能夠將高頻率細節從style圖像傳輸到內容圖像,因此適合于實際的傳遞任務(例如,傳遞面部或汽車的外觀)。盡管如此,通過使用神經響應的 gram matrices 能更好地進行更多藝術風格的傳遞。

好,是主角出場的時候了——

為了克服上述方法的局限性,來自伯克利、Adobe、Pinscreen 和 USC Institute for Creative Technologies 的研究人員提出了一種混合優化方法(joint optimization),利用編碼器 - 解碼器CNN的結構化預測和神經補丁的力量,成功合成了實際的高頻細節。類似于風格轉移,他們的方法將編碼器 - 解碼器預測作為全局內容約束,并且將孔洞和已知區域之間的局部神經補丁相似性作為風格(style)約束。

更具體地說,使用中間層的補丁響應(該中間層使用預訓練分類網絡),可以通過訓練類似于 Context Encoder 的全局內容預測網絡來構造內容約束,并且可以用環繞孔洞的圖像內容來對紋理約束進行建模。可以使用具有有限存儲的 BFGS 的反向傳遞算法來有效地優化這兩個約束。

作者在論文中寫道:“我們通過實驗證明,新提出的多尺度神經補丁合成方法可以產生更多真實和連貫的結果,保留結構和紋理的細節。我們在兩個公共數據集上定量和定性地評估了所提出的方法,并證明了其在各種基線和現有技術上的有效性,如圖1 所示。”

圖1:對于給定的一張帶有孔洞(256×256)的圖像(512×512),我們的算法可以合成出更清晰連貫的孔洞內容(d)。我們可以和用Context Encoders(b)、PatchMatch(c)這兩種方法產生的結果進行比較。

具體方法

為了進一步處理帶有大面積孔洞的高分辨率圖像,作者提出了一種多尺度神經補丁合成方法。為了簡化公式,假設測試圖像始終裁剪為 512×512,中間有一個 256×256 的孔洞。然后,創建一個三級金字塔,步長為二,在每個級別將圖像縮小一半。它呈現 128×128 的較低分辨率,帶有 64×64 的孔洞。接下來,我們以從粗到精的方式執行孔洞填充任務。初始化較低級別的內容預測網絡的輸出,在每個尺度(1)執行聯合優化以更新孔洞;(2)upsample 以初始化聯合優化并為下一個尺度設置內容約束。最后,重復此步驟,直到聯合優化以較高分辨率完成。

Framework 概述

我們尋求對損失函數進行了優化的修復圖像,其被表示為三個項的組合:整體內容項,局部紋理項和tv-loss項。 內容項是捕獲圖像的語義和全局結構的全局結構約束,并且局部項通過使其與已知區域一致來重新定義局部紋理。 內容項和紋理項均使用具有固定參數的預訓練網絡來計算。

圖2. Framework 概述。我們的方法使用兩個聯合損失函數來解決未知圖像,即整體內容損失和局部紋理損失。通過將圖像饋送到預訓練的內容預測網絡,并且將輸出與推理(reference)內容預測進行比較來導出整體內容損失。 通過將 x 饋送到預訓練網絡(稱為紋理網絡),并且在其特征圖上比較局部神經補丁來導出局部紋理損失。

高分辨率圖像修復的算法

給定一個帶有孔洞的高分辨率圖像,我們產生了多尺度輸入其中S是尺度的數量。s = 1是最粗糙的尺度,s = S是輸入圖像的原始分辨率。我們以迭代多尺度方式進行這一優化。

我們首先將輸入縮小到粗糙尺度,計算內容的推理(reference)。在實際操作中,我們在 upsample 到一個新尺度時,將寬度和高度加倍。 在每個尺度中,我們根據等式 1 更新,通過 upsample 設置優化初始,并通過 upsample 在尺度上設置內容 reference。我們因此迭代地取得高分辨率的修復結果。算法1 是對該算法的總結。

實驗過程

數據集

我們在兩個不同的數據集上評估了我們提出的方法:Paris StreetView 和ImageNet 。 不使用與這些圖像相關聯的標簽或其他信息。 Paris StreetView 包含 14,900 個訓練圖像和 100個測試圖像。 ImageNet 有 1,260,000 個訓練圖像,以及從驗證集隨機選取的 200 個測試圖像。 我們還選擇了20個含干擾項的圖像,以測試我們用于真實干擾項移除場景的算法。

量化比較

我們首先在 Paris StreetView 數據集上就低分辨率圖像(128×128)將我們的方法和基線方法進行了定量比較。表1中的結果表明,我們的方法實現了較高的數值性能。我們將這歸因于我們方法的性質——和 PatchMatch 相比,它能夠推斷圖像的正確結構,而和 Context Encoder 相比,它能夠從已知區域傳遞紋理細節。(圖3)我們優于PatchMatch的結果表明,內容網絡有助于預測合理的結構。我們勝過 Context Encoder 的結果表明,由紋理網絡執行的神經補丁合成方法的有效性。

表1:在Paris StreetView數據集上的數值比較。PSNR值越高越好。

圖3:Context Encoder(損失)、Context Encoders(對抗性損失)和PatchMatch的比較。當從邊界向孔洞區域傳遞紋理時,我們的方法比Context Encoder(既使用損失也使用對抗性損失)表現更好。在推理正確結構時,我們的方法比PatchMatch表現更好。

內容網絡在聯合優化中的作用。我們比較了使用內容約束和不使用內容約束的修復結果。如圖4 所示,當不使用內容項來引導優化時,修復結果的結構出錯了。

圖4:(a)為原始輸入,(b)是不使用內容約束產生的修復結果,(c)是我們的結果。

高分辨率圖像修復

圖5是在ImageNet數據集上的比較結果。從上至下:原始輸入,PatchMatch,Context Encoder(同時使用和對抗性損失),我們的結果。所有圖像分辨率都是512×512(本文中已縮小以適應頁面顯示)。

圖6是在Paris StreetView數據集上的比較結果。從上至下:原始輸入,PatchMatch,Context Encoder(同時使用和對抗性損失),我們的結果。所有圖像分辨率都是512×512(本文中已縮小以適應頁面顯示)。

真實世界干擾項去除場景

最后,我們的算法很容易擴展為處理任意形狀的孔洞。 這是通過估計任意孔洞周圍的邊界平方,填充孔洞內的平均像素值,并通過裁剪圖像形成輸入,以使正方形邊界框處于輸入的中心,并將輸入調整為內容網絡輸入的大小。然后,我們使用已經訓練的內容網絡進行前向傳播。在聯合優化中,紋理網絡對自然中孔洞的形狀和位置沒有限制。這是分離將內容和紋理項分離的額外好處。由于 Context Encoder 僅限于方孔,我們在圖7中展示了和 PatchMatch 的對比結果。如圖所示,我們提出的聯合優化方法更好地預測了結構,并提供了清晰和逼真的結果。

圖7:隨意對象的去除。從左到右:原始輸入,對象遮擋,PatchMatch 結果,我們的結果。

結論

作者使用神經補丁合成提升了語義修復的現有技術。可以看到,當內容網絡給出較強的關于語義和全局結構的先驗信息時,紋理網絡在生成高頻細節方面非常強大。有一些場景復雜的情況,這種新的方法會產生不連續性和違背真實的圖像(圖8)。此外,速度仍然是這種算法的瓶頸。研究人員的目標是在未來的工作中解決這些問題。

圖8:這是兩個聯合優化法失敗的例子。

論文:使用多尺度神經補丁合成修補高分辨率圖像

摘要

對于帶有語義合理性和情境感知細節的自然圖像,深度學習的進展為填充這些圖像上的大面積孔洞帶來了樂觀的前景,并影響了諸如對象移除這樣的基本的圖像處理任務。雖然這些基于學習的方法在捕獲高級特征方面比現有技術明顯更有效,但由于存儲器限制和訓練困難,它們只能處理分辨率很低的輸入。即使對于稍大的圖像,修復的區域也會顯得模糊,而且可以看到令人不快的邊界。我們提出一種基于圖像內容和風格(style)約束聯合優化的多尺度神經補丁合成方法,不僅保留上下文結構,而且通過匹配和適應具有與深度分類網絡相似的中層特性的補丁,可以產生高頻細節。我們在 ImageNet 和 Paris Streetview 數據集上評估了我們的方法,并實現了較先進的修復精度。我們表明,相對于之前的方法,我們的方法可以產生更清晰和更連貫的結果,特別是對于高分辨率圖像來說。

論文地址:https://arxiv.org/pdf/1611.09969.pdf

Github 代碼:https://github.com/leehomyc/High-Res-Neural-Inpainting

歡迎加入本站公開興趣群

商業智能與數據分析群

興趣范圍包括各種讓數據產生價值的辦法,實際應用案例分享與討論,分析工具,ETL工具,數據倉庫,數據挖掘工具,報表系統等全方位知識

QQ群:81035754

文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。

轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/4459.html

相關文章

  • 感知對抗網絡 PAN,一個框架搞定多種圖像轉換

    摘要:此前有工作將像素損失和生成對抗損失整合為一種新的聯合損失函數,訓練圖像轉換模型產生分辨率更清的結果。一般來說,結合使用多種損失函數的效果通常比單獨使用一種要好。結合感知對抗損失和生成對抗損失,提出了感知對抗網絡這一框架,處理圖像轉換任務。 近來,卷積神經網絡的發展,結合對抗生成網絡(GAN)等嶄新的方法,為圖像轉換任務帶來了很大的提升,包括圖像超分辨率、去噪、語義分割,還有自動補全,都有亮眼...

    happen 評論0 收藏0
  • 專訪Goodfellow:欲在谷歌打造GAN團隊,用假數據訓練真模型

    摘要:是世界上最重要的研究者之一,他在谷歌大腦的競爭對手,由和創立工作過不長的一段時間,今年月重返,建立了一個探索生成模型的新研究團隊。機器學習系統可以在這些假的而非真實的醫療記錄進行訓練。今年月在推特上表示是的,我在月底離開,并回到谷歌大腦。 理查德·費曼去世后,他教室的黑板上留下這樣一句話:我不能創造的東西,我就不理解。(What I cannot create, I do not under...

    JaysonWang 評論0 收藏0
  • “未卜先知”、“自學成才”:GANs奇思妙想TOP10榜單

    摘要:實現這一應用的基本思想方法是將圖像的每一列用向量來表示,計算每一個的平均值,從而得到一個向量。標準加強學習模型通常要求建立一個獎勵函數,用于向代理機器反饋符合預期的行為。來源更多信息自學成才讓好奇驅動計算機學習在很多 還記得《射雕英雄傳》中老頑童發明的左右互搏術嗎??表面上看,左手與右手互為敵手,斗得不可開交。實際上,老頑童卻憑借此練就了一門絕世武功。?這樣的故事似乎只能發生在小說中。然而,...

    JessYanCoding 評論0 收藏0
  • 吃了這些數據集和模型,跟 AI 學跳舞,做 TensorFlowBoys

    摘要:最近,這就是街舞第二季開播,又一次燃起了全民熱舞的風潮。然而,真要自己跳起來,實際與想象之間,估計差了若干個羅志祥。系統映射結果展示對于系統的結果,研究人員表示還不完美。谷歌在和跳舞的結合上也花了心思。好了,先不說了,我要去跟學跳舞了。 最近,《這!就是街舞》第二季開播,又一次燃起了全民熱舞的風潮。 剛開播沒多久,這個全程高能的節目,就在豆瓣上就得到了 9.6 的高分。舞者們在比賽中精...

    dkzwm 評論0 收藏0
  • 最強GAN修圖魔術師:美顏生發摘眼鏡、草繪秒變真人臉

    摘要:該研究成果由韓國團隊發表于論文地址訓練數據恰當的訓練數據有助于提高網絡訓練性能。在將損失函數應用于輸入圖像之前,用輸入圖像替換了掩模外部的圖像的剩余部分。總體損失函數如下其中,發生器用進行訓練,鑒別器用進行訓練。 為一個設計師,是否整天因為繁瑣枯燥的修圖工作不勝其煩?現在,一款基于GAN的AI修圖大師可以將你從這類工作中解放出來。修輪廓、改表情、生發、加耳環、去眼鏡、補殘圖,你能想到的它都能...

    xialong 評論0 收藏0

發表評論

0條評論

最新活動
閱讀需要支付1元查看
<