国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

首次公開!《阿里計算機視覺技術精選》揭秘前沿落地案例

Carbs / 3012人閱讀

摘要:元旦假期即將來臨,我們精心準備了這本阿里巴巴機器智能計算機視覺技術精選,收錄了頂級會議阿里論文,送給計劃在假期充電的同學們,也希望能和更多學術界工業界同仁一起探討交流。

當下計算機視覺技術無疑是AI浪潮中最火熱的議題之一。視覺技術的滲透,既可以對傳統商業進行改造使之看到新的商業機會,還可以創造全新的商業需求和市場。無論在電商、安防、娛樂,還是在工業、醫療、自動駕駛領域,計算機視覺技術都扮演著越發重要的角色。

元旦假期即將來臨,我們精心準備了這本《阿里巴巴機器智能計算機視覺技術精選》,收錄了頂級會議 CVPR 2018 阿里論文,送給計劃在假期“充電”的同學們,也希望能和更多學術界、工業界同仁一起探討交流。

下載地址:https://yq.aliyun.com/download/3237?utm_content=g_1000033518

在這本干貨精選集中,我們收錄了多篇具有代表性的 CVPR 2018 論文。比如,拍立淘利用圖像搜索和識別技術,幫助用戶在移動端通過拍照就能找到相似商品;線下新零售領域,阿里用空間定位、貨架商品SKU識別技術推動“人貨場”數字化,并做進一步的商業分析;城市大腦項目中,阿里研發了大規模視頻高效處理技術,幫助城市交通事故識別、人流軌跡判斷、交通數據樣本匯總。

哪些核心技術值得一看?

Spotlight論文《基于時間尺度選擇的在線行為預測》討論了視頻中行為預測的一個非常重要的問題:怎么去選擇一個好的時間維度窗口?論文提出了包含多個子網絡的尺度選擇網,比如包括時間序列建模的一維卷積子網絡、尺度回歸子網絡以及行為預測子網絡。在兩個公開數據集上,尺度選擇網的實驗結果優于其他方法,并且準確率也接近使用Ground Truth尺度的結果。

Spotlight論文《基于語境對比特征和門控多尺度融合的場景分割》致力于場景分割中的兩大問題:場景圖片中像素形式的多樣化(例如:顯著或者不顯著、前景或者背景)和場景圖片中物體大小的多樣性。文章針對這兩個問題分別提出了語境對比局部特征和門控多尺度融合方法。本文提出的模型在Pascal Context, SUN-RGBD和COCO Stuff 三個場景分割數據集上驗證了性能,取得了目前最高的場景分割性能。

對于跨模態檢索而言,如何學到合適的特征表達非常關鍵。Spotlight論文《所見所想所找-基于生成模型的跨模態檢索》提出了一種基于生成模型的跨模態檢索方法,該方法可以學習跨模態數據的高層次特征相似性,以及目標模態上的局部相似性。本文通過大量的實驗證明了所提出的方法可以準確地匹配圖像和文本,并且在MSCOCO以及Flickr30K的數據集上都取得了state-of-the-art的效果。

在論文《整體還是局部?應用Localized GAN進行圖像內容編輯、半監督訓練和解決mode collapse問題》中,作者建立了GAN和半監督機器學習中Laplace-Beltrami算子的聯系,在用少量標注樣本訓練深度學習模型上取得了優異的性能。同時論文還展示了用Localized GAN (LGAN)對給定圖像在局部坐標系下進行編輯修改,從而獲得具有不同角度、姿態和風格的新圖像;以及如何從流型切向量獨立性的角度來解釋和解決GAN的mode collapse問題。

論文《處理多種退化類型的卷積超分辨率》針對現有基于CNN的單圖超分(SISR)算法不能擴展到用單一模型解決多種不同的圖像退化類型的問題,提出了一種維度拉伸策略,使得單個卷積超分辨率網絡能夠將SISR退化過程的兩個關鍵因素(即模糊核和噪聲水平)作為網絡輸入來解決這個問題。實驗結果表明提出的卷積超分辨率網絡可以快速、有效的處理多種圖像退化類型,為SISR實際應用提供了一種高效、可擴展的解決方案。

論文《于尺度空間變換的本征圖像分解》將把圖像分解為其本征的反射圖像和光照圖像看作是一個圖像到圖像的轉換問題,并且將輸入和輸出在尺度空間進行分解。通過將輸出圖像(反射圖像和光照圖像)擴展到它們的拉普拉斯金字塔的各個成分,論文提出了一種多通道網絡結構,可以在每個通道內并行地學習到一個圖像到圖像轉換函數,這個函數通過一個具有跳過連接的卷積神經網絡來表示。在MPI-Sintel數據集和MIT Intrinsic Images數據集上結果表明,新提出的模型在比之前最先進的技術上有了明顯的進步。

大多數現有的零樣本學習(Zero-Shot Learning,ZSL)方法都存在強偏問題。在論文《基于直推式無偏嵌入的零樣本學習》中,作者提出了一個簡單而有效的方法,稱為準完全監督學習(QFSL),來緩解此問題。假定標記的源圖像和未標記的目標圖像都可用于訓練。在語義嵌入空間中,被標記的源圖像被映射到由源類別指定的若干個嵌入點,并且未標記的目標圖像被強制映射到由目標類別指定的其他點。在AwA2,CUB和SUN數據集上進行的實驗表明,文章的方法在遵循廣義ZSL設置的情況下比現有技術的方法優越。

更為具體的實踐信息,大家可以通過此本電子書,進一步了解。

好的視覺技術不僅需要好的方法指引,還需要在實際的場景中形成數據閉環和不斷打磨。未來的計算機視覺技術一定是理論探索和數據實踐的共同推進。希望這本論文合集能拋磚引玉,給學術界和工業界帶來一些輸入,共同推進計算機視覺技術的發展。


本文作者:元旦“充電包”

閱讀原文

本文來自云棲社區合作伙伴“阿里技術”,如需轉載請聯系原作者。

文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。

轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/19876.html

相關文章

  • 投資千億成立達摩院,揭秘阿里在人工智能領域的探索

    摘要:今天上午,阿里巴巴云棲大會在杭州開幕,第一條重磅消息是阿里首席技術官張建鋒宣布成立達摩院,在全球各地建立實驗室,年內投入千億在全球建立實驗室和高校建立研究所建立全球研究中心等事務。 今天上午,阿里巴巴云棲大會在杭州開幕,第一條重磅消息是阿里首席技術官張建鋒宣布成立達摩院,在全球各地建立實驗室,3年內投入千億在全球建立實驗室、和高校建立研究所、建立全球研究中心等事務。 該院由全球實驗室、...

    miqt 評論0 收藏0
  • 最熱門軟件測試技術 | MTSC2019 測試開發大會日程 V1.0 版公布,有獎投票你最關注的議題

    摘要:目前大會日程版正式公布日程后續可能還會有微調,請以官網最新信息為準。而關于火熱的測試技術,更有來自美團小米小愛產品京東百度騰訊的多個測試落地案例。 showImg(https://segmentfault.com/img/bVbsnfV?w=1920&h=942); 投票選出你最關注的 MTSC2019 測試開發大會議題,抽獎領取大會門票和 TesterHome 社區其他福利!參與方式...

    lx1036 評論0 收藏0

發表評論

0條評論

最新活動
閱讀需要支付1元查看
<