CVPR2016主旨演講及焦點論文速覽，深度學習壟斷地位遭質(zhì)疑

Corwien 發(fā)布于2019-04-25 18:02 / 2017人閱讀

摘要：本屆會議共收到論文篇，創(chuàng)下歷史記錄有效篇。會議接收論文篇接收率。大會共有位主旨演講人。同樣，本屆較佳學生論文斯坦福大學的，也是使用深度學習做圖像識別。深度學習選擇深度學習選擇不過，也有人對此表示了擔心。指出，這并不是做學術(shù)研究的方法。

2016年的計算機視覺領(lǐng)域國際頂尖會議 Computer Vision and Pattern Recognition conference（CVPR2016）昨天在美國拉斯維加斯召開，會議將持續(xù)到當?shù)貢r間6月30日下午。

本屆會議共收到論文 2145 篇，創(chuàng)下歷史記錄（有效 1865 篇）。會議接收論文 643 篇（接收率 29.9%）。其中，今年的大會還特別開設(shè) Spotlight Session，讓 123 篇論文的講者有 4 分鐘的時間口頭介紹其研究核心。

大會共有 3 位主旨演講人。第一天是 Amnon Shashua，著名計算機視覺算法公司 Mobileye 的聯(lián)合創(chuàng)始人。第二天，也就是今天的主旨演講，由哈佛大學心理系教授 Elizabeth Spelke 進行，主題是科學研究中的男女性別平等。明天的主旨演講者是牛津大學人類未來研究所的教授 Nick Bostrom。這樣看，不僅僅是計算機視覺和模式識別，主辦方連科研性別平等和人工智能發(fā)展趨勢都考慮了進去。

【點擊查看大圖】CVPR2016 活動日程表。短短三天，承載這么多的內(nèi)容。

CVPR2016 活動日程表。短短三天，承載這么多的內(nèi)容。

深度學習一統(tǒng)計算機視覺江湖

根據(jù) Twiiter 上的消息，主要展臺都各有看點。例如 Twitter Cortex，剛剛收了 Magic Pony，展臺前聚集了很多人。

Twitter Cortex 展臺前人群聚集。來源：Twitter

MIT的研究者在會議上發(fā)布了給視頻配音的研究。

谷歌也在 Google Research Blog 刊登出了 CVPR 2016 相關(guān)內(nèi)容，論文、口頭報告、研討會，加起來總共十幾項。

TechCrunch 具體報道了谷歌與幾所高校合作的項目。

其中，谷歌與斯坦福大學合作，教計算機學會分辨場景中的關(guān)鍵信息。這項研究的目的是在同時有多人場景的視頻中跟蹤關(guān)鍵目標。論文以籃球比賽視頻為例，計算機需要識別出場上最應該注意的球員。

從畫面中識別出關(guān)鍵目標才能提供更大信息量

研究人員利用遞歸神經(jīng)網(wǎng)絡(luò)設(shè)計了一個計算機視覺系統(tǒng)，下圖就是計算機查看每一幀畫面時的“注意力模式”（attention mask）。圖中紅框標注場上球員，五角星代表籃球，持球運動員則用藍框表示。

三分球、成功搶到籃板球和投籃失敗的場景

經(jīng)過訓練后，這個使用遞歸神經(jīng)網(wǎng)絡(luò)的系統(tǒng)不僅能夠識別出當前畫面中的關(guān)鍵目標，也可以預測接下來即將成為關(guān)鍵目標的是什么，這樣畫面與畫面之間的動作變化則將前后的關(guān)鍵部分連接起來。

谷歌與愛丁堡大學合作的一項研究，圖像識別系統(tǒng)的任務是學會找出每一幀畫面里，老虎的四條腿是如何運動的，并且預測接下來它將如何邁步。以往的研究是將畫面中活動的物體當做一個整體，這項研究則分別跟蹤老虎的四條腿，并分別預測接下來每條腿的運動軌跡。

谷歌與 UCLA、牛津大學以及約翰霍普金斯大學合作的研究，訓練圖像識別系統(tǒng)理解照片中不同部分的互動關(guān)系，生成更較精確的描述。

當然，上面介紹的這三篇論文都使用了深度學習。實際上，正如 TechCrunch 報道最后所說，放眼望去，深度學習幾乎成了如今計算機視覺研究的標配。

同樣，本屆 CVPR 2016較佳學生論文、斯坦福大學的 “Structural-RNN: Deep Learning on Spatio-Temporal Graphs”，也是使用深度學習做圖像識別。

深度學習選擇

深度學習 ≠ 選擇

不過，也有人對此表示了擔心。

法國 Inria 研究所的研究員 Nikos Paragios 在 LinkedIn 撰文指出，直到 2010年，計算機視覺領(lǐng)域相關(guān)會議所涉及的專題，無論是從內(nèi)容上還是從方法上都相對完善，包括早期視覺、分割和組合、運動檢測和跟蹤、視覺識別以及三維視覺，而且?guī)缀跛醒芯慷加玫搅私y(tǒng)計、幾何和優(yōu)化的方法。參加這樣的一次會議，能讓人對計算機視覺技術(shù)的現(xiàn)狀、問題及發(fā)展獲得全面的了解。

但如今，絕大部分研究都使用了深度學習。當然，Paragios 也表示，每個時期都自有其主導的潮流：20 世紀 80 年代是立體視覺（stereo）、20 世紀 90 年代是連續(xù)方法和分割組合，世紀之交離散方法上位，人們也開始再次關(guān)注視覺識別和描述。與此同時，機器學習作為一股后浪隨著前浪襲來，但盡管如此，當時的計算機視覺研究還算多樣化，任選一個子領(lǐng)域就能看見新的想法。

但現(xiàn)在情況則大不相同。各個研究都專注于使用深度學習的方法解決計算機視覺問題，會議接收的論文里，發(fā)表的論文中有 80% 到 90%，口頭報告更是接近 100% 都來自深度學習領(lǐng)域。Paragios 在文章中寫道，雖然這樣做沒有問題，這些論文也都體現(xiàn)了實力，但他想知道這些研究“增加的”科學價值在哪里。

在 Paragios 看來，除了一小部分人還在堅持做基礎(chǔ)研究，探索深度學習方法的理論概念，大部分人似乎都跑去搭建更復雜、更龐大的框架——而且從所提交的論文看，基本上所有描述的框架都是不可擴展的。也就是說，盡管表面上看去成果豐碩，但深究起來這些論文背后幾乎沒有什么理論論證，因此也談不上為某個基準增添了性能。Paragios 指出，這并不是做學術(shù)研究的方法。眾人的注意力都放在更快的速度更高的效率上，但追求的目標還是與以往一樣，并不遠大，而且眾人眼中實現(xiàn)目標的方法也僅剩一條了。

不僅會議如此，科研基金也如此，而這就直接導致了計算機視覺研究“理論深度”變淺，研究方向單一。Paragios 接著寫道，如果這只是因為近年來計算力和大數(shù)據(jù)崛起推動所致，那么這股熱潮自會過去，計算機視覺也會遵循計算機圖形的發(fā)展軌跡，從活動和學術(shù)研究的量上說，逐漸成為一門邊緣學科。

如果不是的話，Paragios 表示——那么問題來了：計算機視覺的下一步發(fā)展將是什么？“你怎么讓那些剛從學校出來，很有可能連統(tǒng)計學習、模式識別、歐氏幾何、連續(xù)和離散優(yōu)化都沒聽說過的的博士生提出新的想法？”

雖然事情不至于這么極端，但照這樣發(fā)展下去，Paragios 寫道，結(jié)果就只有兩條：要么是大家走向共和，實現(xiàn) David Marr 的假說——單一計算框架能解決所有視覺感知問題，當然這也是一項成就；但萬一要是沿著深度學習走下去，最終卻無法解決各種各樣的計算機視覺問題……

Paragios 稱自己是深度學習懷疑論者、接受者、倡導者中的后兩種，但對前景還很迷茫。不過，他主張的研究多樣化，的確值得深思。

歡迎加入本站公開興趣群

商業(yè)智能與數(shù)據(jù)分析群

興趣范圍包括各種讓數(shù)據(jù)產(chǎn)生價值的辦法，實際應用案例分享與討論，分析工具，ETL工具，數(shù)據(jù)倉庫，數(shù)據(jù)挖掘工具，報表系統(tǒng)等全方位知識

QQ群：81035754

云服務器 GPU云服務器深度學習及應用深度學習方法及應用計算機網(wǎng)絡(luò)安全及防火墻技術(shù)畢業(yè)論文 CVPR

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://m.specialneedsforspecialkids.com/yun/4352.html

發(fā)表評論

登陸后可評論

0條評論

Corwien

男|高級講師

我要關(guān)注我要私信

TA的文章

tensorflow

閱讀 2572·2023-04-25 18:13
【Microsoft Azure 的1024種玩法】四. 利用Azure Virtual machi

閱讀 795·2021-11-22 12:10
Sedo交易榜：VYNX.com超13萬元成交！crydo.com約10萬元易主！

閱讀 2987·2021-11-22 11:57
[黑五]HostKvm香港招牌VPS永久6折,充$50送$5

閱讀 2148·2021-11-19 11:26
如何登錄到虛擬主機-虛擬主機怎么登陸圖解？

閱讀 2183·2021-09-22 15:40
云安卓ARM開發(fā)板方案

閱讀 1474·2021-09-03 10:28
使用 nuxt+iview-admin+koa2 開發(fā)項目

閱讀 2711·2019-08-30 15:53
一道面試題引發(fā)的思考

閱讀 1959·2019-08-30 15:44

国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

CVPR2016主旨演講及焦點論文速覽，深度學習壟斷地位遭質(zhì)疑

相關(guān)文章

NLP 頂級科學家 Manning：深度學習將主導 SIGIR（信息檢索）

128篇論文，21大領(lǐng)域，深度學習最值得看的資源全在這了

一個時代的終結(jié)：ImageNet 競賽 2017 是最后一屆

Google GAN之父 ICCV2017演講：解讀生成對抗網(wǎng)絡(luò)的原理與應用

DeepMind 為何總能完爆人類？世界第一深度學習實驗室內(nèi)部探秘

發(fā)表評論

0條評論

Corwien

男|高級講師

TA的文章

tensorflow

【Microsoft Azure 的1024種玩法】四. 利用Azure Virtual machi

Sedo交易榜：VYNX.com超13萬元成交！crydo.com約10萬元易主！

[黑五]HostKvm香港招牌VPS永久6折,充$50送$5

如何登錄到虛擬主機-虛擬主機怎么登陸圖解？

云安卓ARM開發(fā)板方案

使用 nuxt+iview-admin+koa2 開發(fā)項目

一道面試題引發(fā)的思考

最新活動

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

CVPR2016主旨演講及焦點論文速覽，深度學習壟斷地位遭質(zhì)疑

相關(guān)文章

發(fā)表評論

0條評論

男|高級講師

TA的文章

最新活動

上云采購季！| 2核2G4M爆款云服務器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

CVPR2016主旨演講及焦點論文速覽，深度學習壟斷地位遭質(zhì)疑