摘要:摘要本文以過來人的身份將自身年的研究經(jīng)驗(yàn)做了一下分享,希望本文對于即將開始從事人工智能研究的朋友有所幫助。此外,還有各種會(huì)議也值得關(guān)注。三大會(huì)議分別是以及。此外,當(dāng)演講者向現(xiàn)場觀眾演講時(shí),他們往往優(yōu)先考慮的是清晰度而不是簡潔性。
摘要: 本文以過來人的身份將自身2年的研究經(jīng)驗(yàn)做了一下分享,希望本文對于即將開始從事人工智能研究的朋友有所幫助。
人工智能研究這個(gè)領(lǐng)域是有一定門檻的。對于初學(xué)者來說,一般通常的做法是直接購買一些熱門的書籍,比如“西瓜書”、“花書”、“xx天從入門到精通”、“xx天從入門到放棄”等等,但大多數(shù)書籍都是講的基礎(chǔ)知識,稍顯乏味和枯燥,此外內(nèi)容太深?yuàn)W,初學(xué)者可能看一段時(shí)間就想放棄了。本文以過來人的身份將自身2年的研究經(jīng)驗(yàn)毫無保留地分享給大家,希望對即將開始從事人工智能研究的朋友有所幫助。
起步找一個(gè)你隨時(shí)方便提問的人
剛進(jìn)入公司時(shí),常常會(huì)對一些基本問題猶豫不決,這些問題可能會(huì)暴露出自身缺乏專業(yè)知識。但是過了幾個(gè)月后,我的提問才慢慢感到自然,提問都是精心擬定的。在此之前,我會(huì)積累大量的問題,但現(xiàn)在只要遇到一個(gè)問題,我就會(huì)立馬提問,這樣不會(huì)造成問題積壓以至于越來越困惑。
尋找不同領(lǐng)域的研究靈感
現(xiàn)在不是單打獨(dú)斗的時(shí)代,講究合作。知識也不例外,多學(xué)科交流。對于每個(gè)人而言,決定從事什么方向可能是研究中最困難的部分,以下是我所看到的一些具有長期記錄的研究人員所采用的策略:
與不同領(lǐng)域的研究人員交流。咨詢他們感興趣的問題,詢問是否有想要分析的數(shù)據(jù)集、現(xiàn)有技術(shù)存在哪些不足。機(jī)器學(xué)習(xí)中最有效的工作是與生物學(xué)、化學(xué)、物理、社會(huì)科學(xué)或純數(shù)學(xué)的碰撞。例如,我正在思考Matthew
Johnson 在2016年NIPS的文章以及Justin
Gilmer在2017年ICML的文章,兩篇文章分別是關(guān)于鼠標(biāo)行為數(shù)據(jù)集的分析以及量子化學(xué)的應(yīng)用;
編寫一個(gè)簡單的基線以獲得對問題的感覺。比如,嘗試編寫一些用于控制倒立擺的校準(zhǔn)代碼。在寫基線代碼時(shí),會(huì)遇到很多情況、各種問題或者一些臨時(shí)產(chǎn)生的想法,這些都能夠加深對問題的理解。
擴(kuò)展喜歡的某篇論文的實(shí)驗(yàn)部分。仔細(xì)閱讀一篇論文,了解其采用的方法和獲得的實(shí)驗(yàn)結(jié)果,設(shè)法找到一些可以完善的地方。首先考慮最簡單的擴(kuò)展,然后思考下論文的方法是否合理,實(shí)驗(yàn)結(jié)果有沒有不完善的地方。
重視可視化工具和技能
運(yùn)行可視化腳本允許我們快速驗(yàn)證代碼是否與想法匹配。更重要的是,良好的可視化往往使得想法和代碼中的錯(cuò)誤變得更加明顯以及可解釋性。
對于一個(gè)實(shí)際任務(wù),想出解決問題的正確方法是很困難的。如果采用的是迭代優(yōu)化模型(比如深度學(xué)習(xí)),那么繪制出損失函數(shù)會(huì)是一個(gè)好的開端。此外,對于深度學(xué)習(xí)這個(gè)“黑匣子”方法,可視化也能夠部分解釋其學(xué)習(xí)到的神經(jīng)網(wǎng)絡(luò)參數(shù)。比如,當(dāng)處理圖形模型事,可視化其一維或二維變量的分布,當(dāng)它改變時(shí),可以推斷出很多信息。可視化是技術(shù)有效性的晴雨表,每次可視化分析結(jié)果都能對所采用的的方法或代碼起到一定的反饋。
TensorFlow可視化工具Tensorboard
分布圖
Q值學(xué)習(xí)圖
弄清楚研究者和論文的最初動(dòng)機(jī)
在學(xué)術(shù)界可以發(fā)現(xiàn)很好玩的現(xiàn)象,研究人員在同一個(gè)會(huì)議上發(fā)表論文,使用相同的技術(shù)行話,但兩個(gè)人的研究動(dòng)機(jī)可以是完全相反的。動(dòng)機(jī)分為以下三個(gè)動(dòng)機(jī)——“數(shù)學(xué)”動(dòng)機(jī)、“工程”動(dòng)機(jī)和“認(rèn)知”動(dòng)機(jī):
“數(shù)學(xué)”動(dòng)機(jī):智能系統(tǒng)的基本屬性和局限性是什么?
“工程”動(dòng)機(jī):如何開發(fā)比其它方法更好地解決實(shí)際問題的智能系統(tǒng)?
“認(rèn)知”動(dòng)機(jī):如何模擬像人類或其它動(dòng)物那樣的自然智能?
有些論文不止一個(gè)動(dòng)機(jī),此外,每個(gè)研究者的動(dòng)機(jī)不可能一直保持不變,這和工程師的興趣有關(guān)。優(yōu)秀的論文和研究人員將在一開始就說明其研究動(dòng)機(jī),但有些論文往往表述的不是很清楚,這就需要讀者們仔細(xì)閱讀,此外,在自己寫作時(shí)也要注意這一點(diǎn),以防動(dòng)機(jī)不明顯而被退稿或退修。
深入研究學(xué)會(huì)找論文
網(wǎng)絡(luò)上充斥著大量的人工智能論文,大多數(shù)人首先會(huì)發(fā)表在arXiv上,由于該平臺(tái)可以先發(fā)表再經(jīng)過審稿,因此需要學(xué)會(huì)從中辨別。另外,建議在社交軟件上跟蹤你最喜歡的研究人員的動(dòng)態(tài)。此外,還有各種會(huì)議也值得關(guān)注。三大會(huì)議分別是NIPS、ICML以及ICRL。其它著名的一般會(huì)議包括AAAI、IJCAI和UAI。對于每一個(gè)分支學(xué)科而言,都有更加具體的會(huì)議。比如計(jì)算機(jī)視覺領(lǐng)域有CVPR、ECCV和ICCV;自然語言領(lǐng)域有ACL、EMNLP和NAACL;機(jī)器人學(xué)領(lǐng)域有CoRL、ICAPS、ICRA、IROS和RSS;與理論工作相關(guān)的會(huì)議有AISTAS、COLT和KDD。此外還有一些期刊也值得關(guān)注,JAIR和JMLR是人工智能領(lǐng)域最突出的兩個(gè)期刊,不過在Nature和Science期刊中也會(huì)有很好的論文。
對于一些早期論文的查找也是非常重要的,那些被奉為“經(jīng)典論文”的論文往往會(huì)在參考論文中出現(xiàn)。另外一種發(fā)現(xiàn)早期論文的方法是從資深教授的個(gè)人主頁開始查找,其成名作一般會(huì)掛在上面。此外還可以通過一些搜索助手,比如谷歌學(xué)術(shù)、百度學(xué)術(shù)等查詢關(guān)鍵詞。
讀論文要花多少時(shí)間?
關(guān)于如何讀論文,人們經(jīng)常給出兩個(gè)建議。第一個(gè)就是在研究生的第一學(xué)期或者第一年度把所有相關(guān)的論文都讀一遍;第二個(gè)是當(dāng)讀了大量論文后,不要再泛讀,而是找到突破口,想出創(chuàng)新的辦法。
我個(gè)人同意第一個(gè)建議,但不同意第二個(gè)建議。只要有足夠的時(shí)間用于原始研究,那么就應(yīng)該盡可能多地閱讀論文。對于專業(yè)研究員而言,不可能總依靠個(gè)人幸運(yùn)來發(fā)現(xiàn)創(chuàng)新的解決辦法,有時(shí)候你想到的方法別人可能已經(jīng)嘗試過,只是你不知道而已。絕大多數(shù)的研究者都是耐心的跟蹤研究方向的進(jìn)展以及發(fā)展趨勢,有條不紊地思考并解決問題。閱讀相關(guān)論文也是弄清楚目前所處的階段以及接下來需要做什么的一個(gè)好方法。
關(guān)于盡可能多地閱讀論文有一個(gè)重要的提示:花時(shí)間理解消化一篇論文和閱讀一篇論文同樣重要,閱讀的時(shí)候可以做些筆記,而不是囫圇吞棗,只求數(shù)量,不求質(zhì)量。
對話 >> 視頻 >> 論文 >> 會(huì)談
論文無疑是了解不熟悉的研究理論最容易獲取的來源,但是什么路徑是最有效的呢?不同的人可能感受不一樣。對我而言,我發(fā)現(xiàn)對話(與那些已經(jīng)理解的人)是迄今為止最快且最有效的理解途徑。如果找不到和這樣的人對話的機(jī)會(huì),可以找下關(guān)于問題的相關(guān)視頻,例如論文作者訪談視頻,這樣的視頻可以提供很好的觀點(diǎn)。此外,當(dāng)演講者向現(xiàn)場觀眾演講時(shí),他們往往優(yōu)先考慮的是清晰度而不是簡潔性。在大多數(shù)論文寫作中,作者將優(yōu)先權(quán)順序互換了,其中詞數(shù)為王,背景知識解釋得太多反而顯得作者對該領(lǐng)域不熟悉。排在最后的是會(huì)談,簡單的會(huì)談往往顯得比較正式,與主持人的談話內(nèi)容可能會(huì)非常有價(jià)值。
謹(jǐn)防炒作
人工智能取得一系列的成果吸引了公眾的關(guān)注,使得更多的人投入這個(gè)領(lǐng)域,進(jìn)而促使人工智能取得更多突破性的進(jìn)展。整個(gè)循環(huán)是良性的,但有一個(gè)副作用就是存在大量的炒作。視圖獲得點(diǎn)擊量的記者、熱錢投資者、創(chuàng)業(yè)型公司都是夸大炒作泡沫的罪魁禍?zhǔn)住R虼耍谖覀冮喿x新聞或論文時(shí),要注意“標(biāo)題黨”,以免被誤導(dǎo)。
在2017年的NIPS的問答環(huán)節(jié),一位著名的教授拿著麥克風(fēng)(代表炒作警察)告誡作者在論文標(biāo)題中慎重使用“想象”一詞。這和我們看新聞時(shí)一樣,標(biāo)題很吸引人,但里面的內(nèi)容卻跟標(biāo)題關(guān)系不大,使得閱讀者大失所望。閱讀論文同樣如此,嚴(yán)防炒作,我們需要做的是根據(jù)實(shí)驗(yàn)方法和結(jié)果來評估一篇論文是否對自己有所幫助。
總是在不斷進(jìn)步
在早期探索研究項(xiàng)目時(shí),一般我會(huì)花幾個(gè)小時(shí)開展頭腦風(fēng)暴,希望一些模糊的直接能夠指引一個(gè)具體的方向。有時(shí)候項(xiàng)目沒有任何進(jìn)展,但在黑暗中摸索也算是整個(gè)研究過程中的一部分。當(dāng)不知道下一步應(yīng)該做什么時(shí),可以基于目前已有的情況將最模糊的想法寫下來,并在寫的過程中進(jìn)行一一排除(寫出排除的原因)。在沒有任何想法的情況下, 可以采取閱讀或與同事交流的形式以獲得靈感。
從死胡同中學(xué)會(huì)判別和止損
大牛們一般花更多的時(shí)間在好的想法上,能夠區(qū)分想法的好與壞在很大程度上依賴于個(gè)人的經(jīng)驗(yàn)。盡管如此,任何水平的研究人員都會(huì)不斷遭遇以下決定:研究思路是否有缺陷、是否應(yīng)該挽救或進(jìn)一步支持所提出的想法、是否完全放棄所提出的想法?尤其是在早期時(shí),研究人員踏入死胡同后會(huì)停留很長一段時(shí)間,而不愿放棄。雖然放棄意味著之前的花費(fèi)的時(shí)間白費(fèi)了,但有的時(shí)候要懂得及時(shí)止損。
寫作
一些大牛給出的早期職業(yè)建議是:寫作。平時(shí)可以寫寫博客和論文,但更重要的是把自己的想法記錄下來。因?yàn)閷懽饔兄谖覀兝斫馀c思考相關(guān)知識。
心理健康和身體健康是科研的先決條件
學(xué)術(shù)研究者在追求科學(xué)發(fā)現(xiàn)的過程中經(jīng)常會(huì)遇到熬夜、顧不上吃飯等問題,這些都不是好習(xí)慣。很多博士都開始禿頭,甚至碩士就開始掉頭發(fā)。鍛煉身體并放空自己內(nèi)心也是對科研的投資,并不是阻礙科研。睡8個(gè)小時(shí)后再工作4個(gè)小時(shí),其效率比睡4個(gè)小時(shí)工作8個(gè)小時(shí)要高得多。有的時(shí)候會(huì)遇到卡殼,即使使出渾身解數(shù)也無法取得一絲進(jìn)步,這個(gè)時(shí)候建議離開工作崗位,稍微活動(dòng)一下并做長呼吸,放空下自己。
作者信息
Tom Silver,專注于計(jì)算科學(xué)與數(shù)學(xué)、人工智能
本文由阿里云云棲社區(qū)組織翻譯。
文章原標(biāo)題《Lessons from My First Two Years of AI Research》
詳情請閱讀原文
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/19733.html
摘要:本屆工作坊,我們邀請到了擁有年資深設(shè)計(jì)經(jīng)驗(yàn)的高級體驗(yàn)設(shè)計(jì)專家朱斌,他將作為產(chǎn)品場講師為我們分享如何有效的管理用戶注意力的話題。美國設(shè)計(jì)同行對創(chuàng)新的追求和包容是最能體現(xiàn)設(shè)計(jì)魅力的地方。 導(dǎo)讀:7月6-7日,由msup主辦的第43屆MPD工作坊將于北京召開。MPD工作坊是一個(gè)圍繞崗位角色發(fā)展的實(shí)踐課堂,按照軟件研發(fā)中心的崗位職能劃分,以產(chǎn)品經(jīng)理、團(tuán)隊(duì)經(jīng)理、 架構(gòu)師、開發(fā)經(jīng)理、測試經(jīng)理作為五...
摘要:近十年監(jiān)控系統(tǒng)開發(fā)經(jīng)驗(yàn),具有構(gòu)建基于大數(shù)據(jù)平臺(tái)的海量高可用分布式監(jiān)控系統(tǒng)研發(fā)經(jīng)驗(yàn)。的哈勃多維監(jiān)控平臺(tái)在完成大數(shù)據(jù)架構(gòu)改造后,嘗試引入能力,多維根因分析是其中一試點(diǎn),用于摸索的應(yīng)用經(jīng)驗(yàn)。 作者丨吳樹生:騰訊高級工程師,負(fù)責(zé)SNG大數(shù)據(jù)監(jiān)控平臺(tái)建設(shè)。近十年監(jiān)控系統(tǒng)開發(fā)經(jīng)驗(yàn),具有構(gòu)建基于大數(shù)據(jù)平臺(tái)的海量高可用分布式監(jiān)控系統(tǒng)研發(fā)經(jīng)驗(yàn)。 導(dǎo)語:監(jiān)控?cái)?shù)據(jù)多維化后,帶來新的應(yīng)用場景。SNG的哈勃多...
摘要:近十年監(jiān)控系統(tǒng)開發(fā)經(jīng)驗(yàn),具有構(gòu)建基于大數(shù)據(jù)平臺(tái)的海量高可用分布式監(jiān)控系統(tǒng)研發(fā)經(jīng)驗(yàn)。監(jiān)控多維數(shù)據(jù)特點(diǎn)監(jiān)控的核心是對監(jiān)控對象的指標(biāo)采集處理檢測和分析。通過單一對象的指標(biāo)反映的狀態(tài)已不能滿足業(yè)務(wù)監(jiān)控需求。 吳樹生:騰訊高級工程師,負(fù)責(zé)SNG大數(shù)據(jù)監(jiān)控平臺(tái)建設(shè)。近十年監(jiān)控系統(tǒng)開發(fā)經(jīng)驗(yàn),具有構(gòu)建基于大數(shù)據(jù)平臺(tái)的海量高可用分布式監(jiān)控系統(tǒng)研發(fā)經(jīng)驗(yàn)。前言在2015年構(gòu)建多維監(jiān)控平臺(tái)時(shí)用kmeans做了異常點(diǎn)...
閱讀 794·2019-08-30 15:55
閱讀 1537·2019-08-30 15:52
閱讀 2699·2019-08-30 15:44
閱讀 2112·2019-08-30 11:14
閱讀 2631·2019-08-29 13:59
閱讀 1832·2019-08-29 13:45
閱讀 1018·2019-08-29 13:21
閱讀 3381·2019-08-26 13:31