摘要:導語本期訪談對象小猴機器人,清華人工智能專業博士在讀。或許因為成長于廣袤的內蒙,小猴身上帶著大山和草原一般的灑脫與樂觀,在他鐘愛的無人車上,印上了一個美好的我們的征途是星辰大海。技術人攻略除了規則挖掘,人工智能遇到的難題還
文:Gracia,攝影:周振邦
(本文為原創內容,部分或全文轉載均需經作者授權,并保留完整的作者信息和技術人攻略介紹。)
導語:本期訪談對象@小猴機器人,清華人工智能專業博士在讀。2009年開始,他參與實驗室的無人車項目,和軍事交通學院共同研發“軍交猛獅III號”無人車。這輛由黑色現代ix35改裝的大家伙,配備雷達、攝像頭和GPS傳感器,可精確識別路況、判斷障礙物,并自主進行剎車、油門、制動、換擋等操作。身為概率論、AI、Python的狂熱愛好者,小猴正致力于用概率圖模型方法,讓機器變得更聰明。
攻略君的書柜頂層,放著侯世達的《哥德爾、埃舍爾、巴赫:集異璧之大成》,這本被譽為人工智能“圣經”的厚重大部頭,出版于70年代中期,曾獲得普利策文學獎,轟動一時。其后,人工智能領域研究進入拐點,關注“人類思維如何運作”的傳統研究方式進入死胡同,逐漸淡出公眾視野。直到80年代末期,人工神經網絡發明,基于大量訓練樣本的機器學習模型,取代傳統人工規則,這一領域才重新取得突破性進展。
隨著大數據與人工智能結合,我們逐漸進入一個算法主導的世界,無所不在的機器智能,精確記錄著你的點滴,計算著你的喜好,推薦你需要的物品,物理世界和虛擬世界的分界變得模糊。在歡天喜地迎接萬億級別新市場同時,也不乏對科技和人類未來的反思,對技術“奇點”的擔憂是其中之一。大約一萬年前,人類在改造自然的能力上逐漸占據主導,迎來了自身的大繁榮。當機器智能超越人類智能,意味著第二個臨界點到來,這種智能會在多大程度上操縱人類的認知方式?一個有人性的世界是否會由此終結?人工智能這把通往未來的鑰匙,究竟能打開一扇什么樣的門?需要每位參與者謹慎思考。
“三清團”(清華本科、碩士、博士)的經歷,讓小猴養成了嚴謹、務實的科學態度。他喜歡用“科技工作者”稱呼自己,并且善于用通俗易懂,帶點戲謔的方式,把那些看起來高深的理論,解釋得通俗易懂。他曾做過一份《機器學習周刊》,用自己鮮明的個性,把嚴肅、枯燥的技術新聞,解讀得無比鮮活。即使整整一下午,我耳邊回蕩著“卷積神經網絡”、“約束玻爾茲曼機”、“馬爾科夫隨機場”這樣的專業名詞,聽起來仍是津津有味。或許因為成長于廣袤的內蒙,小猴身上帶著大山和草原一般的灑脫與樂觀,在他鐘愛的無人車上,印上了一個美好的Slogan:我們的征途是星辰大海。
技術人攻略:你們的無人車項目始于何時?做到了什么程度?有哪些難點?
我現在清華“不確定性人工智能實驗室”讀博士,主要做和不確定性相關的東西,例如:知識挖掘、知識圖譜、讀心機器人、視覺識別、四旋翼、自平衡車、足球機器人等項目。
實驗室的無人車項目從2005年開始啟動,目前已和若干高校,以及上汽、北汽等公司聯合,共有100多人參與。我2009年加入該項目,從做模型車開始,逐漸做到大車。目前為止,該車已通過約5萬公里測試,在全程無人工干預情況下,高速路跑下來沒問題。2012年12月,央視曾跟拍過我們從北京收費站入口,跑到天津收費站出口的全過程。
接下來的挑戰是錯綜復雜的城區道路,解決復雜問題的方式是剝洋蔥,剝到我們能解決的那一層。城市道路抽象地看,可分成機場高速、環路、普通城市道路、小區道路,難度依次提升。以“機場接人”這個任務為例,無人車需要從機場一號航站樓,跑到天安門旁的工信部大院。這段路涉及機場高速、東二環、前門大十字路口等許多交通元素,逐步搞定預計要用兩年時間。
無人車行走依靠三大工具,一是GPS衛星定位,二是激光雷達,三是相機。雷達和相機實現局部定位,GPS實現全局定位。這里面有很多技術難點,其中之一就是如何實現高精度定位。
普通車道線的寬度是3.3米,手機上的GPS號稱誤差2.5米,一旦出現5米左右的誤差,會導致從左拐車道偏移到直行車道。針對高精度定位需求,已出現了一些高層次GPS定位方法,例如RTK-GPS、差分GPS,通過靜態GPS基站和衛星同時定位,精度可達到50厘米。一輛無人車的總成本高達200萬人民幣,激光雷達國外賣6萬刀,國內加上稅得到80萬人民幣,用精度更高的航天級傳感器,成本會高達上百萬。差分GPS市價30萬,基站覆蓋范圍10公里。從機場到天安門這段路約29.1公里,想實現全程信號覆蓋,至少得建3個基站。如果用3G,不用搭建基站,但信號覆蓋效果會是個問題。所以最后的定位方式會結合多種傳感器做融合推理。
Google無人車依賴GPS,及傳感器做特征抽取,并把這些信息連到一塊分析。分析過程用到了SLAM(協同定位與繪圖)技術,它是一個機器學習算法,在機器人領域應用得很廣。根據車的移動,不斷調整地理位置估計,當搜集的信息足夠多時,就能實現精準定位。如果有足夠完善的地圖,就不需要用到SLAM,直接把場景和地圖特征做Mapping就可以。
技術人攻略:你現在主要的研究方向是什么?
我個人的興趣是用概率模型(例如概率圖模型)方法解決人工智能問題。在無人車這塊,正嘗試通過深度學習模型,對人的駕駛及周圍環境建模,訓練出一些模型,和車的控制算法結合,讓機器變得更聰明。
傳統控制方式會寫一些if、then條件,例如:如果視野里出現紅色,則前方有紅燈。但僅憑這一條規則判斷,結果會存在一定不確定性。圖模型則會連接更多前件和后件,根據已有知識,去推論圖里面某一個節點或者某一條邊,是否會存在或發生。仍然拿紅燈舉例,根據先驗知識,紅燈一般在高處。除了判斷顏色之外,還需要判斷紅燈和地面之間的關系。如果在地面上檢測出來一個紅色物體,那么它是紅燈的可信度不會很高,如果在天空上,那么很可能是一個紅燈。
除無人車外,我還對自然語言處理感興趣,例如做Email的Intention Direction分析,怎么知道某封郵件是找你要資料的Email,還是老板通知你去開會的Email。再進一步,通過智能助理提醒你,回復前兩天別人找你要資料的Email,或只對老板讓你開會的Email做出響應。如何理解你老板,和開會這兩件事,涉及到對人和事件的識別與抽取,這中間可以做大量的嘗試,會讓你對人工智能的能力感到很振奮。
我參與過最有趣的人工智能項目是MSRA的“讀心機器人”:你在心中設想一個公眾人物,它能通過一系列問題,猜出你心里想的那個TA是誰。這實際上是一個排序算法,根據用戶的每一次回答調整 Ranking。其中的技術涉及到知識庫構建,所有人物的背景知識都從互聯網上抓取。還涉及到群體智能,通過用戶的回答調整算法。
技術人攻略:剛提到用圖模型方法解決人工智能問題,圖模型有哪些好處?如何實現?
用圖模型解決問題的方法,在人工智能里被稱為“連接主義”。過去我們常把數據看成一個個孤立的點,針對點做假設。但實際上,可能很遠的地方一個毫不相干的信息,會觸發你這里致命,或決策性的響應。所以用圖來研究人工智能是很自然的方式。
Google知識圖譜(Knowledge Graph)就是根據圖模型構建起來的,我們一般叫它知識庫(Knowledge Base)。例如你想搜索關于奧巴馬總統的知識,傳統搜索引擎做關鍵字匹配,難免會搜出一些不需要的東西。用知識圖譜方式,全世界有1000個人叫奧巴馬,但可能只有一個人和“米歇爾(奧巴馬的妻子)”有關系,通過這類聯系,迅速定位出目標。
但如何能知道米歇爾和奧巴馬之間的聯系呢?這就涉及到知識庫的構建。構建分為兩步,第一步是Entity Linking,找出材料中提到了知識庫里的誰?第二步是Slot Filling,找出在說他的什么事?
人類的思考過程并不僅依靠輸入的材料,而是會結合已有常識分析。例如大部分人大學畢業都在22歲左右,大部分人會在30歲之前結婚、生子,大部分人壽命不會超過100歲……這一系列概率分布構成了人的背景知識,利用這些知識可以輔助和改進人工智能效果。
常識一般分三類,第一類叫事實,例如:布萊爾是英國總理。這個層面的知識可以從大英百科全書或Wikipedia上拿到;第二類常識,例如:布萊爾是個人,他是個男人。涉及上下層級關系,要更難一些;第三層更困難,例如:布萊爾是個男人,男人通常會和女人結婚,通常會在結婚后兩年生小孩。第三層涉及的規則,是真正的人類智力和人工智能之間的壁壘所在,如何能夠有效挖掘出這些規則,是目前人工智能遇到的最大挑戰。
技術人攻略:除了規則挖掘,人工智能遇到的難題還有哪些?
所有做人工智能和機器學習的人,遇到最普遍的難題是:缺乏被標記好的數據。舉個例子,我們面前這一瓶可樂,網絡上能找到成千上萬張圖片,但就是沒有標記出來它是一瓶“可樂”。即使在電商網站上,這張圖很可能也并不會標記為“可樂”,而是叫“解暑佳品”。在這樣的情況下,機器又如何能知道對應的圖就是“可樂”呢?
再舉個極端的例子,你在朋友圈貼了幾張美食的圖片,發了一句感慨:今天真開心。這句話和美食沒有任何關系,根本沒法處理。而有的人會說:我在大眾點評上找了一家烤肉店,味道非常不錯。那“烤肉”這個詞就能抓出來了。所以這不是技術上的問題,而是要看你能拿到多少數據。
怎樣從這些沒有標記過的數據中,搞出一點苗頭出來,這就是當下最火的深度學習要做的事。有別于深度學習直接用原始數據的生猛做法,傳統解決辦法是用遠程監督(Distant Supervision)技術獲取數據,例如從網上抽出一些可能的標簽,在“減肥佳品,消暑必備可樂”這句話里,會抽出“減肥”,“消暑”、“可樂”這些名詞。統計相似的圖片里面,有哪些關鍵詞經常出現,用不確定性解決這個問題。算完之后給出一個概率:這個東西在談可樂的概率80%,在談減肥的概率20%。只要數據量夠大,這些都不是問題。
機器學習上手很容易,關鍵是能挖出什么東西來。真實數據里噪聲非常多,缺失的信息也很多,實踐者要學會繞出這些坑,從紛亂的數據中找出規律。在深度學習還沒到大家腦海里之前,大部分機器學習學者都在觀察數據有什么特征,這叫做特征工程。例如你發現數據里所有單詞的第一個字母都大寫,就把它當成一個特征,別人如果沒用到這個特征,你的算法就超前了。搞人工智能的人,必須對數據敏感,能從數據里發現一些別人看不到的端倪。機器學習是一個優化過程,但能從數據里挑什么來做優化,需要專業技術。而且數據特征和領域有緊密關系,廣告、網頁的、圖片識別的特征各不一樣,用到的模型也可能不一樣。
技術人攻略:前陣子媒體報道已有機器通過圖靈測試,你怎么看?
前陣子宣稱通過圖靈測試的那臺計算機,模擬了一位13歲的匈牙利外國男孩,并且還是得了病的那樣一個人的智能。做了許多限制條件,把AI設計成有缺陷的人,試圖蒙混過關。
實際上,真正的人工智能學家根本不會致力于去通過圖靈測試。我們不去爭論什么是真正的人工智能,而做以下設想:如果有一臺無人車,可以讓駕駛過程中90%的場景全都和人一樣。逐漸把這種算法應用到地鐵、飛機駕駛,并且都做到效果無限和人逼近。最后這些綜合起來,形成一個整體,你覺得它算不算人工智能?
人工智能分為兩派,以Google為首的一派搞統計,以侯世達為首的一派搞規則。兩派人總在爭論,究竟誰才是真正的人工智能。討論參與到最后,就變成了人和機器最后到底誰會控制誰的暢想。暢想完了之后總還要干活,作為科技工作者,不如埋頭把活干好。在局部范圍內讓機器人去逼近人,如果能做到一個比較良好的狀態,就稱其為在這個領域內,達到一定程度的人工智能。比起通過圖靈測試,這應該是更為實際的目標。
對于圖靈測試智能與否,也有學者吐槽。去年人工智能大會(IJCAI)上,Hector Levesque就指出:人與機器的區別應該在于認知和理解,比如“指代消歧”能力,普通人可以輕松結合上下文,分辨出文中的“它”指的是誰,但目前機器要做到這點挺難。
技術人攻略:Yann LeCun(燕樂存)預測這兩年會大量出現人工智能、機器學習的初創公司,你關注到有哪些這個領域的公司?
國外機器學習的初創公司很多,方向也相對比較雜,應用領域包括廣告、機器人、智能家居等。例如今年初Google以4億美金收購了DeepMind,這家公司的創始人之一是Yann LeCun的學生,他們把深度學習模型應用到游戲領域,做了個自動玩超級瑪麗的算法,發了篇很厲害的Paper。
深度學習最牛的地方,在于完全不需要定義規則,所有規則都由機器自己學習得出。在超級瑪麗游戲里,你根本不用定義馬里奧和烏龜的距離,只需定義活下去這個目標,把整幅截圖給機器,它自然就能找出在什么場景或什么動作序列下,游戲角色能存活最長時間。
這家公司價值如此大,關鍵還在于,超級瑪麗通關的算法,實際上跟其它高精尖領域的控制算法原理一樣。例如航天飛行器的控制算法,是在模擬器里,用模型驅動參數變化,給出結果并反復訓練的過程。廣告系統也類似,Google以前通過人,或者簡單算法調整廣告系統的參數,一方面效果達不到,另一方面浪費人力物力,深度學習或者超參優化能自動化地解決這個問題。
國內的創業環境更偏向于短平快,做機器學習初創的公司主要集中在廣告、營銷方向,包括輿情監控、精準投放等領域。也有像Face++這樣的,用機器學習做人臉識別,并做到這個領域的世界冠軍。
技術人攻略:機器學習、深度學習、人工智能、模式識別之間的區別與聯系是什么?想進入這個領域的人應該如何提升?
人工智能是目標;機器學習是一種技術手段;模式識別與機器學習有交集,但不一定非要經歷機器學習的訓練過程,可通過給匹配給定模式的方式實現;和深度學習對應的是淺層學習,都屬于機器學習的方式之一。
想進入人工智能領域,首先得了解它的發展歷史。從技術上看,人工智能應用領域基本可以落在圖像識別、聲音識別,自然語言處理這三類。從中找到你的載體,再從載體上尋找和明確要解決的科學問題。接下來看別人的解決方案是如何實現的,世界冠軍的標準是什么,朝著把世界冠軍打敗的方式去努力。這是所有做科研的人應該遵循的成長方式。
現在最火的深度學習領域的頂級牛人有4位,包括神經網絡的發明人、就職于Google的Geoff Hinton;Facebook人工智能研究院主任Yann LeCun;加拿大Montreal大學教授Yoshua Bengio;百度首席科學家Andrew Ng。他們當年都曾在NEC Lab里共事。2006年之前,支持向量機模型(Support Vector Machine)占據了機器學習領域的江山。神經網絡出來了之后,在性能上壓倒式地超越了SVM,在語音和圖像識別兩個領域,把原有的世界機器學習紀錄全干掉了,所以一下子火了。不過目前深度學習在自然語言上還沒有特別好的解決方案。
大家普遍認為,人工智能這一行對數學有很高的要求,尤其是線性代數和概率論。以下幾本機器學習的書,也可以看看:《Pattern Recognition and Machine Learning》、《Machine Learning——An Algorithmic Perspective》、《Programming Collective Intelligence》、《Machine Learning in Action》、《Machine Learning for Hackers》。想做得好,還得多看Paper。不管是Paper還是新聞,推薦都盡量看英文原文。
技術人攻略:你在清華從本科一直讀到博士,談談在清華成長的感受吧?
外界對清華同學的吐槽比較多,比如情商低,自視甚高等。有些看法很片面,但至少我們做事情很認真。個體行為在一定程度上代表著學校,如果自己做事不靠譜,別人會說那個清華的誰不靠譜,有負于前面成百上千的師兄師姐營造出來的形象。
別人眼中的清華學子可能很乖巧好學。但真的乖嗎?不一定。好學嗎?有時候也會犯懶。這跟是不是清華其實沒關系。我從小也算是“別人家的孩子”,除了學習和品行不錯,內心其實很叛逆。許多同學來自于格式化的城市,我卻成長于廣袤的內蒙古,大興安嶺給了我灑脫的性格。我可能并不算典型的清華同學,所以這里談的都是些個人看法。
我從小非常喜歡看書,語文和英語很好,差點去學文科。但后來發現應試教育里那些文科的東西,不像理科那么有確定性。比如歷史,讓你談一下對鴉片戰爭的看法。我想這還不如解方程,于是學了理科。結果因為數學不行,各種被虐。
大一期中考試,我微積分考了52。從2004級開始,國內一些省份已經把微積分放進了高中數學,而我高中沒學,對微積分一竅不通。當時心里有巨大壓力,想著這回完了,我要被清華退回去了。后來一轉念,數學天賦我沒有,但刻苦這件事是可以做到的。為了向老師請教學習方法,我每天幫老師擦黑板(微積分上了三學期,我擦了整整三學期黑板),并把能找到的數學習題集都做了一遍。期末考試前,我做過的草稿紙,壘起來已足足有10公分高,但心里仍然是沒底。老師說:你如果再不及格,我就放過你(這句話更多是為安慰我,后來才聽說這位老師是名捕之首!)。結果是我考了98分,在半個小時之內做完了所有的題,許多題目熟悉得甚至不用算就知道答案。從那時候我就覺得,在清華混,努力是個很重要的因素。
技術人攻略:你未來一到兩年的計劃是什么?
我明年博士畢業,導師是國內人工智能領域的專家李德毅老師。他教導我做事要有載體、要思路清晰、要堅持,對我影響很大,完全能跟我長輩相提并論。
我現在大部分時間都在忙無人車。希望能在未來幾年,把無人車做到世界頂尖,讓中國自己的無人車在國際上占有一席之地。
畢業之后打算繼續搞科研,通過一個載體,把自己的模型放上去不斷優化。我不想完全去做產品,產品導向會有KPI要求,被虐成渣會影響家庭辛福。而且做科研可以經常換一些話題,新的事物一旦出現,就可以轉過去。但做產品可能三、五年都得耗在一條產品線上,世界在變化,好多好玩的事情不斷在發生,就沒辦法去做了。我是一個比較膽小的人,不適合一個人創業,讓我拋下身家冒險,我做不來。如果有一個好朋友,他又對項目很有信心,我在里面幫他做一部分力所能及的事倒是可以。
我也搞不了偏商業化的東西。曾有人找我做高頻交易機器人,但那不是我的興趣所在。一旦你進入一個高頻交易所,每天給他們寫腳本,但那件事情并不是你想做的。只是你有的那塊技術正好變成了他們比較重要的一塊積木,上面和下面的積木都會擠壓著你,帶著你走向一個你不知道是什么樣的地方。我想做一塊獨立、自由的積木,最好是變形金剛那種,最好周圍的積木也不太規則,這樣大家就不會完全拼在一塊兒,求同存異,會更有趣。
作者介紹:技術人攻略訪談是關于技術人生活和成長的系列訪問,由獨立媒體人Gracia創立和維護。報道內容以“人”為核心,通過技術人的故事傳遞技術夢想;同時以小見大,見證技術的發展和行業的變遷。在這個前所未有的變革時代下,我們的眼光將投向有關:創造力、好奇心、冒險精神,這樣一些長期被忽略的美好品質上。相信通過這樣一群心懷夢想,并且正腳踏實地在改變世界的技術人,這些美好的東西將重新獲得珍視。
聯系方式 gracia@devlevelup.com
微博: @技術人攻略
訂閱:微信搜“技術人攻略”或“dev-levelup”
感謝SegmentFault提供博客專欄及推廣支持。
感謝迅達云成提供云主機及技術支持。
感謝七牛云存儲對“技術人攻略影像拍攝計劃”提供支持。
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/19593.html
摘要:我一直認為運維工程師就是讓跳舞的人,當我操縱幾百臺機器,整齊劃一地做一件事情,那種感覺特別棒。技術人攻略你怎么看待,運維和開發的關系應該怎樣平衡國內大家提得多 showImg(http://segmentfault.com/img/bVb66I); 技術人攻略:運維工作普遍很辛苦,你卻能做得如此快樂,有哪些經驗可以分享? 流程比補位更重要,方法比拼命更重要。UPYUN運...
摘要:導語本期訪談對象許式偉,七牛云存儲,國內語言圈領軍人物,社區發起人。許式偉的經歷頗有傳奇性,大學時就有狂外號的他,憑一份手寫簡歷成功應聘金山,兩年后成長為首席架構師,領導長達年的研發。在某技術大會的間隙,我第一次見到許式偉。 showImg(https://segmentfault.com/img/bVjLDc); 文:Gracia (本文為原創內容,部分或全文轉載均需經過作者授權,...
閱讀 2771·2021-09-24 10:34
閱讀 1874·2021-09-22 10:02
閱讀 2262·2021-09-09 09:33
閱讀 1465·2021-08-13 15:02
閱讀 3276·2020-12-03 17:10
閱讀 1191·2019-08-30 15:44
閱讀 2152·2019-08-30 12:58
閱讀 3236·2019-08-26 13:40