摘要:而這對于數據中心來說則是一種巨大的挑戰。顯然,這一切在目前仍未引起足夠的重視。
自從Alpha GO戰勝人類圍棋選手以來,AI就成為了整個商業社會中熱度最高的一個名詞。在AI的背后是對傳統商業模式的巨大顛覆和對社會生產力的空前解放。雖然AI很可能在未來淘汰掉一部分重復性勞動很高的工作崗位,但因此所釋放出的勞動力將在未來把人類的創造力推向新的高峰。
但除了已經淪為陳詞濫調的AI光明未來,在實際的應用中,AI技術卻仍舊處于萌芽狀態。在目前的階段,人工智能——Artificial Intelligence仍舊處于相當初級的階段,還只能根據海量數據所構建出的模型來完成應用中的推理與判斷,離真正的自主型人工智能或根據有限信息來自主拓展模型并作出判斷的強人工智能還有很大的差距。
不過由于目前AI開發與應用的主要模式已經確認,對應的研究手段也就變得明確起來。在現有的技術方向下,企業需要利用神經網絡技術并使用機器學習、深度學習算法來構建模型,在根據模型來開發對應的軟硬件解決方案。而無論是訓練AI模型還是利用AI模型來進行推理判斷,強大的運算能力都是必不可少的。
AI兩端的不同景象
在模型訓練方面,由于輸入的數據類型和使用的DL/ML框架不同,硬件不僅需要有強大的并行計算和浮點能力,更要具備強大的靈活性。但這兩種需求都不是傳統x86服務器所擅長的,因此就需要與x86異構的協處理器來完成對應的模型訓練任務。在這一領域,最大的贏家無疑就是NVIDIA。面對這一市場的巨大需求和豐厚利潤,NVIDIA不僅推出了針對不同性能和應用環境的多款GPU產品,更推出了對應的一體機甚至是為大規模GPU互聯提供更高帶寬的NVLink總線。此外,針對云數據中心的虛擬化環境和相關訓練程序的開發,NVIDIA也有專門的GRID虛擬化技術及提高并行運算效率的CUDA語言。
以龐大的產品研發投入,NVIDIA幾乎占領了AI中的模型訓練市場。不過在利用成品模型進行實際問題的推理判斷領域,NVIDIA卻還沒有獲得相應的統治地位。
利用AI模型(程序)進行實際問題的推理和判斷仍舊需要對應的硬件系統擁有強大的運算能力。但與模型訓練的復雜場景不同,由于需要運行的程序和處理的數據類型的相對固定,硬件系統并不需要很高的靈活性。相反,在實際的AI應用場景中,用戶往往對硬件的采購成本、能效和部署效率有著更高的要求。
于是,專門對應某種算法的AI芯片被越來越多的制造了出來。最近在資本圈和市場上引起廣泛關注的華為海思、寒武紀、地平線、比特大陸等公司都是這一領域的新貴。在產品形態上,他們大多采用ASIC方式將AI應用固化在芯片中,從而獲得更低的成本和更高的性能及能效。當然,傳統科技企業也沒有在這一領域缺席,包括Google的TPU、Intel的Arria 10系列(FPGA芯片)和Xilinx的Versal芯片(FPGA)等也紛紛進入AI推理判斷領域。
與AI模型訓練領域中NVIDIA的一家獨大不同,推理判斷領域卻呈現出了百家爭鳴、群雄逐鹿的景象。
云數據中心的AI隱憂
隨著云理念和云優勢被越來越多的企業認可,云計算市場也經歷著一輪又一輪的高速增長。而將AI能力通過云計算的形式交付給企業和用戶也成為了AI技術迅速發展并取得廣泛應用的前提條件。于是,對于云數據中心來說各類計算卡和AI芯片就成為了擴容建設的重中之重。
但隨著云計算市場和應用集中趨勢的愈發明顯,很快,大型云數據中心就會發現,越來越多的GPU、ASIC、FPGA會開始堆滿數據中心,他們分別運行著不同的程序、發揮著不同的作用、并且有著不同的管理方式。而這對于數據中心來說則是一種巨大的挑戰。
二十年前,當時的CPU性能遠沒有現在的強大,而面對龐大的數據存儲和管理壓力,大多數企業都開始研發運行效率更高的ASIC芯片,并使之成為存儲系統的核心功能實現單元。期初,這一思路取得了很好的效果,滿足的用戶的需求。但隨著時間得推移,越來越多不同廠牌、不同管理框架、不同功能的ASIC也讓存儲網絡的管理和運營成本直線飆升;最終受苦的仍舊是企業。直到現在,軟件定義存儲技術才開始慢慢扭轉這一局面,將企業從存儲系統結構的深淵中慢慢拉出來。
而現在,數據中心雖然已經實現了大面積的運化,但CPU+GPU+FPGA+ASIC的復雜計算架構卻仍舊有可能將企業拖入AI基礎設施的深淵,讓數據中心重新面臨二十年前的窘境。顯然,這一切在目前仍未引起足夠的重視。
誠然,AI的崛起能夠讓企業在數字化時代的競爭中獲得巨大的優勢,并有望徹底改變人們生活和企業運行的效率和方式,但這種粗放型的發展思路卻仍舊值得數據中心管理者們的重視。
指望在復雜多變的AI市場建立統一的管理和運行框架在目前這個時間節點是不現實的;寄希望于初出茅廬的AI芯片獨角獸們從整個數據中心未來管理和運營的角度來設計產品也不太可能。但從市場的規律來看,在沒有新的顛覆性技術出現之前,誰能夠解決好這一問題誰才有可能成為AI硬件市場未來真正的贏家。
基于這一點,最有希望成為贏家的仍舊是Intel和Google這樣龐大企業。他們既有設計數據中心架構的能力與經驗,也有引領行業發展的資本和實力。而隸屬于華為的海思則也有可能憑借華為豐富的設備制造和系統構建背景獲得未來市場的一杯羹。但對于地平線、比特大陸、寒武紀這樣最近幾年才嶄露頭角的新型企業來說,數據中心仍舊是一個龐大且無法掌控的存在,其未來最好的歸宿或許仍舊是被收購。
當然,由于具備更相對更高的靈活性,FPGA和GPU方案仍舊可以很方便的與各種數據中心管理架構兼容,這對于近來股價持續下跌的NVIDIA來說或許是一個好消息。
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/5414.html
摘要:但是在當時,幾乎沒有人看好深度學習的工作。年,與和共同撰寫了,這本因封面被人們親切地稱為花書的深度學習奠基之作,也成為了人工智能領域不可不讀的圣經級教材。在年底,開始為深度學習的產業孵化助力。 蒙特利爾大學計算機科學系教授 Yoshua Bengio從法國來到加拿大的時候,Yoshua Bengio只有12歲。他在加拿大度過了學生時代的大部分時光,在麥吉爾大學的校園中接受了從本科到博士的完整...
摘要:業內人士分析認為,云計算是科學技術領域的第二次革命,這個入口將直達每個企業在集體加碼云計算業務背后,凸顯了三巨頭聚焦業務的決心,端市場或將掀起一場爭奪戰。經過本次調整,騰訊將業務劃歸為和兩大塊。2月18日,百度發出由李彥宏署名的架構調整信,宣布技術體系架構整合。至此,互聯網三巨頭BAT均完成了各自的組織架構升級調整。2018年可謂互聯網企業的變革之年,除BAT之外,小米、美團、滴滴、ofo、...
摘要:今年月,谷歌發布了。在谷歌內部被稱為的方法中,一個控制器神經網絡可以提出一個子模型架構,然后可以在特定任務中對其進行訓練和評估質量。對于整個領域來說,一定是下一個時代發展重點,并且極有可能是機器學習的大殺器。 為什么我們需要 AutoML?在談論這個問題之前,我們需要先弄清楚機器學習的一般步驟。其實,不論是圖像識別、語音識別還是其他的機器學習項目,其結構差別是很小的,一個效果好的模型需要大量...
閱讀 639·2021-08-17 10:15
閱讀 1723·2021-07-30 14:57
閱讀 1977·2019-08-30 15:55
閱讀 2819·2019-08-30 15:55
閱讀 2707·2019-08-30 15:44
閱讀 670·2019-08-30 14:13
閱讀 2386·2019-08-30 13:55
閱讀 2591·2019-08-26 13:56