摘要:機器學(xué)習(xí)的過程機器學(xué)習(xí)的流程可以概括為幾大部分,分別是設(shè)置數(shù)據(jù)集劃分訓(xùn)練集和測試集構(gòu)建計算網(wǎng)絡(luò)訓(xùn)練模型測試模型以及其他一些環(huán)節(jié)。機器學(xué)習(xí)在某些時候,很接近于線性回歸,而這個庫很適合用來創(chuàng)建大量的數(shù)字集合。
網(wǎng)上關(guān)于機器學(xué)習(xí)的文章,視頻不計其數(shù),本來寫這么一篇東西,我自己也覺得有點多余,但是我還真沒找到一個能幫助像我這樣零基礎(chǔ)的人,快速接觸和上手機器學(xué)習(xí)的文章。這篇文章不能讓你深入學(xué)習(xí)和掌握機器學(xué)習(xí)的相關(guān)知識,但是一定能讓你快速了解什么是機器學(xué)習(xí),以及你到底要不要深入學(xué)習(xí),你需要提前學(xué)哪些東西來makes you ready。
機器學(xué)習(xí)是什么其實這個恐怕任何一個從業(yè)人員都已經(jīng)了解了,我也不過多介紹了,用我自己的話來說就是:讓機器學(xué)會用接近人類思考的方式來學(xué)習(xí)新的技能,從而幫助人類從一些簡單的智能工作上解脫出來。比如車牌號識別、手寫識別、語音識別、圖片OCR等等。
機器學(xué)習(xí)的過程機器學(xué)習(xí)的流程可以概括為幾大部分,分別是:設(shè)置數(shù)據(jù)集、劃分訓(xùn)練集和測試集、構(gòu)建計算網(wǎng)絡(luò)、訓(xùn)練模型、測試模型以及其他一些環(huán)節(jié)。設(shè)置數(shù)據(jù)集就是獲取測試數(shù)據(jù),你不能用爬蟲隨便爬幾千個圖片來訓(xùn)練,必須將圖片先轉(zhuǎn)化為規(guī)范的數(shù)據(jù)集合,比如大小相同等。其他的語音識別等,也需要先做類似的工作。幸運的是,你可以注冊一個kaggle的賬號,來獲取一些已經(jīng)采集好的標(biāo)準(zhǔn)數(shù)據(jù)集。第二步是劃分集合,一多半用來訓(xùn)練,一小半用來測試,具體的比例你可以自行測試調(diào)優(yōu)。訓(xùn)練集用來訓(xùn)練模型,測試集用來評估訓(xùn)練結(jié)果。為了防止模型過于匹配某些訓(xùn)練數(shù)據(jù)(術(shù)語叫做過擬合),訓(xùn)練時往往是不停的隨機抽取樣本建立批次來進行訓(xùn)練的,而不是分批次逐個批次訓(xùn)練做到全覆蓋。后面的幾個環(huán)節(jié),我就不細說了,網(wǎng)上最多的就是這個。在keras框架中,這三個環(huán)節(jié)也就是幾行代碼的事。
tensorflow、keras、Matlab和神經(jīng)網(wǎng)絡(luò)CNN都是什么這個是我初學(xué)的時候最困擾我的問題之一。Matlab是一種開發(fā)工具,類似于python語言,通信專業(yè)的孩子都懂的,經(jīng)常用來繪制數(shù)學(xué)圖像。tensorflow是一套機器學(xué)習(xí)框架,你可以詳細的設(shè)計和定制你的學(xué)習(xí)模型和流程,當(dāng)然你需要大量的專業(yè)知識和技能才能做到。keras是最適合我這種入門小白學(xué)習(xí)的,但是抽象的級別過高,你還是先了解下tensorflow再用比較好。它把很多tensorflow的功能(也可以使用theano和其他計算框架)都進行了更高層面的組合,讓你用很少的代碼就能實現(xiàn)很多功能。神經(jīng)網(wǎng)絡(luò)CNN是主要用于圖像領(lǐng)域的計算框架,是一種計算模型,類似于基于Java或者PHP語言所使用的后端架構(gòu)。實現(xiàn)的方式多種多樣,這種架構(gòu)比較適合圖像識別(也可以用于語音識別等)。
基礎(chǔ)知識的準(zhǔn)備matplotlib庫是你必備的,這個是數(shù)學(xué)工具庫,主要用來繪制數(shù)學(xué)函數(shù)和圖像,非常的強大,很接近于Matlab的功能。這個網(wǎng)上也有專門的教程,建議先簡單學(xué)習(xí)一下。
然后是numpy庫,這個庫是科學(xué)計算領(lǐng)域常用的庫,專門用來做數(shù)字方面的工作,也是建議先學(xué)習(xí)一下。機器學(xué)習(xí)在某些時候,很接近于線性回歸,而這個庫很適合用來創(chuàng)建大量的數(shù)字集合。
再之后是OpenCV庫,這個是專門用來做圖像處理的庫(我學(xué)的是python版本,原版貌似是c++開發(fā)的),包括攝像頭采集,圖像變換,圖像分析分類等等,功能非常的強悍,可以說是計算機視覺領(lǐng)域必備的庫。網(wǎng)上也有專門的大量教程,也建議先學(xué)習(xí)一下,了解基礎(chǔ)用法。其中攝像頭人臉檢測(就是在圖像中識別出有沒有人臉),甚至已經(jīng)內(nèi)置了處理模型,能直接調(diào)用api檢測出來。
想要開發(fā)出一個識別人臉或者動物的模型其實很簡單,但是但是但是!想要知道這個模型是如何設(shè)計的,以及設(shè)計一個屬于自己的模型去解決特定問題,這個是很難的。也就是說,寫代碼很簡單,關(guān)鍵是熟練使用各種數(shù)學(xué)模型組成計算框架。斯坦福大學(xué)在網(wǎng)易云課堂上面有一個公開課,里面全都是各種數(shù)學(xué)模型和公式,目前我還無法駕馭,數(shù)學(xué)學(xué)渣感覺壓力很大。如果你想深入研究并解決你自己遇到的特定問題,那么你需要熟練使用各種數(shù)學(xué)模型,還要知道如何評估自己的模型的準(zhǔn)確率。星辰大海等著你去征服,少年。
最后的最后,我學(xué)這個時間確實很短,一定會有很多遺漏和錯誤之處,如果大家發(fā)現(xiàn)了,請一定指出并最好附上文檔鏈接,大家共同學(xué)習(xí)。
最后補充一些特別好的文章資料,供大家進一步閱讀:
https://zhuanlan.zhihu.com/p/... 專欄里的文章都不錯,比較容易理解
http://www.cnblogs.com/neo-T/... 這是我看過的最簡單的入門文章
https://www.bilibili.com/vide... 這個up的視頻講的也不錯,真·手把手教
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/41869.html
摘要:正在失業(yè)中的課多周刊第期我們的微信公眾號,更多精彩內(nèi)容皆在微信公眾號,歡迎關(guān)注。若有幫助,請把課多周刊推薦給你的朋友,你的支持是我們最大的動力。是一種禍害譯本文淺談了在中關(guān)于的不好之處。淺談超時一運維的排查方式。 正在失業(yè)中的《課多周刊》(第3期) 我們的微信公眾號:fed-talk,更多精彩內(nèi)容皆在微信公眾號,歡迎關(guān)注。 若有幫助,請把 課多周刊 推薦給你的朋友,你的支持是我們最大的...
摘要:正在失業(yè)中的課多周刊第期我們的微信公眾號,更多精彩內(nèi)容皆在微信公眾號,歡迎關(guān)注。若有幫助,請把課多周刊推薦給你的朋友,你的支持是我們最大的動力。是一種禍害譯本文淺談了在中關(guān)于的不好之處。淺談超時一運維的排查方式。 正在失業(yè)中的《課多周刊》(第3期) 我們的微信公眾號:fed-talk,更多精彩內(nèi)容皆在微信公眾號,歡迎關(guān)注。 若有幫助,請把 課多周刊 推薦給你的朋友,你的支持是我們最大的...
閱讀 2089·2021-11-24 10:34
閱讀 3064·2021-11-22 11:58
閱讀 3722·2021-09-28 09:35
閱讀 1736·2019-08-30 15:53
閱讀 2787·2019-08-30 14:11
閱讀 1560·2019-08-29 17:31
閱讀 548·2019-08-26 13:53
閱讀 2151·2019-08-26 13:45