摘要:在該數(shù)據(jù)集中,圖片被分為類,每個類別的圖片超過張。這樣做是為了減小圖片的范圍,使得圖片的特征更易于學習。為了在數(shù)據(jù)集上獲得更高的準確率,讀者可嘗試取消凍結(jié)參數(shù)的設(shè)置,使得卷積層也參與訓練。
Caltech 256是什么?
Caltech 256數(shù)據(jù)集是加利福尼亞理工學院收集整理的數(shù)據(jù)集,該數(shù)據(jù)集選自Google Image數(shù)據(jù)集,并手工去除了不符合其類別的圖片。在該數(shù)據(jù)集中,圖片被分為256類,每個類別的圖片超過80張。
為什么要用Densenet121模型?
本項目使用在PyTorch框架下搭建的神經(jīng)網(wǎng)絡(luò)來完成圖片分類的任務(wù)。由于網(wǎng)絡(luò)輸出的類別數(shù)量很大,簡單的網(wǎng)絡(luò)模型無法達到很好的分類效果,因此,本項目使用了預訓練的Densenet121模型,并僅訓練全連接層的參數(shù)。
項目流程:1、數(shù)據(jù)處理1.數(shù)據(jù)處理
2.Densenet模型解讀
3.加載預訓練網(wǎng)絡(luò)模型
4.訓練神經(jīng)網(wǎng)絡(luò)
首先從指定路徑讀取圖像,將圖像大小更改為224*224,并將圖片范圍從0-255改為0-1:
from PIL import Image image= Image.open(path) image=image.resize((224,224)) x_data= x_data.astype(numpy.float32) x_data= numpy.multiply(x_data, 1.0/255.0) ## scale to [0,1] from [0,255]
由于此數(shù)據(jù)集中有少量圖片的色彩是單通道的,而神經(jīng)網(wǎng)絡(luò)的輸入需要為三個通道,因此,將該通道的數(shù)據(jù)復制到三個通道上:
if len(x_data.shape)!=3: temp=numpy.zeros ((x_data.shape[0],x_data.shape[1],3)) temp[:,:,0] = x_data temp[:,:,1] = x_data temp[:,:,2] = x_data x_data= temp x_data=numpy.transpose(x_data,(2,0,1)) ## reshape
在上述步驟之后,對圖片進行白化,即讓像素點的平均值為0,方差為1。這樣做是為了減小圖片的范圍,使得圖片的特征更易于學習。白化的過程如下所示:
if x_train is not None: x_train[:,0,:,:] = (x_train[:,0,:,:]-0.485)/0.229 x_train[:,1,:,:] = (x_train[:,1,:,:]-0.456)/0.224 x_train[:,2,:,:] = (x_train[:,2,:,:]-0.406)/0.225 if x_test is not None: x_test[:,0,:,:] = (x_test[:,0,:,:] -0.485) /0.229 x_test[:,1,:,:] = (x_test[:,1,:,:] -0.456) /0.224 x_test[:,2,:,:] = (x_test[:,2,:,:] -0.406) /0.2252、DenseNet模型解讀
DenseNet的網(wǎng)絡(luò)結(jié)構(gòu)如下圖所示。在傳統(tǒng)的CNN中,每個卷積層只與其相鄰的卷積層相連接,這就造成了位于網(wǎng)絡(luò)淺層的參數(shù)在反向傳播中獲取的梯度非常小,也就是梯度消失問題。
DenseNet設(shè)計了名為Dense Block的特殊的網(wǎng)絡(luò)結(jié)構(gòu),在一個Dense Block中,每個層的輸入為前面所有層的輸出,這也正是Dense的含義。通過這種方法,在反向傳播中,網(wǎng)絡(luò)淺層的參數(shù)可以從后面所有層中獲得梯度,在很大程度上減弱了梯度消失的問題。值得注意的是,每個層只與同位于一個Dense Block中的多個層有連接,而與Dense Block外的層是沒有連接的。
3、加載預訓練網(wǎng)絡(luò)模型torchvision是服務(wù)于PyTorch框架的,用于進行圖片處理和生成一些主流模型的庫。使用該庫可以方便的加載PyTorch的預訓練模型。首先使用pip安裝torchvision庫:
pip install torchvision
創(chuàng)建densenet121模型實例,并加載預訓練參數(shù):
cnn = torchvision.models.densenet121 (pretrained = True) #pretrained =True即為加載預訓練參數(shù),默認不加載。
凍結(jié)所有模型參數(shù),使其值在反向傳播中不改變:
for param in cnn.parameters(): param.requires_grad= False
改變模型全連接層輸出的個數(shù)為256:
num_features= cnn.classifier.in_features cnn.classifier= nn.Linear(num_features, 256)
此處不需要擔心新建的全連接層參數(shù)會被凍結(jié),因為新建的層參數(shù)是默認獲取梯度的。
4、訓練神經(jīng)網(wǎng)絡(luò)損失函數(shù)選擇CrossEntropy,優(yōu)化器選擇Adam:
optimizer= Adam(cnn.parameters(), lr=0.001, betas=(0.9, 0.999)) # 選用AdamOptimizer loss_fn= nn.CrossEntropyLoss() # 定義損失函數(shù)
下面是完整的訓練過程:
# 訓練并評估模型 data= Dataset() model= Model(data) best_accuracy= 0 foriinrange(args.EPOCHS): cnn.train() x_train, y_train, x_test, y_test= data.next_batch(args.BATCH) # 讀取數(shù)據(jù) x_train= torch.from_numpy(x_train) y_train= torch.from_numpy(y_train) x_train= x_train.float() x_test= torch.from_numpy(x_test) y_test= torch.from_numpy(y_test) x_test= x_test.float() ifcuda_avail: x_train= Variable(x_train.cuda()) y_train= Variable(y_train.cuda()) x_test= Variable(x_test.cuda()) y_test= Variable(y_test.cuda()) outputs= cnn(x_train) _, prediction= torch.max(outputs.data, 1) optimizer.zero_grad() # calculate the loss according to labels loss= loss_fn(outputs, y_train) # backward transmit loss loss.backward() # adjust parameters using Adam optimizer.step() # 若測試準確率高于當前最高準確率,則保存模型 train_accuracy= eval(model, x_test, y_test) iftrain_accuracy>best_accuracy: best_accuracy= train_accuracy model.save_model(cnn, MODEL_PATH, overwrite=True) print("step %d, best accuracy %g"%(i, best_accuracy)) print(str(i) +"/"+str(args.EPOCHS))總結(jié):
本文主要講解了DenseNet的網(wǎng)絡(luò)結(jié)構(gòu),以及在PyTorch框架下如何加載預訓練模型并進行fine-tuning。為了在數(shù)據(jù)集上獲得更高的準確率,讀者可嘗試取消凍結(jié)參數(shù)的設(shè)置,使得卷積層也參與訓練。
獲取相關(guān)項目代碼 請訪問:https://www.flyai.com/d/Calte...
— END —
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/19914.html
摘要:地址為什么使用遷移學習根據(jù)聯(lián)合創(chuàng)始人斯坦福副教授吳恩達介紹,遷移學習將會成為機器學習商業(yè)成就的下一驅(qū)動力。遷移學習是一種機器學習技術(shù),允許在特定的數(shù)據(jù)集上再利用已訓練的卷積神經(jīng)網(wǎng)絡(luò),并將其調(diào)整或遷移到其他數(shù)據(jù)集。 GitHub 地址:https://github.com/miguelgfierro/sciblog_support/blob/master/A_Gentle_Introducti...
摘要:在本次競賽中,南京信息工程大學和帝國理工學院的團隊獲得了目標檢測的最優(yōu)成績,最優(yōu)檢測目標數(shù)量為平均較精確率為。最后在視頻目標檢測任務(wù)中,帝國理工大學和悉尼大學所組成的團隊取得了較佳表現(xiàn)。 在本次 ImageNet 競賽中,南京信息工程大學和帝國理工學院的團隊 BDAT 獲得了目標檢測的最優(yōu)成績,最優(yōu)檢測目標數(shù)量為 85、平均較精確率為 0.732227。而在目標定位任務(wù)中Momenta和牛津...
摘要:年月日,將標志著一個時代的終結(jié)。數(shù)據(jù)集最初由斯坦福大學李飛飛等人在的一篇論文中推出,并被用于替代數(shù)據(jù)集后者在數(shù)據(jù)規(guī)模和多樣性上都不如和數(shù)據(jù)集在標準化上不如。從年一個專注于圖像分類的數(shù)據(jù)集,也是李飛飛開創(chuàng)的。 2017 年 7 月 26 日,將標志著一個時代的終結(jié)。那一天,與計算機視覺頂會 CVPR 2017 同期舉行的 Workshop——超越 ILSVRC(Beyond ImageNet ...
摘要:深度神經(jīng)網(wǎng)絡(luò)能夠煥發(fā)新春,大數(shù)據(jù)功不可沒,然而大數(shù)據(jù)的版權(quán)是否應當延伸到深度學習產(chǎn)生的知識,這是一個現(xiàn)實的問題。要獲得有用的學習效果,大型多層深度神經(jīng)網(wǎng)絡(luò)又名深度學習系統(tǒng)需要大量的標簽數(shù)據(jù)。 深度神經(jīng)網(wǎng)絡(luò)能夠煥發(fā)新春,大數(shù)據(jù)功不可沒,然而大數(shù)據(jù)的版權(quán)是否應當延伸到深度學習產(chǎn)生的知識,這是一個現(xiàn)實的問題。本文通過ImageNet可視化大數(shù)據(jù)、Caffe共享深度學習模型和家中訓練三個場景審查了深...
閱讀 2210·2021-10-18 13:28
閱讀 2522·2021-10-11 10:59
閱讀 2347·2019-08-29 15:06
閱讀 1139·2019-08-26 13:54
閱讀 816·2019-08-26 13:52
閱讀 3153·2019-08-26 12:02
閱讀 3007·2019-08-26 11:44
閱讀 2518·2019-08-26 10:56