Sklearn入門介紹

superPershing 發布于2019-08-06 13:30 / 571人閱讀

摘要：隨著時代的到來及物聯網概念的日益受到人們的關注，機器學習正逐步應用于科技生活生產各個領域。今天我們就為介紹機器學習中常用到的一個第三庫，它是屬于的第三方庫，今天的講解也是基于來進行講解的。

隨著AI時代的到來及物聯網概念的日益受到人們的關注，機器學習正逐步應用于科技、生活生產各個領域。今天我們就為介紹機器學習中常用到的一個第三庫Sklearn，它是屬于python的第三方庫，今天的講解也是基于python-IDE來進行講解的。

使用sklearn的準備工作：

安裝python3.6.*

安裝python開發的IDE環境

首先應該安裝sklearn所需依賴的第三庫，包括scipy、numpy、matplotlib、pandas，安裝以上四個庫以后最后安裝sklearn

機器學習的六個主要步驟：

首先應該加載訓練模型所用的數據集

采用合適的比例將數據集劃分為訓練集和測試

選取合適或者創建合適的訓練模型

將訓練集中的數據輸入到模型中進行訓練

通過第四步的訓練大致確定模型所用的合理參數

將測試集中的數據輸入到模型中，根據模型得到的結果和真實的結果進行比較再次調整參數

Sklearn基礎知識概覽：

1. 加載sklearn中的數據集datasets

   from sklearn import datasets
   iris = datasets.load_iris() # 鳶尾花卉數據
   digits = datasets.load_digits() # 手寫數字8x8像素信息數據

2. 查看數據的信息

print（iris.data[:4]） # 查看數據的特征信息
print iris.data.shape） # 查看數據的特征信息維度

print（iris.target_names）# 查看標簽對應的文本
print （iris.target[:4] ）# 查看數據的標簽 setosa:0 ...

3. 訓練集和分割集的分割

from sklearn.model_selection import train_test_split

X = digits.data # 特征矩陣
y = digits.target # 標簽向量

# 隨機分割訓練集和測試集：
# test_size：設置測試集的比例。random_state:可理解為種子，保證隨機唯一
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=1/3., random_state=8)

sklearn實戰例子：

from sklearn import datasets
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split

iris = datasets.load_iris()
X = iris.data
y = iris.target

# 新建一個模型(參數默認)
iris_model = LinearRegression()

# 分割訓練集、測試集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=1/3., random_state=7)

# 訓練該模型
iris_model.fit(X_train,y_train)

# 返回模型參數列表
print(iris_model.get_params())

# 模型在訓練集上的評分
print(iris_model.score(X_train, y_train))

# 模型在測試集上的評分
print(iris_model.score(X_test, y_test))

# 使用模型進行預測
y_pred = iris_model.predict(X_test)

print("預測標簽：", y_pred[:3])
print("真實標簽：", y_test[:3])



# 使用pickle保存模型
import cPickle as pickle

with open("LR_model.pkl", "w") as f:
pickle.dump(iris_model, f)
# 重新加載模型進行預測
with open("LR_model.pkl", "r") as f:
model = pickle.load(f)

# 使用模型進行預測
model.predict(X_test)[:3]

運行成功結果截圖：

云服務器 GPU云服務器 Ruby入門介紹 spark入門介紹 Sklearn sklearn圖像識別

文章版權歸作者所有，未經允許請勿轉載,若此文章存在違規行為，您可以聯系管理員刪除。

轉載請注明本文地址：http://m.specialneedsforspecialkids.com/yun/61959.html

Sklearn入門介紹

摘要：隨著時代的到來及物聯網概念的日益受到人們的關注，機器學習正逐步應用于科技生活生產各個領域。今天我們就為介紹機器學習中常用到的一個第三庫，它是屬于的第三方庫，今天的講解也是基于來進行講解的。隨著AI時代的到來及物聯網概念的日益受到人們的關注，機器學習正逐步應用于科技、生活生產各個領域。今天我們就為介紹機器學習中常用到的一個第三庫Sklearn，它是屬于python的第三方庫，今天的講解...

miracledan 2019-07-31 11:05 評論0 收藏0
入門系列之Scikit-learn在Python中構建機器學習分類器

摘要：使用該數據集，我們將構建機器學習模型以使用腫瘤信息來預測腫瘤是惡性的還是良性的。我們將使用函數來確定機器學習分類器的準確性。您已成功構建了第一臺機器學習分類器。現在，您可以使用在中加載數據組織數據訓練預測和評估機器學習分類器。歡迎大家前往騰訊云+社區，獲取更多騰訊海量技術實踐干貨哦~ 本文由信姜緣發表于云+社區專欄介紹機器學習是計算機科學、人工智能和統計學的研究領域。機器學...

Null 2019-07-30 17:15 評論0 收藏0
我是如何入門機器學習的呢

摘要：在這里我分享下我個人入門機器學習的經歷，希望能對大家能有所幫助。相關學習鏈接，，入門后的體驗在入門了機器學習之后，在實際工作中，絕大多數的情況下你并不需要去創造一個新的算法。機器學習在很多眼里就是香餑餑，因為機器學習相關的崗位在當前市場待遇不錯，但同時機器學習在很多人面前又是一座大山，因為發現它太難學了。在這里我分享下我個人入門機器學習的經歷，希望能對大家能有所幫助。 PS：這篇文章...

ShowerSun 2019-06-26 18:27 評論0 收藏0