文章詳情頁

Python sklearn中的.fit與.predict的用法說明

瀏覽：80日期：2022-07-19 14:18:55

我就廢話不多說了，大家還是直接看代碼吧~

clf=KMeans(n_clusters=5) #創建分類器對象fit_clf=clf.fit(X) #用訓練器數據擬合分類器模型clf.predict(X) #也可以給新數據數據對其預測print(clf.cluster_centers_) #輸出5個類的聚類中心y_pred = clf.fit_predict(X) #用訓練器數據X擬合分類器模型并對訓練器數據X進行預測print(y_pred) #輸出預測結果

補充知識：sklearn中調用某個機器學習模型model.predict(x)和model.predict_proba(x)的區別

model.predict_proba(x)不同于model.predict()，它返回的預測值為獲得所有結果的概率。（有多少個分類結果，每行就有多少個概率，對每個結果都有一個概率值，如0、1兩分類就有兩個概率）

我們直接上代碼，通過具體例子來進一步講解：

python3 代碼實現：

# -*- coding: utf-8 -*-'''Created on Sat Jul 27 21:25:39 2019@author: ZQQ'''from sklearn.linear_model import LogisticRegressionfrom sklearn.ensemble import RandomForestClassifierfrom xgboost import XGBClassifierimport numpy as npimport warningswarnings.filterwarnings('ignore')# 這個方法只是解決了表面，沒有根治# 數據（特征，屬性）x_train = np.array([[1,2,3], [1,5,4], [2,2,2], [4,5,6], [3,5,4], [1,7,2]]) # 數據的標簽y_train = np.array([1, 0, 1, 1, 0, 0]) # 測試數據x_test = np.array([[2,1,2], [3,2,6], [2,6,4]]) # 導入模型model = LogisticRegression() #model = RandomForestClassifier()#model=XGBClassifier()model.fit(x_train, y_train)# 返回預測標簽 print(model.predict(x_test)) print(’---------------------------------------’)# 返回預測屬于某標簽的概率 print(model.predict_proba(x_test))

運行結果：

Python sklearn中的.fit與.predict的用法說明

分析結果：

使用model.predict() :

預測[2,1,2]為1類

預測[3,2,6]為1類

預測[2,6,4]為0類

使用model.predict_proba() :

預測[2,1,2]的標簽是0的概率為0.19442289，1的概率為0.80557711

預測[3,2,6]的標簽是0的概率為0.04163615，1的概率為0.95836385

預測[2,6,4]的標簽是0的概率為0.83059324，1的概率為0.16940676

預測為0類的概率值和預測為1的概率值和為1

同理，如果標簽繼續增加，3類：0，1, 2

預測為0類的概率值：a

預測為1類的概率值：b

預測為2類的概率值：c

預測出來的概率值的和a+b+c=1

注：model.predict_proba()返回所有標簽值可能性概率值，這些值是如何排序的呢？

返回模型中每個類的樣本概率，其中類按類self.classes_進行排序。

通過numpy.unique(label)方法，對label中的所有標簽值進行從小到大的去重排序。

得到一個從小到大唯一值的排序。這也就對應于model.predict_proba()的行返回結果。

以上這篇Python sklearn中的.fit與.predict的用法說明就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支持好吧啦網。

Python 編程

上一條：基于python實現ROC曲線繪制廣場解析下一條：解析python 中/ 和 % 和 //（地板除）

相關文章：

1. JSP之表單提交get和post的區別詳解及實例2. CSS可以做的幾個令你嘆為觀止的實例分享3. Xml簡介_動力節點Java學院整理4. jsp+servlet實現猜數字游戲5. javascript xml xsl取值及數據修改第1/2頁6. 低版本IE正常運行HTML5+CSS3網站的3種解決方案7. jsp文件下載功能實現代碼8. 將properties文件的配置設置為整個Web應用的全局變量實現方法9. ASP常用日期格式化函數 FormatDate()10. JSP+Servlet實現文件上傳到服務器功能

排行榜

					
					Python基于Serializer實現字段驗證及序列化
PHP單件模式和命令鏈模式的基礎知識
Python中用xlwt制作表格實例講解
Python多線程操作之互斥鎖、遞歸鎖、信號量、事件實例詳解
php strncmp函數原型源碼分析
JSP之表單提交get和post的區別詳解及實例
jsp文件下載功能實現代碼
部署vue+Springboot前后端分離項目的步驟實現
asp.net core項目授權流程詳解
JSP+Servlet實現文件上傳到服務器功能
ASP.NET Core實現中間件的幾種方式