成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

用邏輯回歸來進行分類

人工智能 機器學習
邏輯回歸是機器學習中經常用到的一種方法,其屬于有監督機器學習,邏輯回歸的名字雖然帶有“回歸”二字,但實際上它卻屬于一種分類方法,本文就介紹一下如何用邏輯回歸進行分類。

[[345345]]

邏輯回歸是機器學習中經常用到的一種方法,其屬于有監督機器學習,邏輯回歸的名字雖然帶有“回歸”二字,但實際上它卻屬于一種分類方法,本文就介紹一下如何用邏輯回歸進行分類。

首先還是介紹一下邏輯回歸的基本原理。

 

圖1. 邏輯函數圖形

 

邏輯回歸之所以叫“邏輯”,是因為其使用了Logistic函數(也稱Sigmoid函數),該函數形式如圖2中式(1)所示,圖形如圖1所示。既然邏輯回歸是分類方法,那么我們這里就以最簡單的二分類來說明一下,二分類的輸出標記為 y=0或1,而線性回歸產生的預測值z = ω^Tx+b,我們讓t=z,把z的表達式帶入到式(1)中得到式(2),再做變換就得到式(3)。y是我們要求的正例,1-y則是反例,二者比值則可稱為幾率,所以式(3)可以稱作“對數幾率”。接下來我們要求解ω和b,用的是極大似然估計法。我們將y視為后驗概率估計p(y=1|x),那么就可以得到圖3中的式(4)和(5)。接下來令β=(ω;b)和x=(x;1),可得到式(6),由式(6)的得到圖4中(7)、(8)和(9),(9)就是目標函數,對目標函數求解得到最優參數即可。這些推導比較復雜,筆者在這里僅列出了主要部分,大家如果有興趣,可自行查閱相關資料。

 

圖2. 邏輯回歸推導公式(1)—(3)

 

 

圖3. 邏輯回歸推導公式(4)—(6)

 

 

圖4. 邏輯回歸推導公式(7)—(9)

 

在了解邏輯回歸的基本原理之后,我們再用一個例子來介紹一下邏輯回歸的用法。

本文中我們使用的邏輯回歸模型來自scikit-learn,用到的數據集也同樣來自于scikit-learn,代碼如下。

  1. import matplotlib.pyplot as plt 
  2. from sklearn.metrics import classification_report 
  3. from sklearn.datasets import make_classification 
  4. from sklearn.linear_model import LogisticRegression 
  5. from sklearn.model_selection import train_test_split  
  6.  
  7. X, y = make_classification(n_samples=100, n_features=2,  
  8. n_informative=2, n_redundant=0, n_clusters_per_class=1, 
  9. class_sep = 2.0, random_state=15) 
  10. fig, ax = plt.subplots(figsize=(8, 6)) 
  11. plt.scatter(X[:, 0], X[:, 1], marker='o', c=y) 
  12. plt.xlabel('Feature 1'
  13. plt.ylabel('Feature 2'
  14. plt.show() 

 


圖5. 本例中所用數據點

 

其結果如圖5所示。這個數據集是我們用make_classification方法生成的,共100個點,一共兩個特征(維度),所有數據共分為兩個類。從圖中可以看出紫色的點分為一類,黃色的點分為另一類。然后對數據集進行一下劃分,分為訓練集和測試集,代碼如下。X_train, X_test,y_train, y_test = train_test_split(X, y, test_size=0.30, random_state=30)

在這里,我們設置測試集的數據個數為30個,隨機狀態random_state為30,這個數字可以隨意設置。接下來我們用邏輯回歸來進行一下訓練和預測,結果用classification_report方法輸出。

  1. model = LogisticRegression() #生成模型 
  2. model.fit(X_train, y_train) #輸入訓練數據 
  3. y_predict = model.predict(X_test) #輸出預測數據 
  4. print(classification_report(y_test, y_predict)) #生成預測結果報告預測 

結果如圖6所示。從圖6中我們可以看出該模型的accuracy為0.97,因為我們的測試數據共有30個,所以這意味著我們只有1個點預測錯了,說明該模型的分類效果還是非常不錯的。

 

圖6. 模型結果報告

 

然后為了讓大家對該模型的分類效果有一個進一步的了解,筆者在這里再深入研究一下,我們再來看看邏輯回歸模型的分類邊界,即該模型是從哪里開始進行劃分的,代碼如下。

  1. step = 0.01 # 相當步長,越小點越密集 
  2. x_min = X[:, 0].min() -1 #設置mesh的邊界 
  3. x_max = X[:, 0].max() + 1 
  4. y_min = X[:, 1].min() - 1 
  5. y_max = X[:, 1].max() + 1 
  6. x_mesh, y_mesh = np.meshgrid(np.arange(x_min, x_max, step), np.arange(y_min, y_max, step))  
  7. data_mesh = np.stack([x_mesh.ravel(), y_mesh.ravel()], axis=-1) #把mesh轉換為2列的數據 
  8. Z = model.predict(data_mesh) 
  9. Z = Z.reshape(x_mesh.shape) 
  10. fig, ax = plt.subplots(figsize=(8,6)) 
  11. plt.pcolormesh(x_mesh, y_mesh, Z, cmap=plt.cm.cool) #畫出mesh的顏色 
  12. plt.scatter(X[:, 0], X[:, 1], c=y, cmap=plt.cm.ocean) 
  13. plt.show() 

這里代碼有些復雜,解釋一下。我們的設計思路是這樣的,因為本次使用的邏輯回歸模型是一個二分類模型,也就是將結果分為了兩個類,那么我們把模型中每個類的區域用一種顏色標出,這樣就有兩種顏色。落入每個區域的點就屬于這個區域,也就是這個類。x_mesh, y_mesh = np.meshgrid(np.arange(x_min, x_max, step), np.arange(y_min, y_max, step))這行代碼就是得到整個區域(也就是兩個類的區域之和)的點,這個區域比我們用到的數據集的范圍大一些,x_min、x_max、y_min、y_max就是整個區域的邊界。data_mesh = np.stack([x_mesh.ravel(), y_mesh.ravel()], axis=-1) 這行代碼就是把上面整個區域中的點轉換為2列的數據,便于后面預測,Z = model.predict(data_mesh)就是區域每個點的預測值,我們再用plt.pcolormesh和plt.scatter分別畫出區域顏色和數據點的顏色,就能清楚看到那些點在哪個區域中。其結果如圖7所示。

 

圖7. 用不同顏色來表示不同的劃分區域

 

從結果中可以看出,有一個綠色的點落入到了錯誤的區域中,說明這個點預測錯了,這和我們前面classification_report得到的結果一致。

邏輯回歸在機器學習中的使用非常廣泛而且效果也不錯,但其也有一些缺點,比如不能解決非線性問題、對多重共線性數據較為敏感、很難處理數據不平衡的問題等。其原理也要比筆者介紹的復雜不少,想要深入了解的讀者可以自行查找相關資料來學習。

作者簡介:Mort,數據分析愛好者,擅長數據可視化,比較關注機器學習領域,希望能和業內朋友多學習交流。

責任編輯:未麗燕 來源: Python中文社區
相關推薦

2020-12-24 06:54:45

Python機器學習多類分類邏輯回歸

2023-03-30 11:38:56

機器學習邏輯規則數量

2020-08-25 18:10:22

Python代碼線性回歸

2018-04-09 10:20:32

深度學習

2017-10-10 14:20:11

隨機森林分類算法

2010-03-20 20:14:43

2023-11-28 09:00:00

機器學習少樣本學習SetFit

2011-03-03 10:16:06

喬布斯iPad 2

2021-04-21 10:47:48

機器學習邏輯回歸

2024-09-20 10:02:13

2022-06-05 21:16:08

機器學習Python

2016-12-27 15:33:25

softmax分類器課程

2025-02-28 07:31:40

2020-12-23 07:54:56

Python機器學習邏輯回歸算法

2018-09-15 15:07:50

AppleiPhone手機

2013-10-23 10:30:21

搜狗

2024-04-15 07:42:40

數據庫關系型數據庫數據多模

2024-11-21 16:06:02

2022-08-15 15:16:20

機器學習圖片深度學習

2021-11-03 06:57:42

數據線性邏輯
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 一区二区三区免费观看 | 91视视频在线观看入口直接观看 | 国产精品亚洲第一区在线暖暖韩国 | 亚洲天堂二区 | 国产成人精品综合 | 日韩精品色网 | 国产激情免费视频 | 视频一二三区 | 九九亚洲 | 亚洲永久精品国产 | 99久久久国产精品 | 青青草视频网站 | 久久久激情 | 久久国产精品网站 | 亚洲一区二区中文字幕 | 九九热在线观看视频 | 视频在线亚洲 | 亚洲乱码国产乱码精品精98午夜 | 一区天堂| 精品福利在线 | 午夜看看 | 成人综合视频在线 | 国产欧美精品一区二区三区 | 天天干天天玩天天操 | 国产精品国产成人国产三级 | 久久久久久看片 | 久草精品视频 | 中文字幕一区二区三区在线观看 | 国产精品美女久久久免费 | 亚洲淫视频 | 性福视频在线观看 | 精精国产xxxx视频在线野外 | 黄色网络在线观看 | 成人深夜福利网站 | 国产激情一区二区三区 | 国产精品视频一二三区 | 久久看片 | 国产欧美一区二区三区日本久久久 | 欧美激情久久久久久 | 成年人在线视频 | 奇米影视首页 |