成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

如何評價算法的好壞?

大數據 算法
評價一個算法的好壞,我認為關鍵是看能不能解決問題。如果算法能很好地解決實際的問題,那么我認為就是好算法。 比如預測的算法,關鍵是看預測的準確率,即預測值與實際值之間的接近程度,而不是看算法本身的評分高低。

序言

評價一個算法的好壞,我認為關鍵是看能不能解決問題。如果算法能很好地解決實際的問題,那么我認為就是好算法。 比如預測的算法,關鍵是看預測的準確率,即預測值與實際值之間的接近程度,而不是看算法本身的評分高低。

在《 如何用人工智能預測雙 11 的交易額 》這篇文章中,利用線性回歸算法,我預測 2019 年雙 11 交易額為 2471 億元,而阿里官方公布的實際交易額是 2684 億元,預測值比實際值少 7.9%,對這個結果,我覺得準確率不夠高。反思預測的過程,我認為可以從以下幾個方面來進行改進。

1. 樣本

為了簡化算法模型,我舍棄掉了前幾年相對較小的數據,只保留了最近 5 年的數據。

在數據量本身就比較少的情況下,我仍然遵循簡單原則,這無形中就加大了算法不穩定的風險,出現了欠擬合的問題。

盡管算法的評分很高,但是評分高并不代表算法就好。所以,樣本的選擇非常重要,不能單純地追求算法的評分高,而忽略樣本的質量。

2. 算法

如果保留所有樣本,那么顯然數據呈現的規律并不是線性的,用多項式回歸算法應該是個更好的選擇。

假如用三次多項式回歸算法進行預測,那么算法代碼如下:

  1. # 導入所需的庫 
  2. import numpy as np 
  3. import pandas as pd 
  4. import matplotlib.pyplot as plt 
  5. from sklearn.linear_model import LinearRegression 
  6. from sklearn.preprocessing import PolynomialFeatures 
  7. from sklearn.pipeline import Pipeline 
  8. from sklearn.preprocessing import StandardScaler 
  9.  
  10. # 內嵌畫圖 
  11. %matplotlib inline 
  12.  
  13. # 設置正常顯示中文標簽 
  14. plt.rcParams['font.sans-serif'] = ['SimHei'
  15.  
  16. # 讀取數據,在林驥的公眾號后臺回復「1111」 
  17. df = pd.read_excel('./data/1111.xlsx'
  18.  
  19. # x 年份 
  20. x = np.array(df.iloc[:, 0]).reshape(-1, 1) 
  21.  
  22. # y 交易額 
  23. y = np.array(df.iloc[:, 1]) 
  24.  
  25. # z 預測的年份 
  26. z = [[2019]] 
  27.  
  28. # 用管道的方式調用多項式回歸算法 
  29. poly_reg = Pipeline([ 
  30.  ('ploy', PolynomialFeatures(degree=3)), 
  31.  ('std_scaler', StandardScaler()), 
  32.  ('lin_reg', LinearRegression()) 
  33. ]) 
  34. poly_reg.fit(x, y) 
  35.  
  36. # 用算法進行預測 
  37. predict = poly_reg.predict(z) 
  38.  
  39. # 輸出預測結果 
  40. print('預測 2019 年雙 11 的交易額是', str(round(predict[0],0)), '億元。'
  41. print('線性回歸算法的評分:', poly_reg.score(x, y)) 

預測 2019 年雙 11 的交易額是 2689.0 億元。

線性回歸算法的評分:0.99939752363314

下面是用 matplotlib 畫圖的代碼:

  1. # 將數據可視化,設置圖像大小 
  2. fig = plt.figure(figsize=(10, 8)) 
  3. ax = fig.add_subplot(111) 
  4.  
  5. # 繪制散點圖 
  6. ax.scatter(x, y, color='#0085c3', s=100) 
  7. ax.scatter(z, predict, color='#dc5034', marker='*', s=260) 
  8.  
  9. # 設置標簽等 
  10. plt.xlabel('年份', fontsize=20) 
  11. plt.ylabel('雙 11 交易額', fontsize=20) 
  12. plt.tick_params(labelsize=20) 
  13.  
  14. # 繪制預測的直線 
  15. x2 = np.concatenate([x, z]) 
  16. y2 = poly_reg.predict(x2) 
  17. plt.plot(x2, y2, '-', c='#7ab800'
  18. plt.title('用多項式回歸預測雙 11 的交易額', fontsize=26) 
  19. plt.show() 

 

如何評價算法的好壞?

這近乎完美地擬合了 2009 年以來十一年的數據,因此不禁讓人懷疑,阿里的數據是不是過于完美?

3. 優化

按照一般的機器學習算法流程,應該把數據拆分為兩部分,分別稱為訓練數據集和測試數據集。從 2009 年到 2018 年,雙 11 的交易額總共才 10 個數據,我在預測的時候還舍棄了前 5 個數據,最后只剩下 5 個數據,我以為再拆分就沒有必要了。 但機器學習算法的表現好壞,有一個關鍵因素,就是要有足夠多的數據量。

另外,應該適當地使用網格搜索法,優化算法的參數,必要時還要與交叉驗證法相結合,進行算法評估,從而提高算法的可信度和準確率。 除了算法的準確率,還可以使用其他的方法對模型進行評價,比如:召回率、F1 分數、ROC、AUC、MSE、RMSE、MAE 等等 。

現實世界是錯綜復雜的,很難用一個算法就解決問題,往往需要經過很多次的嘗試,才可能找到基本符合的模型。需要注意的是,多項式回歸的指數不宜過高,否則算法太復雜,很可能出現“過擬合”的現象,從而泛化能力比較差,也就是說,對于訓練數據集能夠很好地擬合,但是對于測試數據集的預測誤差比較大。模型復雜度與預測誤差的大致關系如下圖所示:

 

如何評價算法的好壞?

小結

本文是我在用線性回歸算法預測雙 11 的交易額之后,做的一次復盤,總結了改進的思路,學習優化的方法。

學以致用,是我學習的基本原則。如果害怕出錯,不去勇于實踐,學習再多算法有什么用?這就如同我們不能指望不下水就學會游泳一樣。

以上,希望能夠對你有所啟發。

責任編輯:未麗燕 來源: 今日頭條
相關推薦

2016-01-29 10:06:47

UI設計標準

2013-05-02 09:29:43

交換機評判端口密度

2017-04-26 15:21:38

服務器配置

2022-05-05 12:03:08

分布式系統設計

2016-12-28 17:59:28

MongoDBNoSQL數據

2009-12-02 14:09:52

2018-09-10 13:02:48

人工智能AI創業公司

2020-04-02 16:12:56

推薦系統CTR分流

2015-04-09 10:15:50

弱電線纜線纜

2011-05-06 17:16:18

相紙

2020-08-13 17:59:20

區塊鏈區塊鏈項目數字貨幣

2013-10-21 10:53:34

虛擬化產品

2023-09-05 10:36:51

3D視覺

2021-05-26 05:33:30

5G網絡運營商

2016-11-07 15:21:17

數據中心指標

2014-01-16 14:06:18

軟件開發團隊管理

2013-08-29 09:53:48

開發者iOS 7

2017-03-03 11:40:59

linuxping命令

2012-02-01 10:00:59

軟件

2009-11-04 09:02:57

Windows 7媒體評價
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 精品一区二区在线观看 | 国产一级毛片精品完整视频版 | 在线亚洲欧美 | 中文字幕在线国产 | 99久久精品国产一区二区三区 | 成人毛片在线视频 | 瑞克和莫蒂第五季在线观看 | 91玖玖 | 7799精品视频天天看 | 日本久草 | 欧美激情综合五月色丁香小说 | 国产一区二区三区在线 | 日本a网站| 成人午夜影院 | 欧美成人高清 | 操操日 | 日韩福利在线 | 四虎成人精品永久免费av九九 | 久草在线 | 中文字幕第二十页 | 亚洲精品久久久久久国产精华液 | 婷婷一级片 | a黄在线观看 | 91精品国产91久久综合桃花 | 亚洲精品2 | 爱草在线| 欧美成人精品二区三区99精品 | 国产精品一区视频 | 伊人网一区| 在线一区视频 | 青青久久 | 日本成人在线观看网站 | 久久精品电影 | 在线免费中文字幕 | 超碰精品在线观看 | 中文字幕在线电影观看 | av特级毛片 | 国产一区高清 | 天天射影院 | 免费在线国产视频 | 欧美精品一区二区三区在线播放 |