一張圖看懂機器學習分類及其應用
機器學習主要分成有監督學習、無監督學習和強化學習。但是各種方法的應用領域卻有所不同,下面將簡單介紹。
有監督學習
有監督學習是指根據帶有標簽的訓練數據學習模型,并最終預測新數據集的標簽。根據標簽是否離散或者多值也可以細分成很多問題,包括回歸問題、二元分類、多標簽分類、多值分類等。這里僅分成回歸和分類兩類來描述其應用領域。
分類問題:
- 欺詐檢測:比如銀行里面信用卡貸款審批需要考慮客戶的還款能力等,防止出現違約甚至故意欺騙銀行貸款等行為,這就需要欺詐檢測,即根據客戶的信息和行為,判斷其欺詐的概率。
- 圖像分類:這很容易理解,比如人臉識別。給定一張圖像,需要判斷屬于誰,或者你的認證圖像是否與本人一致。
- 客戶留存:客戶流失會影響公司的業務,如何判斷哪些用戶即將離開是很重要的問題,客戶留存的判斷也是有監督學習的重要應用。
- 醫療診斷:比如給出患者的歷史病歷以及描述等,判斷患者的疾病。甚至是根據病情給出醫療方法。
回歸問題:
- Forecasting預測:這類預測,一般是指基于已有的歷史數據來預測未來的情況。最典型的應用就是時序數據的預測。
- Prediction預測:這種預測更具有一般性,不僅僅是指對未來的預測,還包括基于現有的數據判斷其輸出的值。比如說基于面積和位置判斷房屋價格。
- 流程優化:這個問題主要是追蹤生產流程系統,預測其行為來提升性能。
- new insights:說實話這個應用我自己也沒理解。洞察是一系列的分析行為,這里的含義可能是基于現有業務進行預測用以洞察未來。
無監督學習
無監督學習是基于沒有標簽的數據對進行學習,進而自動分類。無監督學習在理解數據,提升性能方面有很多不可替代的作用。這里無監督學習的應用主要分為兩類,一種是聚類,另一種是維度約減。
聚類應用
- 客戶分群:這是一個非常古老的話題了。主要是根據客戶的購買和其他行為數據將客戶分成不同的類別,進而做不同的營銷策略。這個應用在實際情況中,非常常見也很多。
- 目標營銷:目標營銷是一種提高產品或服務在特定(目標)受眾群體中的知名度的方法,這些受眾是總的市場中的一個子集。
- 推薦系統:推薦系統是目前非常常見的應用,聚類在推薦系統的主要作用是對產品和用戶進行劃分,進而提高推薦系統的性能。
維度約減
- 大數據可視化:大數據場景下,維度很高,數據的可視化更加具有挑戰性。聚類可以幫助我們壓縮數據維度,保持數據特性,提升大數據可視化的效果。
- 數據壓縮:數據壓縮是另外一種非常常見的應用場景,在圖像顯示、數據傳輸等領域都有很多應用。
- 結構發現:在數據理解和洞察的時候,經常需要對數據的結構進行整理和劃分,以幫助我們快速了解數據,發現規律。聚類可以有效提升結構發現的效率。
- 特征消減:在基于數據進行預測等場景中特征是很重要的輸入參數,但是類似的特征既會降低運行的效率,也會影響準確性。使用聚類方法對特征進行約減,可以幫助我們提升預測效率,降低無效輸入。
強化學習
強化學習,主要是根據特定的環境場景,尋找有效的措施和策略,以獲取最大的收益。隨著AlphaGo的名聲大噪,基于強化學習的應用和發展,在這幾年取得了顯著的成就。
其主要應用場景包括:
- 實時決策:在實際生活和工作當中有很多問題都需要實時決策。比如說無人機在飛行的過程中需要根據環境的條件調整自己的姿態和速度以保證飛行安全等。基于強化學習的實時決策可以幫助我們更好的實現自動控制等問題。
- 游戲AI:王者榮耀中的機器人就是基于強化學習的結果。AI在數以萬計的比賽中根據策略獲得的獎懲獲取優化的策略。
- 機器人導航:基于機器人識別到的環境和道路,決定導航路線。強化學習可以根據學習到的場景從多種導航策略中選擇最優的內容。