人工智能基礎:機器學習常見的算法介紹
今天給大家聊聊機器學習算法相關的知識,一起來看看吧!
機器學習的算法主要包括監督學習、無監督學習、半監督學習、遷移學習、強化學習。
1、監督學習
監督學習是機器學習當中非常常見的一種機器學習類型,就是在已知輸入輸出的情況下訓練出一個模型,并且將輸入映射輸出。
特點:給出了學習目標(比如實際值、標注等等)。
監督學習根據目標結果是離散還是連續,又可以把監督學習劃分為分類和回歸。
1.1 分類
該類型的預測目標值是離散的,比如預測是否會下雨,最終的結果只有兩種,下雨或者不下雨兩種類別情況。
目的:根據歷史的結果來預測新樣本的分類結果,針對兩個分類結果的任務稱為二分任務;兩種以上稱為多分類任務。
常見算法:決策樹、隨機森林、K-最近鄰算法、邏輯回歸、支持向量機、人工神經網絡。
1.2 回歸
該類型的預測目標值是連續的,典型的例子預測某個樓盤的價格趨勢。
算法:線性回歸、AdaBoosting等。
2、無監督學習
無監督學習的特點是不需要認為進行數據標注,而是根據模型不斷的進行自我學習、鞏固,最后通過自我總結歸納來學習。學習模型主要包含聚類、降維。
2.1 聚類
主要是指將物理或抽象對象的集合由相似對象組成多個類別過程,可以理解為按照相近的原則進行分組。
算法:常見的有K-means 算法、BIRCH算法、DBSCAN算法。
2.2 降維
針對高維度數據對系統資源和算法性能依賴非常大,降維就是把高維度數據中不重要的信息處理掉同時又保留大部分的重要信息。簡單來說就是由繁到簡的過程,把復雜的問題盡可能簡單話,這樣處理起來難度會小很多。
優點:節省空間、節省算法消耗的時間、減少系統資源的消耗。
算法:主成分分析算法(PCA)
3、半監督學習
監督學習與無監督學習相結合的一種學習方法。半監督學習使用大量的未標記數據,以及同時使用標記數據,來進行模式識別工作。
半監督學習適合由少量標簽的樣本和大量無標簽的樣本,可以實現較高的準確性預測。
4、遷移學習
遷移學習指的是一個預訓練的模型被重新用在另一個學習任務中的學習方法。
源域:已有的知識;目標域:待學習的新知識。
5、強化學習(ReinforcementLearning, RL)
RL也稱為再勵學習、評價學習、增強學習屬于機器學習的范式和方法論之一。
強化學習的任務就是讓智能設備可以像人類一樣,不斷學習、嘗試,然后可以在不同的環境下做出最理想的處理方案,強化屬于連續決策的過程,通過不斷嘗試來發現哪一種是最佳的方式。
案例:AlphaGo利用強化學習算法擊敗了世界冠軍李世石、谷歌YouTube視頻推薦算法等等。