【機器學習】圖解線性回歸 原創
線性回歸可謂是機器學習界的hello world,在現實中也有廣泛應用,今天我們以圖表為主,用可視化方法重新審視下這個模型。
先來個整體視角:
再逐步分解開來:
???????????? ???????????? ????????????????????
如果自變量只有一個,我們稱為簡單線性回歸,雖然簡單,但很強大,能用來發現數據中潛在的變化趨勢。
?????? ???????? ???? ?????????
線性回歸的目標是擬合一條直線,這條直線最能體現自變量和因變量之間的線性依賴關系。
?????? ???? ???? ???????????? ?????? ???????? ???????
那如何找到這個最佳的擬合直線呢?讓因變量的觀測值和模型的預測值之間的誤差最小。
?????? ???? ???? ???????????? ???? ?????????????????????????????
在機器學習中,我們通常使用損失函數來找到最優的參數。
在線性回歸中,損失函數就是均方誤差,參數就是斜率A和截距B。
為了找到我們的最優解,我們使用了梯度下降法。
這是優化算法之一,用于優化成本函數。
為了獲得最優解,我們需要減少所有數據點的均方誤差(MSE)。
通過迭代,我們逐漸接近最優解。
????????????????????
“訓練完成后,如何才能衡量模型的性能呢?在訓練集上表現的好,不見得在未見過的數據上表現也好,我們希望模型具有較強的泛化能力,所以我們需要在測試集上評估模型的性能,來避免模型過擬合?!边@句話描述準確嗎?
?????????????????????? ???? ?????????? ????
線性回歸模型也是基于一些假設的,比如線性關系假設(Linearity),正態性假設(Normality of errors),獨立性假設(Independence)等等。
如果假設與實際不符就會導致模型不準確,例如,如果自變量和因變量之間是非線性關系,那么線性回歸模型可能無法很好地擬合數據。
這就需要使用通用線性模型或者神經網絡了。
本文轉載自公眾號人工智能大講堂
原文鏈接:??https://mp.weixin.qq.com/s/OySYGcNUnT8oAFwI9xSyyQ???
?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
贊
收藏
回復
分享
微博
QQ
微信
舉報

回復
相關推薦