成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

機器學習的本質就是數理統計?答案可能沒這么簡單

人工智能 機器學習
機器學習和統計建模是預測建模領域的兩個不同分支。這兩者之間的差距在過去的 10 年中正在不斷縮小,而且它們之間存在許多相互學習和借鑒的地方。未來,它們之間的聯系將會更加緊密。

可能許多剛剛接觸 AI 的新人們都產生過類似這樣的疑問:機器學習和數理統計,究竟有什么本質區別?不都是玩數據的么。

如果從傳統意義上的數據分析師的觀點來說,這個問題的答案很簡單,無非是下面這兩點:

機器學習本質上是一種算法,這種算法由數據分析習得,而且不依賴于規則導向的程序設計;

統計建模則是以數據為基礎,利用數學方程式來探究變量變化規律的一套規范化流程。

總結來說,機器學習的關鍵詞是預測、監督學習和非監督學習等。而數理統計是關于抽樣、統計和假設檢驗的科學。

這個答案看起來似乎無懈可擊,但其實機器學習和數理統計之間的關系遠沒有這么簡單。

相同點

按照數理統計學的大師級人物 Larry Wasserman 的說法,實際上“這兩門學科(機器學習和數理統計)關心的是同一件事,即我們能從數據中學到什么?”

根據他在個人博客中的總結,以下這些在數理統計和機器學習中的常見術語實際上具有相同的含義。

除此之外,另一位學術界的專家,斯坦福大學著名統計學和機器學習大師 Robert Tibshirani 也一直將機器學習稱為“美化過的統計學”(glorified statistics)。

實際上,發展到今天,機器學習和統計學技術都已經是模式識別、知識發現和數據挖掘等領域的常用技術。雖然根據 SAS 于 2014 年發布的統計結果(如下圖),機器學習和數理統計之間的關系是相互獨立的,但實際上在近兩年他們之間的界限已經已經越來越模糊,甚至有相互融合的趨勢。

這樣看來,機器學習和數理統計的確具有相同的目標:從數據中學習。他們的核心都是探討如何從數據中提取人們需要的信息或規律。但是,這兩門學科在研究方法上卻有本質的區別。

不同點

首先,機器學習是一個比較新的領域,是計算機科學與人工智能的一個分支,它更多地關心如何構建一個系統去分析數據,而不是針對特定的程序化指令。

而統計建模則完全是數學的分支。雖然現在廉價的計算能力和海量的可用數據的支持下,數據科學家們已經可以通過數據分析來訓練計算機的學習能力,即機器學習。但統計建模相對機器學習而言卻擁有悠久得多的歷史,實際上它早在計算機被發明之前就存在了。

另一方面,機器學習更多地強調優化和性能,而統計學則更注重推導。

關于這一點,我們或許可以從下面這兩段分別來自統計學家和機器學習研究人員針對同一數據模型的描述上得到更深的體會。

機器學習研究人員:在給定 a、b 和 c 的前提下,該模型準確預測出結果 Y 的概率達到了 85%。

統計學家:在給定 a、b 和 c 的前提下,該模型準確預測出結果 Y 的概率達到了 85%;而且我有九成的把握你也會得到與此相同的結論。

第三,機器學習并不需要對有關變量之間的潛在關系提出先驗假設。研究人員只需要將所有的可用數據導入模型,等待算法的分析并輸出其中的潛在規律,然后將這一規律應用于新數據進行預測就可以了。對于研究人員來說,機器學習就像一個黑盒子,你只需要會用,但并不清楚其中的具體實現。機器學習通常應用于高維度的數據集,你的可用數據越多,預測通常就越準確。

相比之下,統計學則必須了解數據的收集方式,估計量(包括p值和無偏估計)的統計特征,被研究人群的潛在分布規律,以及多次試驗的期望參數的類型。研究人員需要非常清楚自己在做什么,并提出具有預測能力的參數。而且統計建模通常用于較低維度的數據集。

結論

總結來說,我們可以認為機器學習和統計建模是預測建模領域的兩個不同分支。這兩者之間的差距在過去的 10 年中正在不斷縮小,而且它們之間存在許多相互學習和借鑒的地方。未來,它們之間的聯系將會更加緊密。

對開發者而言,充分了解機器學習和統計建模之間的差異和聯系,將有助于他們擴大自己的知識面,甚至將專業領域之外的分析方法引入研發流程之中。這一點也正是數據科學(data science)本身的核心理念,即彌合機器學習和統計建模之間的區別,讓二者逐漸趨于歸一化。***需要肯定的是,這兩門以數據驅動的學科之間的協作和交流越頻繁,我們的生活就會變得越好。

責任編輯:武曉燕 來源: 36大數據
相關推薦

2017-11-28 15:29:04

iPhone X網頁適配

2021-05-24 10:50:10

Git命令Linux

2020-06-16 10:57:20

搭建

2024-08-28 08:42:21

API接口限流

2016-07-22 15:12:12

Win10技巧重裝

2021-03-15 11:35:28

人工智能機器學習

2021-02-26 10:21:35

比特幣投資金融

2020-04-20 10:47:57

Redis數據開發

2023-08-26 21:42:08

零拷貝I/O操作

2021-12-27 07:31:37

JavaNeo4J數據庫

2023-07-27 08:26:36

零拷貝I/O操作

2019-05-13 08:24:58

數據庫MySQLInnoDB

2021-10-28 19:23:27

界面嵌入式 UI

2024-02-27 08:14:51

Nginx跨域服務

2022-05-22 07:32:36

RPython分析工具

2013-06-09 10:34:24

華為網絡規劃企業ICT

2020-07-27 07:00:00

超文本鏈接Word文檔網絡

2024-09-09 11:35:35

2020-06-17 11:42:50

異常解析器Spring MVC

2017-11-06 16:30:33

開源
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 天天色图 | 国产精品免费小视频 | 中文字幕欧美日韩 | www.日韩系列| 一区二区免费视频 | 国产成人一区二 | 亚洲综合在线播放 | 99精品国产一区二区三区 | 欧美激情视频一区二区三区在线播放 | 99福利视频 | 精品久久伊人 | 99久久婷婷国产综合精品首页 | 久久一区二区三区四区五区 | 久久久成人网 | av激情在线| 日本三级播放 | 日韩欧美一区二区三区在线播放 | 911网站大全在线观看 | www.日韩在线 | 欧美日韩中文字幕 | 久久精品91久久久久久再现 | 欧美一区二区大片 | 一级片在线免费播放 | 欧美韩一区二区三区 | 国产精品久久av | 色.com| 久久午夜视频 | 激情视频一区 | 黄色一级片视频 | 国产三区在线观看视频 | 国产99久久久国产精品下药 | av网站在线免费观看 | 国产在线播 | 性色在线 | 欧美lesbianxxxxhd视频社区 | www久久久| 亚洲 欧美 另类 日韩 | 成人深夜福利 | 久久久久一区二区三区 | 国产成人麻豆免费观看 | 成人福利视频网站 |