成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

拖拽式機器學習的愛與恨

人工智能 機器學習
拖拽式機器學習是,人們在界面上通過拖拽就是建立機器學習過程。拖拽式機器學習系統一般擁有豐富的組件,包括數據清洗、特征選擇、訓練、預測和效果評估。通過類似于 “搭積木” 的方式,人們將學習組件合成一個完成的機器學習過程。

拖拽式機器學習是我想了很久的問題。

1. 前世今生

拖拽式機器學習是,人們在界面上通過拖拽就是建立機器學習過程。拖拽式機器學習系統一般擁有豐富的組件,包括數據清洗、特征選擇、訓練、預測和效果評估。通過類似于 “搭積木” 的方式,人們將學習組件合成一個完成的機器學習過程。

拖拽式機器學習的雛形很早之前就出現了。Weka 是有新西蘭 Waikato 大學開發的數據挖掘軟件。Weka 除了提供 Java API 之外,還提供 Weka Explorer 圖形界面。人們在 Weka Explorer 界面上通過鼠標操作就能很方便地加載數據、觀察數據特點、訓練、預測和效果評估。除了 Weka 免費軟件之外,商業軟件 Matlab 和 SASS 也提供了圖形界面。我個人覺得,這些軟件將自己定位為軟件,而不是工具包或者系統。但這些軟件確實是最開始有圖形界面的機器學習系統。

隨著最近幾年機器學習成為顯學,“人人都能使用機器學習” 成為不少人的愿景。在他們的想象中,數據準備、不同算法訓練、不同算法的預測和效果評估都封裝在組件中,人們只需要點點鼠標拖拽拖拽組件,就能順利地使用機器學習。秉承這樣的理念,人們開發了不少拖拽式機器學習系統。其中比較有名的就包括微軟的 Azure Machine Learning Studio 和阿里的大數據計算服務 MaxComput。

除了大公司,也有創業公司開發拖拽機器學習系統。下圖是 aetros 基于 theano 建立的深度學習平臺。用戶只要進行拖拽就可以完成一個基本含有ConvNet,fcNet的架構。

2. 愛

拖拽式機器學習將機器學習的使用門檻,從編程降到組件拖拽和配置文件撰寫。機器學習使用難度實現了質的下降。但這個優勢我一直有懷疑。金融公司、外貿公司、銀行,甚至互聯網企業等組織機構中,非技術人員真的有使用機器學習的需求和知識儲備嘛?我表示懷疑。

拖拽式機器學習即使不能實現 “人人都能使用機器學習” 的初心,也能極大地方便工程師進行機器學習任務。工程師在界面上組織資金的機器學習任務,可能對自己的機器學習任務有一個直觀的認識:自己的機器學習任務進行到哪一步了;如果出錯,在哪一步出錯;出錯步驟影響了哪些任務。

比如我們很直觀地可以從上圖看出,如果歸一化出錯,將會影響拆分任務和后續任務。

3. 恨

說了拖拽式機器學習的好,我們再說說拖拽式機器學習的壞。

拖拽式機器學習中,組件加配置替換了編程,成為人們使用機器學習的方式。但是組件加配置,卻不能像編程那樣,完全地處理機器學習使用的復雜度。除了對機器學習算法的理解,機器學習使用最復雜的部分有兩個部分:調特征和調參數。調特征的內容包括:要用哪些特征,要摒棄哪些特征,采用哪些特征預處理方法 (比如 scaling)。調參數則和具體算法有關,比如邏輯斯蒂回歸主要有學習率和正則因子兩個參數。

組件加配置的方式能配置一組特征工程方案和一組參數,但很難快速驗證哪一組特征工程方案和參數效果***。在編程方式中,我們可以用循環的方式,遍歷不同的特征工程方案和參數,得到相應效果指標。但在拖拽式機器學習的組件加配置的方式中,我們只能在文檔中記著不同的特征工程方案和參數,選擇其中一個配置到拖拽式機器學習系統,運行幾個小時得到評估指標,將評估指標記錄到文檔中;再選擇下一組,重復上述步驟直到遍歷完所有特征工程方案和參數。我們程序員的目標是用代碼將不同的任務串起來,實現自動化。但現在拖拽式機器學習粗暴割裂了這個自動化鏈條。

那么直接用組件加配置實現自動化呢?如果要實現這點,拖拽式機器學習要提供條件判斷組件和循環組件,還需要定義一套特征工程方案和參數變化的標準。這好像是在制定一個新的編程語言。這又繞回來。

4. 總結

拖拽式機器學習 “人人都能使用機器學習” 的初心我是不看好的。對于工程師來說,拖拽式機器學習也是充滿了愛恨情仇。

責任編輯:武曉燕 來源: AlgorithmDog
相關推薦

2017-04-18 14:17:09

機器學習算法數據

2017-09-04 09:21:11

機器學習傻瓜指南

2021-09-09 15:45:17

機器學習人工智能Ray

2016-08-31 07:02:51

2018-11-07 09:23:21

服務器分布式機器學習

2022-05-25 09:35:26

機器學習自助式數據庫

2015-06-10 09:47:18

微軟分布式云平臺

2015-07-29 13:57:00

數據庫安全互聯網金融

2017-09-11 15:19:05

CoCoA機器學習分布式

2015-09-21 15:00:38

機器學習

2019-12-03 10:22:50

AWSAI亞馬遜

2020-12-20 17:40:04

機器學習可視化網站算法

2017-10-16 00:34:09

機器學習物聯網算法

2020-05-19 09:11:20

機器學習技術數據

2020-06-02 08:58:12

機器學習技術人工智能

2017-06-12 16:58:30

2024-11-29 12:00:00

Python機器學習

2017-08-25 14:05:01

機器學習算法模型

2020-12-22 07:09:01

Python機器學習多項式回歸

2017-12-05 14:55:56

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日本午夜免费福利视频 | 精品成人av| 日韩成人免费视频 | 一区二区在线看 | 51ⅴ精品国产91久久久久久 | 黄网站免费在线观看 | 91资源在线 | 国产91在线 | 欧美 | 久久精品中文 | 欧美精品福利视频 | 久久9精品| 免费在线观看av片 | 国产美女精品视频 | 国产精品永久免费观看 | 精品亚洲一区二区三区四区五区 | 天天干干 | 欧美一级淫片007 | 狠狠爱综合网 | 国产精品视频免费看 | 国产精品久久久久久久久久 | 四虎在线观看 | 久久久久国产一区二区三区 | 午夜免费电影 | аⅴ资源新版在线天堂 | 国产视频久久 | 国产精品久久久久久福利一牛影视 | 男人的天堂久久 | 精品国产一区二区三区久久久久久 | 亚洲美女在线一区 | 国产精品国产三级国产aⅴ无密码 | 日韩精品在线一区 | 免费精品 | 国产欧美在线 | 自拍偷拍亚洲欧美 | 久久精品亚洲一区 | 欧美精品a∨在线观看不卡 欧美日韩中文字幕在线播放 | 男女在线网站 | 黄色小视频入口 | 日韩av在线一区二区三区 | 九九综合九九 | 国产99精品 |