成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

機器學習項目中特征工程的5個優秀實踐

人工智能 機器學習
當處理一個新的機器學習問題時,沒有辦法從一開始就知道解決方案是什么,除非各種不同的實驗被嘗試和測試。

 隨著時間的推移,我們通過各種不同的技術和方法,確認在機器學習項目中什么是有效的,什么是無效的。以下總結了5個步驟希望對你有幫助。

[[398566]]

生成簡單的特征

當第一次開始建模過程時,嘗試生成盡可能多的簡單特征,嘗試生成不需要花很長時間編碼的特征。例如,與其訓練Word2vec模型,不如先實現一個簡單的詞袋,它用最少的代碼生成數千個特性。一開始就想使用任何可測量為特征的東西,因為沒有明確的方法可以提前知道一個或多個特征組合是否對預測有用。

id也可以是特征(如果需要的話)

將ID添加為特性集的一部分可能聽起來很愚蠢,因為唯一的ID可能不會對模型的泛化做出太多貢獻。然而,包含id使從業者能夠創建一個在一般情況下具有一種行為而在其他情況下具有不同行為的模型。

例如,假設我們想根據描述某個位置的一些特征對某個位置進行預測。通過將位置的id作為特征集的一部分,我們將能夠為一個一般位置添加更多的訓練示例,并訓練模型在其他特定位置表現不同。

減少基數(如果可能的話)

作為一般經驗法則,如果我們有一些具有許多不同獨特值的分類特征(比如超過12個),我們應該只在希望模型根據該功能做出不同行為時才使用該功能。例如,在美國有50個州,因此你可以考慮使用一個稱為“州”的特征,如果你希望模型的期望行為在加利福尼亞是一種方式,在佛羅里達是另一種方式。

另一方面,如果我們不需要一個依賴于“州”特性的行為不同的模型,那么我們最好減少“州”特性的基數。

注意計數的問題

在某些情況下,隨著時間的推移,總數大致保持在相同的范圍內——如果文檔長度沒有隨著時間的推移而增加或減少,例如詞袋(BoW)就是這種情況。

計數可能導致問題的實例。 例如,在一個場景中,我們具有一個特哼,可以統計用戶自訂閱服務以來進行的呼叫次數。 如果提供訂閱服務的公司已經存在很長時間了,那么單純的統計會看到他們撥打了很多電話。

隨著數據的增長,今天不那么頻繁的值在將來可能會變得越來越頻繁。所以處理這類的問題需要增加時間窗口

進行特征選擇

以下是只在絕對必要時才執行特性選擇的一些理由;

模型必須是可解釋的,所以最好保留最重要的特性

有嚴格的硬件要求

沒有太多的時間來執行大量的實驗和/或為生產環境重建模式

在多個模型訓練之間會有預期的分布變化

責任編輯:華軒 來源: 今日頭條
相關推薦

2021-03-01 19:24:13

Kubernetes備份容器

2022-10-09 08:08:02

人工智能機器學習平臺

2022-06-28 05:54:10

機器身份網絡攻擊網絡安全

2021-04-01 22:19:54

機器學習模型數據

2024-06-13 09:12:38

2020-09-27 18:29:03

代碼機器學習數據科學

2020-09-27 17:17:26

機器學習技術人工智能

2024-11-21 17:22:40

2024-10-08 15:09:17

2024-10-08 10:16:22

2024-10-28 15:52:38

機器學習特征工程數據集

2024-10-28 00:00:10

機器學習模型程度

2020-07-24 00:41:18

物聯網項目物聯網IOT

2020-04-23 10:35:10

Docker鏡像實踐

2018-10-05 23:26:00

機器學習算法數據

2020-09-29 07:19:54

InnoDBMySQL存儲引擎

2023-04-10 11:25:29

工程交流DX

2020-08-06 10:29:39

機器學習人工智能AI

2019-11-22 15:27:07

技術漏洞管理網絡

2019-11-24 23:39:01

漏洞管理漏洞風險
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 五月天天丁香婷婷在线中 | 天天色天天射天天干 | 久久亚洲国产 | 精品国产乱码久久久久久久久 | 一区二区三区视频在线 | 99久久久久久 | 中文字幕av一区 | 亚洲成人一区二区 | 中文字幕av一区 | 午夜资源| 男女免费观看在线爽爽爽视频 | 黄网站在线观看 | 日本久久网 | 国产欧美在线观看 | 激情欧美日韩一区二区 | 日韩欧美大片 | 黄网站在线观看 | 免费国产一区二区视频 | 欧美日韩亚洲系列 | 久久久久国产一区二区三区 | 国产欧美日韩在线一区 | 一级美国黄色片 | 久久久无码精品亚洲日韩按摩 | 亚洲国产精品久久久久婷婷老年 | 最新日韩在线视频 | 中文字幕在线欧美 | 国产日韩精品在线 | 国产午夜精品一区二区三区嫩草 | 久久伦理电影 | 欧美精品一区在线 | 欧美成视频 | 亚洲精品一区国产精品 | 一区二区三区在线免费观看 | 欧美激情va永久在线播放 | 久久亚洲欧美日韩精品专区 | 99综合在线| 久久综合欧美 | 久久久精彩视频 | 成人国产精品久久久 | 亚洲交性 | 狠狠躁躁夜夜躁波多野结依 |