成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

機器學習的7個步驟

人工智能 機器學習
機器學習是技術愛好者中高度關注的領域。作為人工智能(AI)的一個分支,它基本上是一種算法或模型,可以通過“學習”來改善自身,因此變得越來越精通執行其任務。

 機器學習的應用正在迅速發展,已迅速成為醫學,電子商務,銀行等不同領域不可或缺的一部分。今天,我們將把機器學習分解為一個過程,并了解從開始到實現的所有步驟。它的實際應用。

 

 

 

[[398268]]

 

機器學習的過程將在下面列出的7個步驟中進行細分。為了說明每個步驟的重要性和功能,我們將使用一個簡單模型的示例。該模型將負責區分蘋果和橙子。機器學習能夠勝任復雜任務。但是,為了以簡單的方式解釋該過程,以一個基本的例子來解釋相關的概念。

步驟1:收集數據

為了開發我們的機器學習模型,我們的第一步將是收集可用于區分這兩種成果的相關數據。可以使用不同的參數將水果分類為橙色或蘋果。為簡單起見,我們僅采用模型要利用的2個功能來執行其操作。第一個特征是水果本身的顏色,第二個特征是水果的形狀。使用這些功能,我們希望我們的模型可以準確地區分兩種水果。

 

 

需要一種機制來收集我們選擇的兩個功能的數據。例如,為了收集有關顏色的數據,我們可以使用光譜儀,對于形狀數據,我們可以使用水果的圖片,以便可以將它們視為2D圖形。為了收集數據,我們將嘗試獲取盡可能多的不同類型的蘋果和橙子,以便為我們的功能創建各種數據集。為此,我們可能會嘗試在市場上尋找可能來自世界不同地區的橙子和蘋果。

收集數據的步驟是機器學習過程的基礎。選擇錯誤的功能或專注于數據集的有限類型條目等錯誤可能會使模型完全失效。這就是為什么當收集數據時必須考慮必要的原因的原因,因為在此階段所犯的錯誤只會隨著我們進行到后續階段而擴大。

步驟2:準備該數據

一旦我們收集了這兩個功能的數據,下一步就是準備數據以供進一步使用。此階段的重點是識別并最小化我們針對這兩個功能的數據集中的任何潛在偏差。首先,我們將隨機化這兩個水果的數據順序。這是因為我們不希望訂單與模型的選擇有任何關系。此外,我們將檢查我們的數據集是否偏向某個特定水果。這又將有助于識別和糾正潛在的偏見,因為這將意味著該模型將能夠正確地識別一種水果,但可能會與另一種水果抗爭。

數據準備的另一個主要組成部分是將數據集分為兩部分。較大的部分(約80%)將用于訓練模型,而較小的部分(約20%)用于評估。這很重要,因為在培訓和評估中使用相同的數據集將無法公平評估模型在實際場景中的性能。除了拆分數據外,還需要采取其他措施來完善數據集。這可能包括刪除重復的條目,丟棄不正確的讀數等。

為模型準備充分的數據可以提高其效率。它可以幫助減少模型的盲點,從而提高預測的準確性。因此,有意義的是審議和檢查你們的數據集,以便可以對其進行微調以產生更好和有意義的結果。

步驟3:選擇模型

一旦完成了以數據為中心的步驟,選擇模型類型就是我們的下一個行動方案。由數據科學家開發的各種現有模型可以用于不同的目的。這些模型在設計時考慮了不同的目標。例如,某些模型更適合處理文本,而另一種模型可能更適合處理圖像。關于我們的模型,簡單的線性回歸模型適用于區分水果。在這種情況下,水果的類型將是我們的因變量,而水果的顏色和水果的形狀將是兩個預測變量或自變量。

 

 

 

 

在我們的示例中,模型選擇非常簡單。在更復雜的情況下,我們需要做出與預期結果相匹配的選擇。可以在3大類中探索機器學習模型的選項。第一類是監督學習模型。在這樣的模型中,結果是已知的,因此我們不斷改進模型本身,直到我們的輸出達到所需的精度水平。為我們的水果模型選擇的線性回歸模型是監督學習的一個例子。如果結果未知,我們需要分類,則使用第二類,即無監督學習。無監督學習的示例包括K-means和Apriori算法。第三類是強化學習。它著重于學習在反復試驗的基礎上做出更好的決策。它們通常在商業環境中使用。馬爾可夫的決策過程就是一個例子。

步驟4:培訓

機器學習過程的核心是模型的訓練。大量的“學習”在此階段完成。在這里,我們使用分配給訓練的數據集的一部分來教我們的模型來區分這兩種成果。如果我們用數學術語查看模型,則輸入(即我們的2個要素)將具有系數。這些系數稱為特征權重。也將涉及一個常數或y截距。這稱為模型的偏差。確定其值的過程是反復試驗的。最初,我們為它們選擇隨機值并提供輸入。將獲得的輸出與實際輸出進行比較,并通過嘗試不同的權重和偏差值將差異最小化。

培訓需要耐心和實驗。知道將在其中實施模型的領域的知識也很有用。例如,如果將機器學習模型用于識別保險公司的高風險客戶,則由于可以在迭代過程中進行更多有根據的猜測,因此有關保險行業運作方式的知識將加快培訓過程。如果該模型開始成功地發揮作用,那么培訓將證明是非常有益的。這相當于孩子學習騎自行車的時間。最初,他們可能會摔倒多次,但過了一會兒,他們會更好地掌握過程,并能夠在騎自行車時對不同情況做出更好的反應。

步驟5:評估

在訓練好模型之后,需要對其進行測試,以查看其在現實環境中能否正常運行。這就是為什么將用于評估而創建的數據集的一部分用于檢查模型的熟練程度的原因。這會將模型置于一個場景中,在該場景中遇到的情況并非其訓練的一部分。在我們的案例中,這可能意味著嘗試確定該模型中全新的蘋果或橙子的類型。但是,通過訓練,該模型應具有足夠的能力來推斷信息并確定該水果是蘋果還是橙子。

在商業應用中,評估變得非常重要。評估使數據科學家可以檢查他們是否設定了要實現的目標。如果結果不令人滿意,則需要重新檢查先前的步驟,以便找出并找出模型性能不佳的根本原因。如果評估未正確完成,則該模型可能無法出色地實現其所需的商業目的。這可能意味著設計和銷售模型的公司可能會失去與客戶的良好信譽。這也可能會損害公司的聲譽,因為在信任公司關于機器學習模型的敏銳度時,未來的客戶可能會猶豫不決。因此,評估模型對于避免上述不良影響至關重要。

步驟6:超參數調整

如果評估成功,則進入超參數調整步驟。此步驟試圖改善在評估步驟中獲得的積極結果。對于我們的示例,我們將看看是否可以使我們的模型在識別蘋果和橙子方面更加出色。我們可以采用不同的方法來改進模型。其中之一是重新訓練步驟,并使用訓練數據集的多次掃描來訓練模型。這可能會導致更高的準確性,因為訓練的持續時間越長,暴露越多,并改善了模型的質量。解決該問題的另一種方法是優化提供給模型的初始值。隨機初始值通常會因反復試驗逐漸完善而產生較差的結果。然而,如果我們可以提出更好的初始值,或者使用分布而不是值來啟動模型,那么我們的結果可能會更好。我們還可以使用其他參數來完善模型,但是該過程比邏輯過程更直觀,因此沒有確定的方法。

自然地,出現一個問題,當模型實現其目標時,為什么我們首先需要進行超參數調整?這可以通過查看基于機器學習的服務提供商的競爭性質來回答。客戶尋求機器學習模型來解決各自的問題時,可以從多個選項中進行選擇。但是,它們更有可能被產生最準確結果的方法所吸引。這就是為什么要確保機器學習模型的商業成功,超參數調整是必不可少的步驟。

步驟7:預測

機器學習過程的最后一步是預測。在此階段,我們認為模型已準備就緒,可以用于實際應用。我們的水果模型現在應該能夠回答給定的水果是蘋果還是橙子的問題。該模型不受人為干擾,并根據其數據集和訓練得出自己的結論。該模型所面臨的挑戰仍然是在不同的相關場景下其性能是否能勝過或至少與人類判斷相匹配。

預測步驟是最終用戶在各自行業中使用機器學習模型時看到的內容。這一步凸顯了為什么許多人認為機器學習是各個行業的未來。復雜但執行良好的機器學習模型可以改善其各自所有者的決策過程。做出決定時,人類只能處理一定數量的數據和相關因素。另一方面,機器學習模型可以處理和鏈接大量數據。這些鏈接使模型可以獲得獨特的見解,如果采用通常的手動方法,則可能無法發現這些見解。結果,寶貴的人力資源從處理信息然后做出決定的負擔中解放出來。

結論

借助機器學習,我們可以確定如何區分蘋果和橘子,盡管聽起來可能并不令人印象深刻,但是對于大多數機器學習模型而言,我們采取的步驟都是相同的。隨著機器學習的發展和AI的普遍發展,該標準將來可能會改變,但是下次需要進行ML項目時,請記住這些標準:

  1. 收集數據
  2. 準備該數據
  3. 選擇模型
  4. 訓練
  5. 評估
  6. 超參數調整
  7. 預言

 

責任編輯:華軒 來源: 小白學視覺
相關推薦

2020-11-19 10:04:45

人工智能

2017-09-17 23:14:41

機器學習人工智能設計

2017-04-20 12:51:28

2020-12-17 07:57:18

機器學習算法

2024-09-30 05:43:44

2020-02-21 11:23:11

機器學習技術人生第一份工作

2012-08-15 10:20:53

云計算大數據IT

2018-10-25 14:14:52

云計算機器學習數據分析

2018-04-08 22:32:02

2019-06-27 06:32:09

物聯網安全物聯網IOT

2021-05-18 09:34:58

JavaScript前端JavaScript安

2020-07-24 10:52:45

人工智能

2024-11-29 12:00:00

Python機器學習

2019-04-23 10:25:48

云架構云計算

2019-10-14 22:37:57

云遷移云端數據

2019-10-15 15:26:34

云計算數據中心混合云

2019-04-04 10:39:23

云平臺云架構云計算

2023-03-19 17:24:43

2014-12-23 14:57:42

開源項目機器學習

2020-11-27 11:07:29

人工智能
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 91久久久久久久久久久 | 国产99久久久国产精品 | 久久大香 | 五月婷婷丁香 | 一级做a毛片 | 日日天天 | 国产精品久久久一区二区三区 | 国产专区免费 | 华人黄网站大全 | 嫩草视频入口 | 高清一区二区三区 | 五月婷婷视频 | 一级欧美 | 国产极品车模吞精高潮呻吟 | 久久成人精品视频 | 你懂的国产 | 国产欧美视频一区二区 | 欧美黑人狂野猛交老妇 | 精品视频一区二区 | 久久久青草婷婷精品综合日韩 | 国产一区2区 | 一级黄色录像毛片 | av在线一区二区 | 天天干天天操天天爽 | 亚洲精品一区二区二区 | 在线播放中文 | 国产一区 日韩 | 国产专区视频 | 日韩一区二区在线免费观看 | 欧美日韩综合 | 亚洲激情一区二区三区 | 欧美久久精品 | 免费在线看黄视频 | 国产精品久久久久久吹潮日韩动画 | 日本欧美在线视频 | 夜夜夜久久久 | 午夜男人天堂 | 狠狠av| 国产精彩视频 | 黄色av免费 | 在线视频 中文字幕 |