人工智能,機器學習,深度學習與數據科學
如果您剛開始接觸人工智能或數據科學,那么很有可能一遍又一遍地碰到這四個術語。如果您從未完全理解這四個術語的含義,那么本文適合您。在本文中,您將發現它們的基本含義,并了解它們之間的區別。我將盡一切努力使事情變得簡單,并且當您繼續閱讀本文時,您將發現這些術語的真正含義。事不宜遲,讓我們開始第一個。
人工智能
與人類或動物中發現的自然智能相比,人工智能或人工智能是指在機器中創造智能行為。實現人工智能有兩種主要方法,一種是使用經典編程,在其中您可以對所有編程邏輯進行編碼,第二種是使用機器學習。當前,機器學習是最成功的方法,或者更具體地說,可以使用深度學習來實現此目標,正如我們將在本文中進一步看到的那樣。首先讓我們看看什么是機器學習。
機器學習
機器學習(ml)是人工智能的一部分。這意味著,只要您編寫機器學習代碼,您也是編碼人工智能。機器學習基本上是程序計算機的不同方式,尤其是與傳統編程相比。這就是為什么機器學習有時被稱為“軟件2.0”。
通常,如果您正在編寫軟件,則可以定義所有規則和所有編程邏輯,并且可以通過多種方式對計算機進行顯式編程。但是,在機器學習中,您并沒有明確地對計算機進行編程。相反,您要做的是創建一個機器學習模型,并使用適當的數據和目標來訓練該模型。在訓練機器學習模型時,您的模型將學習近似所需的結果。基本上,在機器學習中,您是在編寫軟件,而不是對計算機進行顯式編程。
機器學習中的大多數編程都是由您提供的數據執行的。相同的機器學習模型(取決于所訓練的數據)可以學會識別皮膚癌,也可以學會區分貓和狗。
首次創建機器學習模型時,首先要進行幾乎是隨機的預測,并且每次訓練模型時,它都會學習到對其預測的錯誤要少一些,直到達到最佳性能為止。盡管它始于隨機預測,但在許多情況下,機器學習模型可以實現超人水平的性能。從根本上講,這意味著它們在執行給定的特定任務方面可以等同于或優于人類。
當前,最成功的機器學習方法稱為深度學習。
深度學習
深度學習(DL)是利用深度神經網絡的機器學習的子集。
順便說一下,如果您不知道什么是神經網絡,就不必為了掌握機器學習與深度學習之間的區別而全面了解所有內容。如果您有興趣了解有關神經網絡的更多信息,我將在它們上發表更全面的文章。這些文章的目的是使諸如人工智能和機器學習之類的看似復雜的話題一次變得易于理解。
在進一步介紹之前,讓我們快速看一下神經網絡是什么。關于神經網絡,您應該了解的一件事是它們是在稱為神經網絡層的層中創建的。第一層稱為輸入層,最后一層稱為輸出層。中間的層稱為隱藏層。如果神經網絡的總層數超過三層,則稱為深度神經網絡。因此,如果您的神經網絡只有兩層,那么您實際上是在進行機器學習。但是,當您擁有3層或更多層時,您還將在機器學習之上執行深度學習。
神經網絡的基本方面之一是滿足所謂的通用近似定理。這基本上意味著,只要有足夠的大小和體系結構,您就可以始終使用神經網絡近似任何函數。這意味著,您無需創建具有所有規則和編程邏輯的軟件,而是創建了一個神經網絡,該神經網絡可以從提供的數據中學習以執行分配的任務。例如,您可以給貓和狗的神經網絡圖像,然后讓神經網絡對圖像進行分類。當您這樣做時,網絡將在圖像像素和結果分類之間創建映射。最初,網絡將從隨機猜測開始,但是隨著訓練更多數據,它將最終學會根據貓和狗的像素值來區分它們。
順便說一下,機器學習還可以使用神經網絡以外的方法。但是,由于性能優越,大多數(如果不是全部)都已被深度學習模型取代。甚至與機器學習相比,深度學習也刪除了越來越多的軟件人工編寫部分。這是因為,即使您熟悉機器學習,即使在機器學習中,人們仍然需要做出一些重大決策,例如功能選擇。
數據科學
數據科學本質上是關于使用統計方法和機器學習方法來理解數據。如果您是一名數據科學家,則可能不會想到新的神經網絡體系結構,但是您可以使用它們來分析所擁有的數據,以提取有意義的見解。當然,執行此分析還需要領域知識,以確保您不僅在計算隨機統計信息,而且還從實際數據中實際提取有意義且可操作的見解。
結論
如您所見,所有這四個都是相互連接的,但是具有使它們與眾不同的獨特功能。從AI到ML到DL的道路更像是創建人工智能最成功方法的演變。另一方面,數據科學是在現實生活中使用或實現它們的一種方法,主要用于分析目的。
我希望本文有助于闡明這些術語之間的主要區別。如果您對某些部分感到困惑,請隨時在評論部分中詢問。我會盡快給您答復。如果您的問題需要更深入的解釋,我可以在另一篇文章中進行解釋。
原文鏈接:
https://medium.com/swlh/artificial-intelligence-vs-machine-learning-vs-deep-learning-vs-data-science-5d01381554fd