想真正理解深度學習?需要知道這三件事
對于喜歡數(shù)據(jù)的專業(yè)人士來說,潛水堪稱完美運動,因為收集數(shù)據(jù)是潛水的重要組成部分。慢慢地下降到深海中,你可以想象自己首次浸入未被開發(fā)的數(shù)據(jù)湖中。在成千上萬的水下生物中,你可以尋找最大的魚、最艷麗的珊瑚,這就像在龐大的數(shù)據(jù)集中尋找隱藏的洞見。
但是深度并非只與深海潛水有關。作為重要的概念,它在分析和機器智能領域也變得越來越重要。人工神經(jīng)網(wǎng)絡,即模仿人類大腦建立的、處理單元(人工神經(jīng)元)相互關聯(lián)的計算機模型,已經(jīng)出現(xiàn)數(shù)十年了。早期,這些神經(jīng)網(wǎng)絡通常有1個或2個隱藏神經(jīng)元層組成,現(xiàn)在已經(jīng)從淺層結構進化到深層結構,后者又被稱為深度學習。這種轉變依賴于大規(guī)模建造大型和并行模型的成本不斷下降,以及訓練深度模型所需大型多維數(shù)據(jù)集的日益增多。
但要想真正理解深度學習,你需要首先了解這三件事:
1.深度學習是機器學習分支
從本質上看,深度學習隸屬于機器學習范疇。但是標準的機器學習通常需要手工從數(shù)據(jù)中提煉模式,耗時費力。而深度學習模型擅長于自動捕獲隱藏于大數(shù)據(jù)中的復雜結構模式,在對圖像、視頻、音頻以及文本數(shù)據(jù)進行分析時,這種能力擁有巨大優(yōu)勢,而依靠手工從數(shù)據(jù)中提取模式很快將達到極限。
2.深度學習不只是技術動力室
到目前為止,大量學術機構和科技公司都在研究深度學習,媒體對深度學習相關成果的報道也日益增多,這都大大促進了深度學習的普及。現(xiàn)在,越來越多的公司正進入這個領域參加探索。有許多報道稱,數(shù)據(jù)科學家正將深度學習方法應用到更廣泛的行業(yè)分析領域,比如客戶流失預測、金融欺詐調查、產(chǎn)品推薦等,傳統(tǒng)企業(yè)對深度學習的興趣日益增加。
3.深度學習的利弊權衡
企業(yè)需要了解,進入深度分析領域需要權衡利弊。盡管深度網(wǎng)絡構架的精度可媲美甚至超越現(xiàn)有分析方式,但由此產(chǎn)生的模型通常是不透明的“黑盒子”,需要對其進行精調。深度學習往往需要預先架構投資,以便能處理模型的復雜性。大型神經(jīng)網(wǎng)絡往往需要數(shù)小時乃至數(shù)天的訓練,如果沒有事先考慮或準備,這可能對數(shù)據(jù)科學團隊造成巨大影響。
為分析挑戰(zhàn)選擇正確的模型不僅僅是最大化模型精度的問題,它還受限于輸入數(shù)據(jù)集。當涉及到傳統(tǒng)分析時,模型的可解釋性和簡單性往往比精度要求更高。而要處理大數(shù)據(jù)集,建模方法的性能和可擴展性都需要被考慮到。依賴非操作性模型協(xié)助發(fā)現(xiàn)洞見的要求,與全面可操作性的建模構架完全不同。