吳恩達新演講：AI正改變行業格局，公司的壁壘非算法而是數據

作者：佚名 2017-09-25 15:54:11

人工智能算法

過去幾年里，機器學習經歷了迅速的發展，越來越擅長學習這類A到B的映射，創造了大規模的經濟價值。同時，AI的進步也體現在監督學習的輸出不再限于0或1的數字。

[[204846]]

1.人工智能的應用和價值

吳恩達依然以AI是新電力開場，并舉了一個例子。

AI技術的經濟貢獻多數來自監督學習，也就是學習從A到B，從輸入到輸出的映射。比如說，輸入一張照片，讓機器學會判斷這張照片是不是你，輸出0或1。

***錢的AI應用是在線廣告。在這個例子中，輸入是廣告和用戶信息，輸出是用戶會不會點擊這個廣告(還是0或1)。

監督學習還可以應用在消費金融領域，輸入貸款申請信息，輸出用戶是否會還款。

再次舉例：語音識別的任務，也是一種端到端的學習。擁有足夠的數據，語音識別就能達到很好的效果。亞馬遜Alexa、蘋果Siri、百度DuerOS等等依靠AI算法和數據來達到良好的效果。

監督學習的缺點是它需要大量的標注數據，這影響了它的普及。

為什么神經網絡已經存在了這么多年，AI卻近年來才開始快速發展?

[[204847]]

上圖中，橫軸是數據量，縱軸是算法的性能。

隨著數據量的增加，傳統機器學習算法的性能并沒有明顯提升，而神經網絡的性能，會有比較明顯的提升，神經網絡越大，性能的提升就越明顯。

為了達到***的性能，你需要：大量數據以及大型的神經網絡。

2.機器學習的趨勢以及算法如何創造價值

目前，創造最多價值的還是監督學習。除此之外，遷移學習技術正在創造更多的經濟價值。比如在醫學影像診斷上，遷移學習技術利用數據創造了不錯的識別效果。

非監督學習，在自然語言處理上更具商業價值。

強化學習也很有意思，我認為，強化學習的火爆和商業化有點不成比例。

強化學習對數據的需求程度，甚至比監督學習更嚴重，特別是強化學習算法很難獲取到足夠的數據。又舉例子：AI+游戲中，強化學習表現很好，這是因為在電子游戲中，算法可以重復玩***次，獲取***的數據。

在機器人領域，使用強化學習來建立模擬器，相當于能讓強化學習agent在其中模擬無人車、人形機器人，重復***次游戲。在游戲和機器人領域之外，強化學習應用到商業中還有很長的路要走。

現在，監督學習、遷移學習、非監督學習、強化學習這四類算法所創造的經濟價值是遞減的。

另一個值得關注的是，機器學習依靠結構化數據，比非結構化數據創造了更多的經濟機制。

舉個結構化數據的例子，比如說你的數據庫記錄了用戶的交易情況，誰什么時候買了什么東西，誰什么時間給誰發了信息，這就是結構化數據。而像圖像、音頻、自然語言等等，就是非結構化數據。

在前面談到的幾類學習算法中，單是監督學習就已經為公司、創業者創造了大量的經濟價值和機會。

3.如何做人工智能產品

AI的崛起正改變著公司的競爭格局。公司的壁壘不再是算法，而是數據。

想要打造一個AI產品，如圖：

[[204848]]

讓算法利用足夠的數據，使得產品運行起來，然后通過產品來獲取用戶，用戶在提供更多的數據……周而復始。

又舉例：搜索公司。搜索公司有著大量的數據，顯示如果用戶搜了這個詞，就會傾向于點哪個鏈接。

我很清楚該如何構建搜索算法，但是如果沒有大型搜索公司那樣的數據集，簡直難以想象小團隊，如何構建一個同樣優秀的搜索引擎。這些數據資產構建了兼顧的壁壘。

工程師們還需要明白：AI的影響，比監督學習廣泛得太多。日常的AI包括好幾類工具：比如機器學習、圖模型、規劃算法、知識圖譜。

人們的關注點集中在機器學習和深度學習，很大程度上是因為其他工具的發展速度很緩慢。

計算機，或者說算法是怎樣知道該做什么的呢?它依靠兩個來源，一是數據，二是人工。

比如說在線廣告，我們有那么多的數據，不需要太多的人工，深度學習算法就能學得很好。但是在醫療領域，數據量就很少，可能只有幾百個樣例，這時就需要大量的人工，比如說用圖模型來引入人類知識。

很多工程師想要進入AI領域，很多人會去上在線課程，但是有一個學習途徑被嚴重忽視了：讀論文，重現其中的研究。

當你讀了足夠多的論文，實踐了足夠多的算法，它們都會轉化為你的知識和想法。

轉型機器學習工程師，我推薦的是：學習諸如deeplearning.ai的機器學習課程來打好基礎，然后讀論文并復現其中的結果，另外，還要通過參加各種的人工智能活動，來鞏固自己的基礎。

4.如何打造人工智能公司

從大約25年前開始，我們見證了互聯網時代的崛起。

我從那個時代學到了：商場 + 網站 ≠ 互聯網公司

我認識一家大型零售公司的CIO，有一次CEO對他說：我們在網上賣東西，亞馬遜也在網上賣東西，我們是一樣的。

這是不對的。

互聯網公司是如何定義的呢?不是看你有沒有網站，而是看做不做A/B測試、能不能快速迭代、是否由工程師和產品經理來做決策。這才是互聯網公司的精髓。

在AI時代，我們同樣要明確：

傳統科技公司 + 機器學習/神經網絡 ≠ AI公司

公司里有幾個人在用神經網絡，并不能讓你們成為一家AI公司，要有更深層的基礎。

AI公司傾向于策略性地獲取數據。

我曾經這么做過：在一個地區發布產品，為了在另一個地區發布產品而獲取數據，這個產品又是為了在下一個地區發布產品來獲取數據用的，如此循環。而所有產品加起來，都是為了獲取數據驅動一個更大的目標。

像Google和百度這樣的大型AI公司，都有著非常復雜的策略，為幾年后做了充分的準備。

第二點是比較戰術性的，你現在就可以這么做：AI公司通常有統一的數據庫。

很多公司有很多數據庫，但很分散，如果工程師想把這些數據放在一起來做點什么，可能需要和50個不同的人來溝通。

所以我認為建立一個統一的數據庫，所有的數據都存儲在一起是一種很好的策略。

另外，自動化和定制招聘需求也是AI公司的重要特征。

比如在移動互聯網時代，產品經理會寫PRD：

[[204849]]

然后工程師去實現它，整個流程很容易理清楚。

但是假設在AI時代，我們要做一個聊天機器人，這時候如果產品經理畫個線框圖說：這是頭像，這是聊天氣泡，這樣并不能解決問題。

聊天氣泡長什么樣不重要，我需要知道的是，這個聊天機器人要說什么話。線框圖對聊天機器人項目來說沒什么用。

如果一個產品經理畫了個無人車的線框圖，說“我們要做個這個”，更是沒什么用。

在AI公司里，產品經理在和工程師溝通的時候，需要學會基于數據，來做產品的迭代升級。

責任編輯：龐桂玉來源： 36大數據

AI 應用和價值趨勢及算法

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

吳恩達新演講：AI正改變行業格局，公司的壁壘非算法而是數據