大數據是否將我們拖到另一個AI冬天?
過去幾年中,令人屏息的新聞剪輯數量令人難以記住,但人工智能的歷史充滿了挫折和挫折。 記憶猶新的人們記得70年代初和80年代的第一對所謂的" AI冬季"。 首先是由于對AI的幻滅而造成的,而第二個(可能更重要的)冬天誕生了,因為技術和物理硬件遠遠落后于當今的理論。 例如:科學家發明了反向傳播的概念,它是深度學習的基礎,但是直到現代的GPU大量出現后,真正的必要的計算能力才真正發揮出來。
現在,當然,情況已經改變。 計算是隨時可用的。 我們正在研究數據。 政府正在投資研究。 大學生正在研究機器學習。 媒體報道了AI,這是技術的下一次巨變。 一切似乎都朝著未來的趨勢發展,在這種情況下,人工智能已經相當普遍,公眾也理解并接受了它的承諾和實用性。
不幸的是,"似乎"是最后一句話中的執行詞。 企業正在投資人工智能,但只有約三分之一的企業看到了投資回報。 而且,如果該投資回報率仍然難以捉摸,那么就很容易預測投資將開始萎縮的世界,尤其是在全球性經濟環境中,這種經濟環境由于史無前例的大流行而變得動蕩不定。 與其享受上一個AI冬季以來的持續解凍,不如輕松地看著溫度再次下降。
但是請注意,問題不在于AI不能賺錢還是不能賺錢,而是可以。 例如,許多流程自動化AI項目都是成功的。 考慮一下那些"閱讀"法律文件并提取信息的AI,或者分類和處理客戶溝通或核對賬單問題的AI。 當然,這些不是最性感或最復雜的用例,但它們可以為公司省錢,因此您知道他們很快就不會去任何地方。
因此,如果AI可以賺錢,為什么只有35%的公司看到投資回報? 一個很大的原因是,構建和訓練模型的成本仍然過高。 好吧,那為什么呢? 正是由于最近的另一種趨勢席卷了整個企業,尤其是科技界:大數據。
問自己:您聽過多少次"更多數據"才能使模型變得更好? 實際上,這是錯誤的。 高質量的數據使模型更好。 有用且標簽明確的數據使模型可以工作。 有無數的數據? 其實并不重要。 尤其是在無法證明數據有用的情況下。 當您處理我們在此談論的數量時,這很難做。
現實情況是,由于缺乏更好的期限,投資者以及大數據行業一直保持著對大數據的首要地位的敘述。 大數據的成本是AI成本的巨大推動力。 人工智能和機器學習從業者所擔心的是,那些完全相信自己需要堆積所有數據(即使他們看不到這樣做的明顯效用)的公司可能會開始撤回對人工智能的投資,以支持建立大數據。 但是,首先存儲所有數據比較大的原因是,您可以進行預測并從中構建AI。 換句話說,我們實際上正處于大數據扼殺AI投資的危險中-奇怪的是,這首先存在于AI中的一個重要原因!
還有一個問題是,小公司受大數據負擔的影響更大。 對于較小的組織來說,存儲數據和訓練模型的門檻更高。 當您將所有這些與摩爾定律已經結束的事實結合在一起時,您可以開始看到對服務器空間和計算真正的經濟競爭的未來。 這就像是對潛在的AI冬季的預測。
那么在這里可以做什么? 從業者將必須帶頭。 我們需要表達自己的需求,而不是大數據的需求。 我們需要投資于有助于AI獲利的公司和解決方案,而不是那些僅用于組織和構造大數據的解決方案。 我們必須努力使該行業在貨幣和環境方面都可持續。 我們必須拒絕擁有更多數據總是可取的舊觀念。 因為,坦白說不是。 太多公司堆積數據而沒有太多實際用途。 我們需要能夠清除實際上沒有理由保留的舊的無用數據。 我們必須投資于數據質量度量,而不是用于保留數量的地方。