人工智能(AI)從實驗室到實際應用有何不同?
作者:鋼鐵導師賈大白
數據治理是人工智能AI實際應用中的核心問題。 組織在整個開發和生產生命周期中不仔細管理對數據的訪問,人工智能的努力可能無法真正走出實驗室。
當人工智能進入實際應用時,碰到的大多數都是復雜的問題。 然而現階段, 人工智能對于這些問題,并不能進行有效的自行分解和信息收集, 導致在實際的工作中,往往卡殼在數據問題上。
其中如下問題比較突出:
- 數據可得性問題, 由于數據權屬導致大量且結構化的業務數據極其難找, 或者需要花費大量精力
- 臟數據問題, 在實際生產過程中, 90%以上的精力被花費在數據清洗過程中。在實際的數據生產過程中各種技術問題、人為偏見問題、信息標注問題,都可能導致數據出錯。
- 數據流轉動速的問題, 在實驗室中, 你很容易拿著兩份數據來評估模型的準確性。但進入實際應用中,我們往往預測的是未來, 這個時候,現實數據能不能及時喂給模型就很重要了。

不充分的數據造成算法偏見, 比如以人臉來判斷犯罪概率
目前的大數據和人工智能算法中仍然存在著大量的數據缺口,以及偏見, 就如搜索中的性別問題、外賣算法無法幫助騎手識別風險等等。
現實問題過于復雜, 所以AI的大規模應用, 必然要伴隨整個社會數據使用生態的改良,數據安全在有序的狀態下公平正義地運行。
責任編輯:華軒
來源:
今日頭條