人工智能和機器學習項目的五大常見錯誤
由于各種各樣的原因,各種規模和各個垂直行業的公司都在繼續擁抱人工智能(AI)和機器學習(ML)。他們渴望利用人工智能進行大數據分析,以識別商業趨勢,變得更有創新精神,同時改善服務和產品。公司也在利用人工智能自動化銷售流程、營銷計劃和客戶服務計劃,共同的目標是增加收入。
但不幸的現實是,85%的人工智能和機器學習項目都無法交付,只有53%的項目能從原型到生產。盡管如此,根據最近的IDC支出指南,到2025年,美國在人工智能方面的支出將增長到1200億美元,增幅將達到20%甚至更多。
因此,避免五個經常導致人工智能和機器學習項目失敗的常見錯誤是很重要的。
1.了解訓練機器學習算法所需的資源
雖然說你正在利用人工智能和機器學習革新公司的流程聽起來很不錯,但事實是80%的公司發現這些項目比預期的更難。
為了使這些項目獲得成功,您需要清楚地了解在資源和人員方面需要什么。最常見的錯誤之一是不了解如何獲得正確的培訓數據——這不僅對此類計劃的成功至關重要,而且還需要大量的努力和專業知識才能成功完成。大多數希望承擔AI/ML項目的公司無法獲得確保高質量、公正結果所需的參與者數量或群體多樣性。
然而,如果做不到這一點,往往會給成功帶來巨大的障礙,導致項目成本飆升,項目信心暴跌。
2.不要依賴數據代理獲取一刀切的訓練數據
可供企業購買的培訓數據并不匱乏。問題在于,一家公司可以輕松地以低廉的價格購買大量數據并不意味著它就是高質量的訓練數據,而這正是成功的人工智能和機器學習項目所需要的。公司需要的不是簡單地購買一刀切的數據,而是特定于項目的數據。
因此,為了減少偏見,確保數據能夠代表廣泛而多樣的受眾是很重要的。數據還需要針對您的算法進行很好的注釋,并且應該始終檢查數據是否符合數據標準、數據隱私法和安全措施的要求。
3.不要誤解人工智能發展的曲折之路
機器學習算法的訓練不是一個奇異的過程。一旦培訓開始并且更好地理解了數據模型,就必須不斷地對所收集的數據進行更改。然而,在算法訓練過程開始之前,要知道您實際需要什么數據并不容易。例如,您可能會意識到訓練集或數據收集方式存在問題。
這是許多公司在使用數據代理時遇到的另一個問題:它們通常嚴格限制修改策略或根本不允許修改。唯一的辦法是購買額外的訓練集,以滿足新的要求。然而,這樣一來,一個惡性循環就開始了,它會使預算不堪重負,工期延誤,效率降低。
4.始終集成質量保證(QA)測試
通常,QA測試被認為是確保產品正確工作的附加項或形式,而不是被視為在所有迭代中優化產品的必備工具。事實上,QA測試是成功人工智能開發的重要組成部分。結果驗證應該整合到人工智能開發過程的每個階段,以降低成本,加快開發時間表,并確保資源的有效分配。
5.安排頻繁的評論
盡管想象起來可能令人氣餒,但現實是,人工智能項目永遠不會真正完成。即使項目超出了準確性和性能預期,用于這樣做的數據也反映了過去的一個點。此外,算法學會根據不斷變化的事物(觀點、對話、圖像等)做出決策。為了讓人工智能體驗在現在和未來都獲得成功,它必須在滾動的基礎上進行再培訓,以適應新的社會態度、技術發展和其他影響數據的變化。
最終,失敗是由這樣一個事實驅動的:公司低估了確保頂級資源、最佳實踐和項目開始時最高質量所需的努力和規劃方法。事實上,從人工智能的采用中看到最積極影響的公司遵循核心和人工智能最佳實踐,在人工智能上的投入比同行更高效和有效。這包括在部署前測試人工智能模型的性能、跟蹤性能以查看結果是否隨著時間的推移而改善,以及制定良好的協議以確保數據質量。
通過開發一個強大的開發人工智能的程序方法,企業可以避免這些常見的錯誤,并確保他們的人工智能和機器學習計劃的長期成功。