AI/ML項目中四大常見障礙
?但不幸的現實是,85%的AI和ML項目都無法完整交付,只有53%的項目能從原型到生產。盡管如此,根據最近的IDC支出指南,到2025年,美國在人工智能方面的支出將增長到1200億美元,增幅將達到20%甚至更多。
因此,避免五個經常導致AI和ML項目失敗的常見錯誤是很重要的。
1. 了解訓練ML算法所需的資源,特別是數據資源
雖然說正在利用AI和ML革新公司的流程聽起來很不錯,但事實是80%的公司發現這些項目比預期的更難。
為了使這些項目獲得成功,需要清楚地了解在資源和人員方面需要什么。最常見的錯誤之一是不了解如何獲得正確的訓練數據——這不僅對此類計劃的成功至關重要,而且還需要大量的努力和專業知識才能成功完成。大多數希望采用AI/ML項目的公司無法獲得確保高質量、公正結果所需的數據數量或數據多樣性。
然而,如果做不到這一點,往往會給成功帶來巨大的障礙,導致項目成本飆升,項目信心暴跌。
可供公司購買的訓練數據并不匱乏,許多第三方數據公司能夠提供服務。問題在于,一家公司可以輕松地以低廉的價格購買大量數據并不意味著它就是高質量的訓練數據,而這正是成功的AI和ML項目所需要的。公司需要的不是簡單地購買一刀切的數據,而是特定于項目的數據。
因此,為了減少偏見,確保數據能夠代表廣泛而多樣的受眾是很重要的。數據還需要針對你的算法進行準確的標注,并且應該始終檢查數據是否符合數據標準、數據隱私法和安全措施的要求。
2.不要奢望人工智能發展會一帆風順
ML算法的訓練不是一個奇異的過程。一旦訓練開始并且更好地理解了數據模型,就必須不斷地對所收集的數據進行更改。在算法訓練過程開始之前,要知道您實際需要什么數據并不容易。例如,您可能會意識到訓練集或數據收集方式存在問題。
如同傳統的軟件開發一樣,人工智能本質上也是軟件構成的,需要通過持續、穩定的投入并逐漸產生效益。而在這一過程中,永遠不要掉以輕心。
3. 始終集成質量保證(QA)測試
通常,QA測試被認為是確保產品正確工作的附加項或形式,而不是被視為在所有迭代中優化產品的必備工具。事實上,QA測試是成功AI開發的重要組成部分。結果驗證應該整合到人工智能開發過程的每個階段,以降低成本,加快開發時間表,并確保資源的有效分配。
4. 安排頻繁的應用反饋
盡管想象起來可能令人氣餒,但現實是,人工智能項目永遠不會真正完成。即使項目超出了準確性和性能預期,你仍然有上升和完善的空間。此外,算法會根據不斷變化的事物(觀點、對話、圖像等)做出決策。為了讓人工智能體驗在現在和未來都獲得成功,它必須在滾動的基礎上進行再訓練,以適應新的社會環境、技術發展和其他影響數據的變化。
事實上,從AI的采用中看到最積極影響的公司遵循核心和AI最佳實踐,在AI上的投入比同行更高效和有效。這包括在部署前測試AI模型的性能、跟蹤性能以查看結果是否隨著時間的推移而改善,以及制定良好的協議以確保數據質量。
通過開發一個強大的開發AI程序的方法,公司可以避免這些常見的錯誤,并確保他們的AI和ML計劃的長期成功。?