人工智能在媒體行業的挑戰以及開發者如何面對
譯文【51CTO.com快譯】當今,不同的行業都在采用人工智能技術來改善各自領域的用戶體驗。媒體中的人工智能對用戶的影響最為顯著,在過去兩年的大部分時間里,有很大一部分人的媒體娛樂被限制在家里。例如,字幕為全球范圍的內容消費打開了大門,打破了長期以來限制用戶內容消費的語言障礙。盡管這些新的人工智能解決方案服務看起來很誘人,但在后端,它增加了開發人員的工作難度,他們在處理這項新技術的同時,必須應對一系列全新的挑戰。
了解不同的用例
作為一名開發人員,重要的是能夠理解給定的業務用例,并在人工智能的幫助下進行相同的操作是否是最佳方法。在媒體行業,像視頻字幕和內容推薦系統這樣的是能夠利用工智能解決的用例。同時,像自動管理工作室所需設備這樣的用例在市場上已經有了更好的解決方案,可以利用這些解決方案而不是使用人工智能。對于一些開發人員來說,能夠在一開始就做出正確的決定是一個挑戰。
訓練模型的數據挑戰
任何人工智能模型的初步步驟都是獲取數據,以訓練模型和開發系統的決策能力,這是最關鍵的方面之一,因為它決定了 AI 系統決策過程的基礎。對于人工智能媒體,這些數據可能與用戶在特定流媒體平臺上觀看的內容有關。獲取這種訓練數據的高質量數據集給開發人員帶來了一系列挑戰。
- 首先,由于圍繞客戶數據的隱私法不斷變化,能夠獲取數據(在媒體行業中與用戶數據有關,例如某個流媒體平臺的收視模式等)可能很困難。特別是如果需要將 AI 應用于構建一個新的功能,那么就需要花費大量的精力才能找到可用于訓練模型的數據。由于有關公司不道德地使用客戶數據的新聞,各國的限制越來越多,因此數據稀缺成為了一個主要問題。
- 其次,即使成功提取了這些數據,開發人員面臨的下一個挑戰是能夠確定要發送的正確數據集,作為模型訓練的輸入發送。需要通過確定哪些數據實體作為不必要或罕見的異常值保留,哪些作為不必要的值放棄,從而高效地清理數據。數據是人工智能的核心,因此,確定合適的數據集是整個系統的關鍵要素,這對開發人員來說是一個不可否認的挑戰。
圍繞數據存儲和安全的挑戰
媒體行業的數據就是大數據的一個很好的例子。例如,Netflix 擁有約 1.51 億訂戶和一個相當大的數據庫,這也意味著開發人員用于不斷改進人工智能系統決策的數據也相當大。數據的高利用率給開發人員帶來了兩個階段的挑戰。第一階段是能夠創建一個有效的系統來管理和存儲大量數據。隨著云計算的出現,許多開發人員更喜歡將數據存儲在云中,而不是本地存儲。這將我們引向第二階段,即確保數據具有適當的數據安全機制,因為此類大型數據存儲是網絡騙子的熱門目標,如果忽視,可能會對業務造成嚴重破壞。
圍繞一體化的挑戰
對于大多數組織而言,舊系統已經到位,需要替換或新開發的 AI 驅動的解決方案集成。這不僅意味著開發人員需要了解其組織的遺留系統是如何工作的,而且他們還需要花費精力尋找一種方法來彌合不同因素之間的差距,這些因素在所使用的遺留解決方案和人工智能解決方案之間差異很大(例如,計算速度、效率等,同時還確保維持整個流程在邏輯上和實際上可行)。此外,許多開發商還需要解決或使用過時的基礎設施,并盡可能利用現有資源實現最佳效。
圍繞技能和知識的挑戰
對于開發人員來說,需要越來越勝任有能力的技能來處理與 AI 相關的開發。具備基礎知識的人仍然可以實現小規模的用例,但具有高度擴展數據的現實項目,類似于媒體行業的項目需要一套在該領域具有豐富經驗的熟練技能,并且需要開發人員不斷提高技能,以了解并接觸 AI 行業的最新發展、方法、趨勢等。人工智能系統所涉及的計算的絕對復雜性要求開發人員獲取知識,以便能夠在多個環境中部署這些解決方案,使其具有可移植性,能夠權衡可用的不同框架,選擇最適合其用例的框架,等等。
結論
媒體行業對于人工智能驅動解決方案有著巨大的空間,新的使用案例不斷出現,越來越多地被媒體平臺采用。同時,這也給開發人員帶來了很多挑戰,他們需要提高技能以保持在市場中的相關性,處理獲取和管理數據的主要現實場景,并且能夠提取模式并識別學趨勢,這有助于在整個媒體行業擴大人工智能的使用。
【51CTO譯稿,合作站點轉載請注明原文譯者和出處為51CTO.com】