如何應對生成式人工智能給出的無窮無盡的正確答案

作者：曉曉 2025-02-10 10:24:36

生成式人工智能 (GenAI) 似乎承諾帶來前所未有的創新和自動化機會……然而，許多領導者難以清楚地表達 GenAI在組織層面提供的實際、有形價值。

那么，這種明顯的 GenAI 價值差距背后是什么？我們能做些什么來解決這個問題？

我們先暫停關于 GenAI 的成功如何取決于基礎模型、數據和定制的討論，以考慮另一個或者可以說更重要的GenAI 業務成功的投入：領導力。

我確信 GenAI 的機遇是真實存在的，但需要一種特殊的領導思維才能挖掘這些機遇。

“...在生成式 AI 旅程的每個階段提出一個問題 ——‘這里的商業價值是什么’——可以幫助您的組織保持正軌。”

這種觀點來自亞馬遜網絡服務 (AWS) 的湯姆·戈登 (Tom Godden)，發表在《哈佛商業評論》的一篇關于企業領導者實施 GenAI 的技術考慮的文章中。

這是非常好的建議。但你可能因為這個建議聽起來像是給高管的標準建議而忽視它：不要在做某事時不考慮它能為你的組織帶來什么價值。

但是，與其他技術（包括您已經習慣的傳統人工智能）相比，價值更重要的是——正如這篇 HBR 文章所建議的那樣——*技術考慮*和領導力是對 GenAI 系統的技術投入。

當缺乏領導力作為技術投入時，GenAI 將在您的組織中一再失去其潛力。

與其他數據驅動技術相比，為什么這對 GenAI 來說是一個特殊的挑戰？

正當高管們逐漸意識到管理包括傳統人工智能在內的生態系統意味著什么時，GenAI 要求我們進行另一次思維轉變；在這個轉變中，有無數正確答案。

例如：

傳統人工智能：當我站在自動護照檢查亭前時，如果面部識別系統錯誤地標記了我，它可能會產生一大堆錯誤答案中的任何一個，但只有一個正確答案。
生成式人工智能：當我要求人工智能助手為我生成圖像時，我得到了相當可靠的結果。當我重復同樣的提示時，我得到了完全不同的圖像。兩者都是正確答案……但哪一個更正確呢？

以上哪幅圖像是對提示“藝術畫廊，橙色墻壁，黑色地板，有許多相同的藍色花卉畫的復制品”的“最佳”回應？它比其他的好多少？這完全取決于旁觀者的眼光。

如果不更新思維模式，評估 GenAI 的投資回報率 (ROI) 就是一條統計死胡同。對于個人用戶來說，GenAI 可能感覺有用就足夠了，但對于您的組織來說這還不夠……

為了證明你對技術的投資有影響，你必須能夠衡量其績效。為了確保該測量的統計有效性，你需要提前提出指標和定義。預測并評分 GenAI 無窮無盡的正確答案范圍……這是采用它所面臨的前所未有的領導力挑戰。

當“最佳”取決于旁觀者的眼光時，投資回報率 (ROI) 在規模上是一個棘手的概念。

這就是領導力如此重要的原因：“最佳”取決于旁觀者的 GenAI。旁觀者是誰？誰是負責人（誠然，在大型組織中，這并不總是一個簡單的概念）。

當多個答案都以其自身的方式有效時，設計績效指標是一項特殊的挑戰，因為成功取決于背景、判斷和主觀偏好。

因此，作為領導者必須定義價值對您的組織意味著什么，然后在可能尚未做好準備的組織中倡導一種新的衡量思維方式。

克服這個障礙——這是一個關于人而非技術的巨大挑戰——你將解鎖巨大的機遇寶庫。

讓我分享一些可能有助于您的 GenAI 性能測量和基準測試之旅的建議：

明確誰來決定。也許 GenAI 驅動的組織中最重要的問題根本不是技術問題：誰來決定成功是什么樣子？
明確目標。在無休止的正確答案環境中，衡量指標首先要明確您要實現的目標。您的目標是激發創造力、提高效率還是符合特定基調？還是完全不同的東西？
成為有意義的作者。不要指望你的量化分析師提供簡單的指標，而要欣賞設計 GenAI 指標的過程本身就有無數正確答案，并且需要勇敢的領導者做出判斷。
從足夠好的角度來思考。不要比較正確答案，而要考慮設置標準，將復雜的輸出縮減為熟悉的二進制：可接受或不可接受。請注意，如果您采用這種方法，您可能會找到減少模型升級的理由，這可能是最好的，特別是當輸出不直接面向用戶時。
使用人工評分作為代理。借鑒社會科學和過去十年使用可信評分者對系統輸出進行評分的最佳實踐，您可以選擇依靠人工對采樣輸出進行評估。
嘗試實驗。避免直接測量麻煩的一種統計有效方法是運行受控實驗（例如A/B 測試）來證明您的 GenAI 對您的某個 KPI 有實質性影響。
將其與業務聯系起來。在可能的情況下，用可衡量的關系來表達 GenAI 輸出，以直接的業務指標，可以讓你的方法立足于現實。

這一切與管理人類創意工作者有何不同？與人類工作者不同，人工智能系統無法為自己承擔責任。

這取決于你作為領導者的職責。

如果你不愿意站出來為 GenAI 系統的價值發聲，那么你就只能將 GenAI 作為一種工作效率工具，供你的員工隨意使用。充其量，你只能開發出簡單的人機交互系統，但僅此而已。

要釋放 GenAI 的全部潛力，您必須直面承擔無數正確答案的責任。

人工智能系統無法為自己承擔責任。這是你作為領導者的責任。

現在，企業領導者需要成為價值的代言人，并根據預期的業務成果和價值來闡述 GenAI 的機會和優先事項。只有這樣，組織才能團結一致，共同實現明確的目標，充分利用 GenAI 的全部力量。

作為一名領導者，從模糊性中創造意義將完全落在您的肩上：您越能樹立新的清晰度和目的性標準，您就越能激勵其他人迎接挑戰。

責任編輯：華軒來源：數據驅動智能

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看