成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

如何應對生成式人工智能給出的無窮無盡的正確答案

人工智能
生成式人工智能 (GenAI) 似乎承諾帶來前所未有的創新和自動化機會……然而,許多領導者難以清楚地表達 GenAI在組織層面提供的實際、有形價值。

生成式人工智能 (GenAI) 似乎承諾帶來前所未有的創新和自動化機會……然而,許多領導者難以清楚地表達 GenAI在組織層面提供的實際、有形價值。

那么,這種明顯的 GenAI 價值差距背后是什么?我們能做些什么來解決這個問題?

我們先暫停關于 GenAI 的成功如何取決于基礎模型、數據和定制的討論,以考慮另一個或者可以說更重要的GenAI 業務成功的投入:領導力。

我確信 GenAI 的機遇是真實存在的,但需要一種特殊的領導思維才能挖掘這些機遇。

領導力作為技術考慮因素

“...在生成式 AI 旅程的每個階段提出一個問題 ——‘這里的商業價值是什么’——可以幫助您的組織保持正軌。”

這種觀點來自亞馬遜網絡服務 (AWS) 的湯姆·戈登 (Tom Godden),發表在《哈佛商業評論》的一篇關于企業領導者實施 GenAI 的技術考慮的文章中。

這是非常好的建議。但你可能因為這個建議聽起來像是給高管的標準建議而忽視它:不要在做某事時不考慮它能為你的組織帶來什么價值。

但是,與其他技術(包括您已經習慣的傳統人工智能)相比,價值更重要的是——正如這篇 HBR 文章所建議的那樣——*技術考慮*和領導力是對 GenAI 系統的技術投入。

當缺乏領導力作為技術投入時,GenAI 將在您的組織中一再失去其潛力。

與其他數據驅動技術相比,為什么這對 GenAI 來說是一個特殊的挑戰?

新的思維方式:無窮無盡的“正確”答案

正當高管們逐漸意識到管理包括傳統人工智能在內的生態系統意味著什么時,GenAI 要求我們進行另一次思維轉變;在這個轉變中,有無數正確答案。

  • 傳統的人工智能用于自動執行只有一個正確答案的任務。
  • 生成式人工智能用于自動執行有無數正確答案的任務。

例如:

  • 傳統人工智能:當我站在自動護照檢查亭前時,如果面部識別系統錯誤地標記了我,它可能會產生一大堆錯誤答案中的任何一個,但只有一個正確答案。
  • 生成式人工智能:當我要求人工智能助手為我生成圖像時,我得到了相當可靠的結果。當我重復同樣的提示時,我得到了完全不同的圖像。兩者都是正確答案……但哪一個更正確呢?

以上哪幅圖像是對提示“藝術畫廊,橙色墻壁,黑色地板,有許多相同的藍色花卉畫的復制品”的“最佳”回應?它比其他的好多少?這完全取決于旁觀者的眼光。

在無盡正確答案的世界中確定衡量標準

如果不更新思維模式,評估 GenAI 的投資回報率 (ROI) 就是一條統計死胡同。對于個人用戶來說,GenAI 可能感覺有用就足夠了,但對于您的組織來說這還不夠……

為了證明你對技術的投資有影響,你必須能夠衡量其績效。為了確保該測量的統計有效性,你需要提前提出指標和定義。預測并評分 GenAI 無窮無盡的正確答案范圍……這是采用它所面臨的前所未有的領導力挑戰。

當“最佳”取決于旁觀者的眼光時,投資回報率 (ROI) 在規模上是一個棘手的概念。

這就是領導力如此重要的原因:“最佳”取決于旁觀者的 GenAI。旁觀者是誰?誰是負責人(誠然,在大型組織中,這并不總是一個簡單的概念)。

當多個答案都以其自身的方式有效時,設計績效指標是一項特殊的挑戰,因為成功取決于背景、判斷和主觀偏好。

因此,作為領導者必須定義價值對您的組織意味著什么,然后在可能尚未做好準備的組織中倡導一種新的衡量思維方式。

克服這個障礙——這是一個關于人而非技術的巨大挑戰——你將解鎖巨大的機遇寶庫。

克服無盡正確答案的挑戰

讓我分享一些可能有助于您的 GenAI 性能測量和基準測試之旅的建議:

  • 明確誰來決定。也許 GenAI 驅動的組織中最重要的問題根本不是技術問題:誰來決定成功是什么樣子?
  • 明確目標。在無休止的正確答案環境中,衡量指標首先要明確您要實現的目標。您的目標是激發創造力、提高效率還是符合特定基調?還是完全不同的東西?
  • 成為有意義的作者。不要指望你的量化分析師提供簡單的指標,而要欣賞設計 GenAI 指標的過程本身就有無數正確答案,并且需要勇敢的領導者做出判斷。
  • 從足夠好的角度來思考。不要比較正確答案,而要考慮設置標準,將復雜的輸出縮減為熟悉的二進制:可接受或不可接受。請注意,如果您采用這種方法,您可能會找到減少模型升級的理由,這可能是最好的,特別是當輸出不直接面向用戶時。
  • 使用人工評分作為代理。借鑒社會科學和過去十年使用可信評分者對系統輸出進行評分的最佳實踐,您可以選擇依靠人工對采樣輸出進行評估。
  • 嘗試實驗。避免直接測量麻煩的一種統計有效方法是運行受控實驗(例如A/B 測試)來證明您的 GenAI 對您的某個 KPI 有實質性影響。
  • 將其與業務聯系起來。在可能的情況下,用可衡量的關系來表達 GenAI 輸出,以直接的業務指標,可以讓你的方法立足于現實。

規模需求需要衡量

這一切與管理人類創意工作者有何不同?與人類工作者不同,人工智能系統無法為自己承擔責任。

這取決于你作為領導者的職責。

如果你不愿意站出來為 GenAI 系統的價值發聲,那么你就只能將 GenAI 作為一種工作效率工具,供你的員工隨意使用。充其量,你只能開發出簡單的人機交互系統,但僅此而已。

要釋放 GenAI 的全部潛力,您必須直面承擔無數正確答案的責任。

人工智能系統無法為自己承擔責任。這是你作為領導者的責任。

現在,企業領導者需要成為價值的代言人,并根據預期的業務成果和價值來闡述 GenAI 的機會和優先事項。只有這樣,組織才能團結一致,共同實現明確的目標,充分利用 GenAI 的全部力量。

作為一名領導者,從模糊性中創造意義將完全落在您的肩上:您越能樹立新的清晰度和目的性標準,您就越能激勵其他人迎接挑戰。

責任編輯:華軒 來源: 數據驅動智能
相關推薦

2023-06-07 07:02:17

2024-03-25 19:47:00

AIGC數據治理

2023-05-05 14:02:59

人工智能聊天機器人

2023-10-30 11:37:12

2023-08-25 18:33:56

人工智能神經網絡

2022-11-30 13:28:53

人工智能AI

2024-10-08 14:27:16

2023-05-06 10:57:06

人工智能OpenAI

2023-08-29 11:36:49

2023-11-07 10:20:22

人工智能AI

2023-08-02 18:26:31

2021-12-17 15:01:54

人工智能視障技術

2023-06-30 10:42:00

2024-04-18 16:12:10

2023-04-25 16:21:13

人工智能ChatGPT機器人

2021-11-10 15:43:23

人工智能智能家居科技

2024-06-12 11:03:47

2024-03-01 10:00:09

2024-01-29 15:46:51

2019-05-07 10:21:48

人工智能AI
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 不卡一区| 91视频播放 | 久久久一二三区 | 91精品久久久久久久久中文字幕 | 亚洲91精品 | 国产香蕉视频在线播放 | 国产欧美一区二区三区在线看 | 精品视频在线一区 | 欧美日本一区二区 | 欧美日韩国产三级 | 久久在看| 精产嫩模国品一二三区 | 日韩免费网 | 国产精品a久久久久 | 久操伊人 | 国产激情偷乱视频一区二区三区 | 日韩欧美一区在线 | 米奇狠狠鲁| 久久久精品影院 | 精品日本中文字幕 | 国产日韩欧美激情 | 国产精品亚洲精品 | 黄色毛片在线观看 | 国产一极毛片 | 亚洲欧美在线观看 | 亚洲午夜视频在线观看 | 久久精品91 | www.国产一区 | 国产91av视频在线观看 | 91精品国产高清一区二区三区 | 日本不卡视频在线播放 | 天久久| 蜜臀久久99精品久久久久久宅男 | 91精品国产91综合久久蜜臀 | 欧洲尺码日本国产精品 | 精品二| 欧美国产亚洲一区二区 | 国产成人免费视频网站视频社区 | 久久av一区二区三区 | av官网在线| 亚洲国产精品一区二区三区 |