Sora無法替代人類!亞馬遜工程師斷言:實際工作沖突不可能靠AI解決
這一周,OpenAI視頻AI工具Sora一出現,可謂是炸翻了天。
「飯碗保不住了」的恐懼,真實地擊中了許多人。
圖片
不過,亞馬遜的一位工程師Cameron Gould則認為,其實并不必對AI如此懼怕,它并不會導致我們失去工作。
為什么?原因如下。
Prompt的自相矛盾
首先,生成式AI應用在創意內容時,生成的一般是圖像、視頻以及一般的非虛構內容。
給一個生成式AI模型prompt,就像照看一個惡毒的孩子,他的唯一目標,就是通過「從字面上理解你所說的一切」來惹惱你。
你必須用詞準確,不能在不重要的細節上浪費一個字符,因為這可能就會使結果向完全不同的方向傾斜。
但是同時,你又需要提供盡可能多的詳細信息,讓模型不會誤解你。
這種自相矛盾的操作,簡直太糟糕了!
跟計算機進行單向對話,試圖理解它為什么沒能產生自己想要的結果,能讓人產生一種連續3小時撞墻的沖動……
圖片
Gould表示,在自己作為軟件工程師的職業生涯中,其實已經習慣了和計算機的這種單向對話,但生成式AI給他的體驗,絕對更糟。
它不是一種可預測的編程語言,擁有冪等的函數。
圖片
它完全是一個黑匣子,幾乎每次都可以在相同的輸入下,產生完全不同的結果。
即使在prompt里要求AI要保持一致性,它也未必會聽你的。
市值數十億的公司,就曾受到這一現實的困擾。
最近,加拿大一家法庭裁定,加拿大航空公司必須向其中一名乘客支付賠償金,因為聊天機器人提供了誤導性建議,導致該乘客為機票支付了近一倍的費用。
圖片
速度確實快,但……
當然,盡管在一致性方面存在缺陷,但生成式AI可以幫我們快速產出東西來。
圖片
比如上面這張圖,就是用生成式AI創建的,只花了幾秒鐘就做出來了。
所以,AI可以讓我們比藝術家出圖的速度更快,這件事是有可能的。
而Sora也讓普羅大眾就可以用比以往快許多倍的方式,生成更復雜的媒體素材。
所以,由于現在一個人可以做幾個人的工作,我們真的不需要那么多的藝術家、軟件工程師、撰稿人了嗎?
不,它的細節不對
答案并沒有那么簡單。
使用生成式AI創作藝術時,可能你時常會想:「不,這不是我想要的。」
這也是在論壇上常常出現的觀點。
有人會反駁說:這是因為你的prompt缺乏細節,你需要給出更具體的prompt。
這個觀點確實有道理。
圖片
我們自己的圖片和票房收入超過1億美元的專業電影,有何不同?
我們自己的個人博客,和專業的全職作家的博客,有何不同?
我們自己做的游戲視頻標題,和30小時的AAA視頻游戲標題,有何不同?
答案就是細節。
AI生圖
正是細節,將業余愛好者和專業人士區分開。
如果想使用生成式AI來創作與專業內容一樣令人印象深刻的作品,我們將需要一個包含大量細節的提示。
此外,還需要大量的試驗和錯誤,才能讓模型產生我們想要的東西。
生成式AI只是一種工具,類似于自動完成、編譯器、拼寫檢查器或任何其他輔助工具。
它不會為你做任何工作,除非是它自己的苦差事。
讓我們回到Sora的例子。
它只能生成無聲的視頻。其中沒有音頻,沒有對話,沒有一個對象可以說話,或者發出聲音。
圖片
但如果我們想用它拍電影,就需要用它——
生成腳本?
閱讀劇本?
生成視頻以配合腳本?
究竟是現代電影的哪些方面,讓電影變得有趣呢?
突然間,我們就需要集成一堆不同的生成式AI工具,才能完成工作。
當然,OpenAI有一個名為Jukebox的音樂生成工具,它可以在視頻中添加音樂,但卻無法添加對話。
圖片
在一段視頻中,該如何添加對話呢?這項任務聽起來太艱巨了。
我們不僅需要生成一個特定場景的視頻,還需要讓場景中角色的嘴部動作和臺詞保持一致。
此外,視頻生成器還需要知道單詞是怎樣說出的。不僅僅是語氣,還有節奏。
想象一下,要解決全部這些細節,需要多大的人力才能解決?
細節,變得相當困難。
在每一個步驟的每一個級別上,都有大量會影響實質性后果的細節。
圖片
Gould表示,自己最近讀到一篇非常喜歡的博文《現實擁有驚人的細節量》。
圖片
現實的細節是無限的,然而AI模型的token卻是有限的。
它只能帶你走這么遠,之后,我們就需要依靠其他人來完成工作。
目前為止,人類仍然做著最繁重的工作。
圖片
殖民宇宙的一些重要細節
更少的細節,更多的變化
專注于細節,聽起來實在是太累了。
如果讓你保持簡單,會發生什么呢?如果你只需要提供很短的描述,只用幾分鐘就可以寫出來?
最終,你會得到多樣化的結果,大部分與你的想法完全不一致。
你需要在成百甚至上千個結果中,才能找到你想要的那一個,因為prompt太通用了。
你可能永遠都找不到一個能用的結果。
如果prompt太簡單,模型天馬行空的想象力,會提供無限的排列供你選擇。
比如輸入這個prompt——「一個男人」,你會得到各式各樣的男人。
圖片
但實際上,我想要的是一個藍頭發、棕色眼睛、留著小胡子、穿著一件黑色夾克、戴著兜帽的男人。
如果只輸入「一個男人」作為提示,需要多長的時間才能找到確切的輸出呢?
深度和廣度之間有一個平衡點,你可以最大限度地減少你的努力。
這就需要對細節進行大量批判性思考,并進行大量搜索。
AI不會取代我們
所以,為什么說AI不會取代我們?
因為,企業并不是為了解決生成圖像、視頻剪輯這類小問題而存在的。
企業是為利益相關者解決更大型、更復雜的問題。
解決這些問題最困難的部分,就是后勤工作。
解決大型、復雜的問題需要一大群問題解決者的時間和精力,而所有這些問題解決者又需要由其他問題解決者組織起來,以保持事情的進展。
如果隨機抓來兩個人,讓他們自我管理、自我組織工作,很可能他們的標準和時間表會不一致。
如果你要讓他們一起工作,你就得設立標準,讓他們在同樣的時間工作,并且產生相同質量的結果。
凝聚力是一種力量,你需要做一些工作,讓獨立的單位保持一致。
一個團隊單獨運行,可以順利完成任務;但是當我們把多個團隊引入單個環境中時,就會出現很多沖突。
圖片
多個相互依賴的團隊朝著一個目標努力時,需要一定的凝聚力,才能完成有意義的事。
這項「凝聚力」工作其實很復雜,經常需要解決人際沖突,而這些沖突通常是不合邏輯的、情緒化的。
顯然,AI無法解決這種類型的沖突。
總結來說就是——
- 企業通過為很多人/企業解決大問題來賺錢
- 大問題很難解決,因為涉及很多團隊
- 我們需要精心策劃如何統籌這些團隊,來解決人際沖突,并保持凝聚力
- 在解決人際沖突方面,人是最可靠的資源
很顯然,機器人根本無法勝任這些工作,它們的表現會很糟糕。
AI不會搶走你的工作
當我們仔細看一下目前生成式AI的現狀,這個事實是顯而易見的——
目前沒有任何方法,可以讓工作自動化。
提示界面和模型缺乏自主性和批判性思維,導致了關鍵的局限性。
沒錯,生成式AI的確可以讓我們提高工作效率,但也就僅此而已。
圖片
這句話已經被越來越多人所贊同:AI不會搶走你的工作。
真正會對你造成威脅的,是會比你更熟練地使用AI工具的人。
生成式AI是幫助你加快速度的絕佳資源,但它不會完全自動化你的工作。
你要做的,就是把它們添加到你的工具箱,熟練地掌握它們。
參考資料: