GPT-5紅隊測試郵件曝光,最早6月發布?網友在線逼問Altman,數十億美元超算26年啟動
GPT-5已經開始紅隊測試了?
就在這幾天,網上已經有多人曬出了OpenAI發給自己的紅隊錄取通知書。
此前有傳聞說,GPT-5將于今年6月發布。看起來,紅隊測試與模型發布的時間線十分吻合。
有網友直接曬出了自己收到OpenAI郵件邀請的截圖。
這倒是和此前Sam Altman的說法對上了。
據悉,GPT-5早已為大家準備好,只是發布風險太大了,所以還得往后延。
三個月就能用了?
不過還有人表示,先別急,這些人只是收到了紅隊邀請測試而已,并沒有提及具體模型。
有可能是他們填了如下的申請信息之后,才收到了郵件。
安全測試對于新版GPT如此重要的原因,一方面是ChatGPT已經有了非常大的用戶數,如果在安全性上出問題,OpenAI可能也會面對像谷歌一樣的輿論壓力。
另一方面,To B業務是OpenAI的主要收入來源,定制化的ChatGPT能大大增強各個企業的業務能力和效率。
有人表示,紅隊測試會持續90-120天。
如果此次紅隊測試就是針對GPT-5的話,那么三個月內,我們應該就能用上它了!
而在坊間,這一傳聞讓群眾們沸騰了!他們早已按捺不住對于GPT-5的猜測和暢想。
比如,GPT-5的上下文窗口會達到多少?
目前,Gemini 1.5 Pro是1M,Claude 3是200K,GPT-4是128K,不知道GPT-5會突破怎樣的驚人紀錄。
大家紛紛列出自己對于GPT-5的愿望清單——
比如10Mtoken的上下文窗口,閃電般的快速干擾,長期戰略規劃和推理,執行復雜開放式操作的能力,GUI / API導航,長期情境記憶,始終處于隱形狀態的RAG,多模態等等。
有人猜,或許GPT-5會和Claude 3一樣,提供幾種不同的型號。
有人總結了目前關于GPT-5和紅隊的最新謠言和傳聞,大致要點如下——
-OpenAI預計于今年夏天發布GPT-5,部分企業客戶已收到增強功能的演示;
-GPT-5「實質性更好」,相比GPT-4進行了重大升級。它需要更多的訓練數據;
-GPT-5的潛在功能包括生成更逼真的文本、執行翻譯和創意寫作等復雜任務、處理視頻輸入以及改進推理;
-Sam Altman表示,GPT-5仍在訓練中,沒有確切的發布日期,廣泛的安全測試可能還需數月。然而,他確認OpenAI今年將「發布一個驚人的新模型」。
在3月29日,獲得內部信息的Runway CEO兼AI投資人Siqi Chen就稱,GPT-5已經在推理方面取得了意想不到的階躍函數增益。
它甚至可以靠自己就獨立地弄清楚,如何讓ChatGPT不用每隔一天就登錄一次。
Ilya看到的東西,也許就是這個?
這是不是就意味著,在OpenAI內部,已經實現了AGI?!如果是真的,這也太驚人了。
「我不相信,只有AGI才能實現這樣的能力」。
總之,網友們紛稱,根據泄露的待辦清單顯示,OpenAI的下一項任務,就是發布GPT-5了!
大家紛紛呼喚Altman,是時間放出GPT-5了,別太吹毛求疵了,我們要求不高。
紅隊測試上陣,確保GPT-5安全
早在23年9月,OpenAI就曾官宣招募一批紅隊測試人員(Red Teaming Network),邀請不同領域專家評估模型。
不同領域專家組成的紅隊去尋找系統漏洞,成為確保下一代模型GPT-5安全的關鍵。
那么,紅隊測試人員一般都需要做哪些工作?
AI紅隊攻擊的類型主要包括,提示攻擊、數據中毒、后門攻擊、對抗性示例、數據提取等等。
「提示攻擊」是指在控制LLM的提示中注入惡意指令,從而導致大模型執行非預期的操作。
比如,今年早些時候,一名大學生利用提示獲取了一家大公司的機密信息,包括開發的AI項目的代碼名稱,以及一些本不應該暴露的元數據。
而「提示攻擊」最大的挑戰是,找到威脅行為者尚未發現、利用的新提示或提示集。
紅隊需要測試的另一種主要攻擊是「數據中毒」。
在數據中毒的情況下,威脅者會試圖篡改LLM接受訓練的數據,從而產生新的偏差、漏洞供他人攻擊以及破壞數據的后門。
「數據中毒」會對LLM提供的結果產生嚴重影響,因為當LLM在中毒數據上接受訓練時,它們會根據這些信息學習關聯模式。
比如,關于某個品牌、政治人物的誤導性,或不準確信息,進而左右人們的決策。
還有一種情況是,受到污染的數據訓練后,模型提供了關于如何治療常規疾病或病痛的不準確醫療信息,進而導致更嚴重的后果。
因此,紅隊人員需要模擬一系列數據中毒攻擊,以發現LLM訓練和部署流程中的任何漏洞。
除此以外,還有多元的攻擊方式,邀請專家也是OpenAI確保GPT-5能夠完成安全測試。
GPT-5,真的不遠了
正如網友所言,紅隊測試開啟,意味著GPT-5真的不遠了。
前段時間,Altman在博客采訪中曾提到,「我們今年會發布一款令人驚艷的新模型,但不知道會叫什么名字」。
盡管如此,全網都一致地將OpenAI發布的下一代模型稱為GPT-5,并有傳言稱代號為Arrakis的項目,就是GPT-5的原型。
根據FeltSteam的預測,這個Arrakis的多模態模型,性能遠超GPT-4,非常接近AGI。
另外,模型參數據稱有125萬億,大約是GPT-4的100倍,并在2022年10月完成訓練。
網友還總結了以往GPT系列模型發布時間表:GPT-1在2018年6月誕生,GPT-2在2019年2月,GPT-3在2020年6月,GPT-3.5在2022年12月,GPT-4僅在三個月后于2023年3月發布。
關于GPT-5的發布時間,可能在今年夏天就問世。
最近,網上流傳的一張圖上,顯示了Y Combinator推出了GPT-5早期準入候補名單。
網友發起疑問,我們都清楚奧特曼和YC的關系不同尋常。這是否意味著他們可以在模型或信息公開之前獲得訪問權限?
而上月也有爆料稱,已有用戶對GPT-5上手體驗過了,性能驚人。
外媒透露,一些企業用戶已經體驗到了最新版的ChatGPT。
「它真的很棒,有了質的飛躍,」一位最近見識到GPT-5效果的CEO表示。
OpenAI展示了,新模型是如何根據這位CEO公司的特殊需求和數據進行工作的。
他還提到,OpenAI還暗示模型還有其他一些未公開的功能,包括調用OpenAI正在開發的AI智能體來自主完成任務的能力。
GPT-5,一定是正確路線嗎?
不過,在萬眾矚目期待GPT-5面世的呼聲中,也有一些不一樣的聲音。
比如有人覺得,GPT-5無法駕駛你的汽車,GPT-5無法解決核聚變問題,GPT-5無法治愈癌癥......
另外,我們對模型的追求,非得是更智能嗎?
更便宜、更快、更不費水電的模型,可能比單獨的GPT-5更有革命性意義。
有人同意這個觀點,表示現在實在有太多人(尤其是開發者)過于癡迷GPT-5了。
其實完全沒必要這么狂熱,使用當前的模型,就可以已經完成和構建太多東西。
只需正確選擇利基市場,構建滿足該利基市場需求的AI產品,讓用戶可以直觀地訪問AI,專注于更好的UI/UX即可。
公式很簡單。我們真的有必要一味追求力大磚飛嗎?
很多人表示贊同,表示甚至用GPT-3.5就可以造出非常有價值的東西。
問題不在于模型多先進,而在于怎樣滿足利基市場的需求。
智算中心,先從小的建起
而3月底曝出的用于訓練GPT-6的千億美元「星際之門」超算,今天又被外媒挖出了更多新的內容。
上周五,外媒The Information曝出了一個驚人消息:???OpenAI和微軟正在制定一項雄心勃勃的數據中心項目,預計耗資1000億美元??。
此消息一曝出,AI和云計算行業人士的提問,像雪片一樣襲來——
數據中心具體位于美國的哪個地區?
會使用什么芯片?
運行數據中心所需的驚人巨量電力,從何而來?
……
為此,The Information又挖出了更多料,具體細節如下。
首先,之前的消息說是星際之門最早在2028年啟動,而最新消息顯示,最快在2026年,就會在威斯康星州啟動一個功率較小的數據中心。
它的價值當然不到千億美元,但估計仍會耗資數十億。
其他細節如下——
用英偉達芯片,但不用英偉達網線
首先,這次數據中心的多數服務器機架,當然主要還是用的英偉達芯片。
不過有趣的是,將各個AI芯片服務器連接起來的網線,則并不會采用英偉達的產品。
據悉,OpenAI已經告知微軟,自己不想再使用英偉達的InfiniBand網絡設備。相反,它可能會使用基于以太網的電纜。
OpenAI「拋棄」英偉達InfiniBand,原因有二。
其一,InfiniBand太貴了!
它雖然能提供更好的性能,但它也比以太網電纜更昂貴。
其二,OpenAI不想讓AI開發人員過于依賴英偉達。
要知道,目前OpenAI是全球最大的英偉達服務器集群消費者之一。并且,InifiniBand設備的性能,有時也并不可靠。
所以,英偉達會失去一大筆收入嗎?
不,你想多了。
節省下來數十億美元,OpenAI會用來購買更多的英偉達芯片,英偉達依然賺翻了。
看來,OpenAI可以接受網絡性能的降低,但對于更強算力的渴望,仍然是不變的。
InfiniBand與以太網之爭,已成熱門話題
其實,在最近硅谷的會議和晚宴上,InfiniBand和以太網的pk,一直是個大熱門話題。
所有云提供商和數據中心運營商都在預測:以太網是否會趕超InfiniBand?
絕大多數人給出的答案是肯定的。
而OpenAI放棄后者的舉動,更是支持了這個論點。
英偉達的電纜到底有多貴?
這個數字說出來,十分驚人——
英偉達的網絡電纜銷售額,已經超過了賣GPU的錢!
英偉達首席財務官Collete Kress今年2月透露了這一驚人數據:新興的電纜業務的年化收入,已經超過了130億美元。
也就是說,它在12月創造了約11億美元的收入,約占英偉達當月總收入的15%。
網絡電纜賣這么貴,難怪OpenAI會選擇不玩了。
本文轉自 新智元 ,作者:新智元
