成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

黑客入侵OpenAI,細節一年后才公開,三類數據資源讓AI公司成為活靶子 原創

發布于 2024-7-11 14:29
瀏覽
0收藏

作者 | Devin Coldewey

編譯 | 伊風

前OpenAI員工Leopold Aschenbrenner,最近在一檔播客中暗示OpenAI曾被黑客成功入侵。隨后,《紐約時報》對這次攻擊進行了更詳細的報道。

2023 年初,一名黑客成功入侵了 OpenAI 的內部通信系統,并進入了內部員工的在線社區,平臺中包含公司最新人工智能技術的討論。

2023 年 4 月,OpenAI 的高管向員工和董事會披露了這一事件,但由于沒有客戶或合作伙伴的相關數據被泄露,OpenAI決定不將其公之于眾。領導層認為,黑客是一個獨立的實體,與任何外國政府都沒有關聯,因此他們沒有讓執法部門介入。這也引發了人們對OpenAI透明度的質疑。

雖然,OpenAI強調在這起入侵事件中,沒有泄露任何用戶的對話或個人信息。然而,這次黑客攻擊本身給人帶來的不安還只是表面性的——更重要的提示是,AI公司已經迅速成為黑客們最有吸引力的目標之一。

任何安全漏洞都不應被輕視,尤其是竊聽內部OpenAI開發討論確實有巨大的價值。但這遠非黑客的全部目標:獲取內部系統、研發中的模型、秘密路線圖等等。   

事實上,這些AI公司已經成為龐大數據的守門人。

OpenAI和其他AI公司創建了海量的數據,最值得被黑客“惦記”的莫過于:高質量的訓練數據、大量用戶互動及客戶數據。

1.高質量的訓練數據

目前尚不清楚它們擁有哪些訓練數據,因為這些公司對它們的數據庫進行了嚴格保密。

但認為它們只是大量收集的網絡數據是錯誤的。AI公司確實使用網絡爬蟲或像Pile這樣的數據集,不過要將這些原始數據塑造成能夠訓練像GPT-4o這樣的模型所需的數據,需要大量的人工工作——這只能部分自動化。

一些機器學習工程師推測,在創建大型語言模型(或任何基于Transformer的系統)時,最重要的因素之一是數據集的質量。這就是為什么在Twitter和Reddit上訓練的模型永遠不會像在上個世紀的所有出版作品上訓練的模型那樣雄辯。(也可能是OpenAI據稱使用了在法律上有爭議的數據來源,如版權書籍,他們聲稱已放棄這種做法。)

因此,OpenAI構建的訓練數據集對競爭對手來說具有巨大的價值,無論是其他公司、對手國家還是美國的監管機構。

2.用戶互動數據

更有價值的也許是OpenAI擁有的大量用戶數據 —— 大約數十億與ChatGPT進行的對話,涉及數十萬個主題。

就像搜索數據曾經是理解網絡集體心理的關鍵一樣,ChatGPT現在觸及的人群也許沒有谷歌用戶那么廣泛,但提供了更多的深度。(如果你不知道,除非你選擇退出,否則你的對話正在用作訓練數據。)          

黑客入侵OpenAI,細節一年后才公開,三類數據資源讓AI公司成為活靶子-AI.x社區圖片

開啟“為所有用戶改進模型”時,對話會進入訓練數據庫          

例如,Google上搜索“空調”的頻率增加,則說明該市場正在升溫。但這些用戶接下來不會告訴谷歌:他們想要什么、愿意花多少錢、他們的家是什么樣子、他們想避免的制造商等等。

但你知道這是非常有價值的信息——谷歌正試圖通過用AI交互替代搜索來獲取這些信息!

想想人們與ChatGPT的對話有多少,以及這些信息對開發AI的人員、市場團隊、顧問、分析師來說有多有用,這是一座金礦。

3.客戶數據

最后一類數據可能是開放市場上價值最高的:客戶實際如何使用AI,以及他們自己向模型輸入的數據。

數百家大公司和無數小公司使用像OpenAI和Anthropic的API這樣的工具,執行同樣廣泛的任務。為了使語言模型對他們有用,通常需要在它們自己的內部數據庫上進行微調或以其他方式提供訪問權限。

這可能是一些乏味的舊預算表或人事記錄(例如,使它們更易搜索),也可能是未發布的軟件代碼。他們如何利用AI的能力(以及它們是否真的有用)是他們的事,但事實是,AI提供商有特權訪問,就像其他任何SaaS產品一樣。

這些都是工業機密,而AI公司突然間就處在這些機密的核心位置。這個行業的新奇性帶來了特殊的風險,因為AI流程尚未標準化或完全理解。

像任何SaaS提供商一樣,AI公司完全有能力提供行業標準的安全性、隱私性、本地選項,并且通常會負責任地提供服務。我毫不懷疑OpenAI的財富500強客戶的私密數據庫和API調用是嚴密鎖定的!他們肯定對在AI環境下處理機密數據的風險非常了解。(OpenAI沒有報告此次攻擊是他們的選擇,但這并未增加一個急需信任的公司的信任。)

但良好的安全措施并不會改變它們所保護的東西的價值,也不會改變惡意行為者和各種對手正在試圖闖入的事實。

安全不僅僅是選擇正確的設置或保持軟件更新——盡管基礎的舉措也很重要。

4.寫在最后

黑客與公司數據之間,是一場永無止境的貓鼠游戲,諷刺的是,現在這場游戲正被AI本身大大加速:代理和攻擊自動化程序正在探查這些公司每一個角落和縫隙的攻擊面。

我們沒有理由驚慌——擁有大量個人或商業價值數據的公司多年來一直面臨并管理著類似的風險。

但AI公司代表了一個更新、更年輕、潛在更有吸引力的目標,比你常見的配置不良的企業服務器或不負責任的數據經紀人更具吸引力。即使是像上面報道的那樣的黑客攻擊,據我們所知沒有嚴重的數據泄露,也應該讓任何與AI公司有業務往來的人感到擔憂。

OpenAI們已經在自己背上標上了靶子。當任何人,甚至所有人,試圖攻擊他們時,不要感到驚訝。

參考鏈接:

1.https://techcrunch.com/2024/07/05/openai-breach-is-a-reminder-that-ai-companies-are-treasure-troves-for-hackers/

本文轉載自??51CTO技術棧??,作者:伊風


?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2024-7-11 14:29:34修改
收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 亚洲 欧美 另类 日韩 | 天天久久 | 日本国产高清 | av毛片在线| 国产伦一区二区三区视频 | 五月天天色 | 亚洲欧美激情精品一区二区 | 国产福利在线 | 日本不卡高字幕在线2019 | 国产乱码精品一区二区三区五月婷 | 国产精品99久久久久久久久久久久 | 久久999 | 成人三级在线播放 | 亚洲一区二区久久久 | 日本一区二区三区在线观看 | 久久视频精品在线 | 久久久久久久综合 | 黄色一级电影在线观看 | 久热电影 | 亚洲国产欧美在线 | 亚洲成av | 免费 视频 1级| 一区二区在线观看免费视频 | 久久伊人精品 | 久久久久久国产精品免费 | 成人av免费 | 欧美精品在线一区二区三区 | 免费二区| av大全在线观看 | 色性av | 91社区在线观看播放 | 精品在线免费观看视频 | 精品视频一区二区三区在线观看 | 久久成人18免费网站 | 中日av| 国产91久久久久久 | 日韩在线免费 | 精品国产99| 国产免费视频 | 欧美 日韩 国产 成人 在线 91 | 伊人精品在线视频 |