ChatGPT4o被越獄了,有人拿來搞大尺度!
你好啊,我是軒轅。
大家知道,為了防止AI被用于不法用途,各家的AI大模型都設(shè)置了一些安全防護措施。
當你嘗試讓AI去做一些可能涉及到違法的事情時,它會直接拒絕。
圖片
然鵝,信息技術(shù)的發(fā)展總伴隨著安全攻防對抗的產(chǎn)生,AI也不例外。
這不,現(xiàn)在就有這么一波“黑客”,他們利用OpenAI的“漏洞”,讓最新版的ChatGPT4o越獄了,突破了這層安全防護,可以執(zhí)行之前不被允許執(zhí)行的指令。
圖片
他們是怎么讓GPT越獄的呢?
其實很簡單,他們用的方法,咱們中文互聯(lián)網(wǎng)早就用爛了!
圖片
舉個例子,在很多平臺上,為了防止引流,會監(jiān)控一些關(guān)鍵詞,比如很多人喜歡留微信號,讓別人來加微信,然后進行營銷活動。
或者為了防止競爭,一些平臺禁止出現(xiàn)淘寶等關(guān)鍵詞。
于是,聰明的網(wǎng)友開始用各種詞匯來替代它們,比如微信變成薇信、威信、VX,淘寶變成了桃寶、桃寳,甚至emoji ??寶。
各種火星文層出不窮,反正機智的網(wǎng)友總能想出一些字符來躲避審查。
現(xiàn)在,老外們也學(xué)會了這一招,比如他們要讓GPT寫一個病毒程序,你直接讓它寫,肯定是會拒絕的。
但是,把prompt提示詞先處理一下,用一些冷僻單詞表達同一個意思:
圖片
這之后再讓GPT來執(zhí)行,躲避關(guān)鍵詞審查。
除此之外,還可以借鑒上面中文躲避審查的思路,把一些字符進行替換,比如e替換成3,字母l替換成數(shù)字1,t替換成7,這樣一來,單詞leet就變成了1337。
圖片
接下來再把這段“火星文”內(nèi)容讓GPT來執(zhí)行:
圖片
你看,又繞過了!
沒想到中文互聯(lián)網(wǎng)的火星文居然再一次煥發(fā)了生機。
上面只是讓GPT寫一寫網(wǎng)絡(luò)攻擊的代碼程序,有人就在想,既然這都能行,讓它做點···
圖片
尺度原因,就不放出來了。
好消息是,截止到現(xiàn)在,這些個繞過限制的方式已經(jīng)被OpenAI給堵住了。
不過,就像網(wǎng)絡(luò)安全對抗一樣,這故事遠沒有結(jié)束,或許這只是一個小小的序曲,人類與人工智能之間的斗智斗勇,可能才剛剛開始。