OpenAI發布插件幫助ChatGPT連網 內容質量、安全性引擔憂
3月24日消息,美國當地時間周四,人工智能研究公司OpenAI?為其爆火聊天機器人ChatGPT發布了多個插件,它們將幫助ChatGPT連接網絡以實時檢索信息或使用第三方應用。
據悉,OpenAI的插件將允許ChatGPT訪問第三方知識源和數據庫,包括網絡,從而大大擴展了聊天機器人的能力。OpenAI將向ChatGPT測試申請用戶和開發者提供Alpha版。在面向大眾開放訪問前,最初將優先考慮少數開發者和ChatGPT Plus訂閱者。
最吸引人的插件無疑是OpenAI的第一方網絡瀏覽插件,它允許ChatGPT從網絡上尋找數據來回答向它提出的各類問題。而此前,ChatGPT的信息內容僅限于2021年9月之前的日期、事件和人物。新插件使用微軟必應搜索API從網絡上檢索內容,同時顯示它在概括答案時所訪問的網站,并在ChatGPT的回應中引用其來源。
不過,可以聯網訪問其他信息來源的行為可能會存在新的風險,正如OpenAI團隊此前的研究發現一樣。OpenAI曾于2021年創建過名為WebGPT的實驗系統,它有時會引用不可靠來源的信息,并被誘導從用戶可能信任的網站上挑選數據,即使這些來源客觀上并不十分權威。Meta后來下線的BlenderBot 3.0也可以訪問網絡,但很快偏離了最初設想。當收到某些文本提示時,它會發布陰謀論或其他攻擊性內容。
與靜態訓練數據集相比,實時網絡的精確度更低,而且這意味著過濾限制更少。??谷歌??和必應等??搜索引擎??使用自己的安全機制來降低不可靠內容升至搜索結果首位的幾率,但這些結果可能會被操縱,它們也不一定能代表整個網絡。正如此前有報道稱,谷歌的算法優先考慮使用加密、移動支持和模式標記等現代網絡技術的網站。因此,許多擁有其他高質量內容的網站往往會被漏掉。
這給了搜索引擎很大權力來挑選數據,這些數據可能會為網絡語言模型的答案提供信息。人們發現,谷歌在搜索中優先考慮自己的服務,例如用Google Places的數據回答旅行查詢,而不是從像TripAdvisor這樣更豐富、更社會化的資源匯總信息。與此同時,搜索的算法方法也容易出現漏洞。2020年,Pinterest曾利用谷歌圖像搜索算法的一個異常,在谷歌圖像搜索中顯示了更多內容。
OpenAI承認,能夠連網的ChatGPT可能會出現所有類型的不良行為,如發送欺詐性信息和垃圾電子郵件,繞過安全限制,并通常“增強那些欺騙、誤導或虐待他人的不良行為者的能力”。但該公司也表示,其已經在內部和外部“實施了幾項保障措施”,以防止這種情況發生。
除了瀏覽器插件,OpenAI還為ChatGPT背后的模型提供了一個在沙盒、防火墻執行環境中工作的Python 解釋器,以及一些臨時磁盤空間。這種插件支持將文件上傳到ChatGPT并下載結果。OpenAI表示,它在解決數學問題、進行數據分析、可視化以及文件格式之間轉換方面特別有用。
許多早期合作者已經為ChatGPT構建了插件,包括Expedia、FiscalNote、Instacart、Kayak、Klarna、Milo、OpenTable、Shopify、Slack、Speak、Wolfram以及Zapier。
在很大程度上,這些插件的用途不言自明。例如,OpenTable插件將允許聊天機器人在餐廳中搜索可用的預訂,而Instacart插件允許ChatGPT從本地商店下訂單。Zapier是迄今為止可擴展性最強的應用之一,它可以與Google Sheets、Trello和Gmail等應用連接,從而觸發一系列生產力相關任務。
為了鼓勵開發者創建新插件,OpenAI已經開源了一個“檢索”插件,使ChatGPT能夠通過用自然語言提問來訪問來自文件、筆記、電子郵件或公共文檔等數據源的文檔片段。OpenAI發文稱:“我們正在努力開發各類插件,并將它們帶給更廣泛的受眾。我們還有很多東西需要學習,在大家的幫助下,我們希望打造出既實用又安全的東西。”
對于ChatGPT來說,插件是必不可少的補充。ChatGPT曾經受到嚴格限制,只能從其培訓數據中學習,但在有了插件后,它突然變得更加強大,或許法律風險也更小。許多專家指責OpenAI通過利用未經許可的數據訓練ChatGPT獲利,ChatGPT的數據集包含各種各樣的公共網站,而插件可能會通過允許公司保留對其數據的完全控制權來解決這個問題。(小小)