牛津未來研究院:《將人工智能安全視為全球公共產品的影響、挑戰與研究重點》
《將人工智能安全視為全球公共產品的影響、挑戰與研究重點》由牛津未來研究院發布,眾多機構的專家共同撰寫。報告指出,隨著 AI 發展,其安全問題成為關鍵挑戰,探討將 AI 安全視為全球公共產品的意義、挑戰與研究方向。
報告分析了全球公共產品的概念,指出 AI 安全在技術、知識和制度層面具有公共產品特性,但面臨平衡責任與問責、安全與能力糾纏、發展公平性等問題。不同國際聲明對 AI 安全作為全球公共產品的理解存在差異,反映出 AI 發展的復雜性。在應用框架時,需考慮區域、國家和全球治理層面的差異,以及政治現實、權力動態等因素的影響。
為應對這些挑戰,報告建議開展深入研究,明確核心需求,完善 AI 安全的公共產品框架,改進治理機制,考量不同利益相關者的反應,建立評估指標,制定技術和經濟策略,從而推動 AI 安全發展,確保 AI 造福人。
報告主要內容介紹
人工智能能力的快速提升引發了人們對其潛在益處的期待,同時也引發了對超越傳統界限的新興集體挑戰的擔憂。雖然人工智能技術有助于應對醫療、氣候變化和經濟發展等領域的全球挑戰,但它們也帶來了風險,從當前對算法偏見和隱私的擔憂,到有關自主性和安全性的基本問題。這些機遇和挑戰在不同地區和社區的表現可能有所不同,因為一些國家在推動人工智能發展的前沿,而另一些國家則在努力構建基礎人工智能應用和發展的基礎設施。因此,人工智能在地方、區域和全球層面都帶來了復雜的治理挑戰。技術的快速進步與集體行動的需求相交,引發了不同利益相關者(從主要人工智能強國到新興經濟體)是否以及如何協調人工智能開發、部署和風險管理方法的問題。此外,人工智能能力和資源的差異凸顯了平衡全球發展需求與前沿安全考慮的必要性。
近期的國際對話從多個角度探討了集體行動和公共產品框架,作為應對人工智能發展帶來的全球挑戰的方法(見附錄 A),這表明人們越來越認識到這一概念在人工智能領域的應用值得認真考慮。這些討論研究了人工智能開發、部署和安全的不同方面如何在從地方到全球的各個層面被理解為公共產品。公共產品的視角揭示了在安全研究和基礎設施發展等關鍵領域的投資不足,以及在協調不同能力和優先事項的利益相關者行動方面的挑戰。將人工智能安全視為全球公共產品意味著確保人工智能系統安全的知識、措施和實踐應普遍可及、非排他性的,并且對所有人有益,無論個人貢獻或地理界限如何。
在迄今為止全球關于人工智能與治理的討論中,已經討論了許多潛在的框架。有人認為,人工智能技術本身可能構成全球公共產品,特別是在其應對氣候變化、公共衛生和可持續發展等領域集體挑戰的潛力方面。這種框架強調,當人工智能能力得到公平開發和部署時,它可以通過增強問題解決能力、改善資源分配和加速科學發現,為人類帶來非競爭性(一個國家的擁有不會減少另一個國家的擁有)和非排他性(一個國家無法阻止其他國家擁有)的利益。然而,最近的政策轉變,如 2025 年 1 月拜登政府限制國際人工智能技術轉讓的行政命令,可能挑戰了將人工智能視為全球公共產品的觀點,因為新興的保護主義措施實際上創造了排他性機制,可能將世界劃分為人工智能 “有者” 和 “無者”。相關地,人工智能系統能力水平的提高和擴散引發了對其開發和部署帶來的集體挑戰的擔憂。其中一些挑戰,如算法偏見和隱私問題,已經在當代人工智能系統中出現,而長期問題則涉及如何保持人類的自主性并防止災難性風險。
因此,確保先進人工智能系統的安全開發,即在保護其益處的同時防范人工智能系統的負面外部性,本身可能構成一項關鍵的全球公共產品。
本報告探討公共產品框架如何為管理人工智能相關風險和外部性提供信息,分析全球公共產品框架的理論基礎及其實際影響。該分析考慮責任和公平問題,探索這些框架如何幫助解決人工智能發展中的差距,同時確保廣泛參與安全工作。我們不主張具體的政策措施,而是尋求制定一個研究議程,為未來的治理工作和國際合作提供信息。
“全球公共產品”:國際進步的基礎框架
“全球公共產品”(GPG)的概念在現代經濟學和政策討論中已成為一個有力的分析框架,為應對跨越國界的集體挑戰提供了結構化的方法。理解這一框架在擁有先進人工智能的世界中的潛在應用,需要審視其核心特征以及對治理和協調的實際影響。
全球公共產品與傳統公共產品的不同之處在于其在全球范圍內提供利益,但具有相同的基本特征。“公共產品” 的本質區別如下表所示:
商品類型 | 競爭性 | 排他性 | 示例 |
私人物品 | 是 | 是 | 跨境石油儲備 |
俱樂部物品 | 否 | 是 | 衛星網絡、學術期刊 |
公共資源 | 是 | 否 | 海洋魚類資源、南極資源 |
公共物品 | 否 | 否 | 穩定的氣候、疾病根除、低風險的全球戰爭 |
此表突出了全球公共產品的兩個特征:非排他性和非競爭性,并指出了它們與其他類型商品的區別。一種具有競爭性和排他性的全球商品將是私人物品,如跨境石油儲備;一種具有排他性但非競爭性的商品將是俱樂部物品,如衛星網絡或學術期刊;一種具有非排他性但競爭性的商品將是公共資源,如海洋魚類資源或南極資源。而在國際背景下,非競爭性、非排他性的公共物品的例子包括穩定的氣候、疾病根除以及低風險的全球戰爭,這些利益影響著全球每個人,且一方的享用不會減少其對其他方的可用性。
將某些商品和服務視為 “全球公共產品”,對其在全球范圍內的資助、治理和公平分配具有重要意義。
雖然商品在不同分析層面都可以是公共的,包括社區、城市、國家或地區,但由于人工智能預計會產生全球影響以及相關的全球協調挑戰,本文將重點放在全球層面。市場可能無法充分提供人工智能安全保障,因為其益處是一種公共產品,單個公司無法完全獲取,而安全措施的成本是私人的,直接影響其底線。供應不足的挑戰源于在其他全球公共產品背景下觀察到的經典搭便車動態。個體行為者,無論是國家、公司還是研究機構,可能會對安全措施投資不足,因為他們知道可以從他人的安全投資中受益而無需承擔成本。鑒于安全措施不足可能帶來的全球范圍潛在危害,這種動態對于人工智能安全來說可能尤其令人擔憂。當多個行為者采取這種方法時,對安全的集體投資就會低于社會最優水平,可能導致對系統性風險、偏差或災難性故障的防范不足。
全球公共產品的概念強調,應對跨國挑戰既符合國家利益,也符合全球利益,這可能促使政府投入自身資源,并就市場往往供應不足的共享解決方案展開合作。就像氣候變化的情況一樣,盡管化石燃料存在負面外部性,但它們仍然占據主導地位;在 COVID-19 疫情中,關鍵醫療用品和公平的疫苗分配供應不足。
這個框架為協調和治理提供了幾個明顯的優勢:
- 協調合理性:該框架通過展示應對跨國挑戰如何與國家和全球利益保持一致,同時表明不協調的行動不太可能產生預期結果,為國際協調提供了經濟和政治上的合理性。
- 投資動力:這種框架將突出市場機制或單一國家的國內治理措施單獨使用可能導致全球公共產品供應不足,從而為加強公共投資提供論據。
- 制度架構:該框架借鑒氣候變化行動和公共衛生等其他領域的先例,為人工智能安全的提供提出了制度安排和資金機制。
- 特權群體動態:國家在某些全球公共產品方面可能充當 “特權群體”,即擁有足夠資源、能力和動機來提供公共產品并從中受益的行為者,無論其他方的貢獻或參與如何。在追求自身利益時,他們的行動仍可能帶來全球利益。這種框架可能會影響大國對待人工智能安全的方式:例如,他們可能會將其作為全球公共產品做出貢獻,同時采取獨立行動,比如制定和執行主要符合自身利益的標準,同時保持其技術優勢。然而,個別大國的單邊和不協調決策仍可能通過競爭互動引發進一步的競賽動態,并減少特權群體單獨行動所產生的全球公共產品。
一個關鍵問題出現了:哪些要素需要作為全球公共產品進行保護或提供?就像清潔空氣和氣候穩定是環境治理的基本全球公共產品一樣,確定人工智能發展中的核心公共產品為建立有效的治理機制和協調框架奠定了基礎。
確定人工智能領域的定義性公共產品
已有的全球公共產品,如清潔空氣、疾病控制和不存在跨國沖突,已成為集體行動的明確基礎。隨著人工智能系統變得越來越強大和普及,我們是否必須確定類似的需要集體保護的基本產品?這個問題涵蓋了人工智能作為公共產品的潛力以及其開發和部署帶來的集體挑戰。理解這些要素需要分析人工智能發展和安全的不同方面如何與現有的全球公共產品框架相契合。
先進人工智能中公共產品的多個維度
基本人類需求,如獲得清潔空氣和免受傳染病侵害,在政治領域被如此定義時,激發了對空氣污染和流行病的集體應對。然而,多次會議和對話已經確定了在先進人工智能背景下引起類似程度關注的類似要素,涉及技術、社會和治理維度。
本節旨在研究在先進人工智能的特定背景下,社會對獲取某些基本資源和環境的需求,以及擺脫極端不利全球狀況的需求。下表簡要概述了類似的政策領域,區分了核心全球公共產品、相應的社會需求、全球公共產品特征以及促進全球公共產品提供的補充工具。這將幫助我們在下一節中將全球公共產品框架應用于人工智能領域。
確定人工智能發展中基本公共產品的復雜性反映在不同國際行為者應對這一挑戰的方式上。近期的國際對話產生了一些重要聲明,試圖勾勒出與人工智能相關的公共產品,每個聲明都突出了集體行動的不同方面和方法(見表 3)。這些聲明的重點各不相同,從強調安全協議和驗證機制作為潛在的非競爭性、非排他性產品,到共享治理框架的可能益處。迄今為止,最突出的國際對話和聲明包括:
- 人工智能安全國際對話(IDAIS)威尼斯聲明:主要從技術安全措施的角度探討基本公共產品的問題。它將安全協議和驗證機制本身視為非競爭性、非排他性的益處,類似于清潔空氣對氣候穩定的基礎性公共產品作用。這種框架強調,安全措施一旦開發出來,理論上可以使所有人受益,而不會降低其對任何特定用戶的價值。
- 《關于全球包容性科學理解人工智能的曼哈頓宣言》:采取了更廣泛的視角,將科學知識本身確定為基本公共產品。這種方法表明,我們對人工智能能力、機遇和風險的集體理解構成了一種共享資源,隨著更廣泛的參與,其價值會不斷增長,類似于醫學知識在全球健康框架中作為公共產品的作用。
- 《人工智能安全作為全球公共產品報告》:采用了更全面的視角,將治理能力本身視為基本公共產品。這種方法強調,類似于核安全或航空領域的共享治理框架,可以通過跨境政策學習和協調提供非競爭性益處。它特別強調平衡發展在創建可持續治理結構中的重要性。
- 《聯合國人工智能高級別咨詢機構報告:為人類治理人工智能》:其建議可能采取了最廣泛的視角,確定了人工智能背景下多個相互關聯的公共產品層次。這個框架不僅包括技術安全和科學知識,還包括機構能力和發展基礎設施,這些都被視為需要集體行動的基本公共產品。
更多詳細比較見附錄 A。
雖然上述所有聲明和報告都認識到將全球公共產品框架應用于人工智能領域的潛在價值,但對這些不同概念化的深入分析,為國內實驗室、國家政府和國際機構如何獨特地理解人工智能與全球公共產品之間的關系,提供了重要見解。因此,有必要將表 2 中開發的框架應用于這些現有的關于人工智能和全球公共產品的國際聲明,以及在本文同行評審期間最近的研討會上討論的其他框架。在下表中,我們探索了從先進人工智能角度概念化全球公共產品的可能方式、它們的關鍵特征,以及支持的工具、資源和流程。
當專門將全球公共產品框架應用于人工智能安全時,分析框架與實施工具之間的區別變得尤為突出。將人工智能安全理解為全球公共產品,揭示了個體行為者對安全措施投資不足時出現的特定市場和協調失靈,而這些安全措施的益處超出了他們的直接控制范圍。例如,雖然強大的人工智能安全框架可能在全球產生非競爭性和非排他性的益處,但實現這一結果取決于特定的工具和資源,從技術標準到治理框架,而這些工具和資源本身可能具有排他性或競爭性。這一分析有助于解釋為什么將人工智能安全視為全球公共產品的不同框架,可能會強調不同的工具和資源來實現其提供。
人工智能全球公共產品框架 | 核心普遍利益 | 獲得 / 提供 | 擺脫 / 不存在 | 非競爭性特征 | 非排他性特征 | 促進全球公共產品的工具 |
技術安全 | 安全且可控的人工智能系統 | 技術安全協議;驗證機制;測試框架 | 不受控制的人工智能系統;災難性故障;系統性風險 | 安全協議對所有用戶平等有益;標準隨著更廣泛的采用而改進 | 技術標準可以全球共享;安全益處跨越國界 | 安全評估框架;驗證協議;應急響應系統 |
科學理解 | 對人工智能能力和風險的共享知識 | 研究基礎設施;科學合作;知識共享平臺 | 信息不對稱;碎片化理解;孤立研究 | 科學見解通過共享倍增;研究受益于多樣化的投入 | 知識可以公開獲??;科學發現使所有人受益 | 研究合作網絡;開放科學平臺;共享研究基礎設施 |
治理能力 | 有效的人工智能治理系統 | 治理框架;政策協調;利益相關者參與 | 治理失?。槐O管差距;協調失敗 | 治理知識使所有各方受益;最佳實踐通過共享得到改進 | 跨境政策學習;共享治理益處 | 政策協調平臺;多利益相關方框架;治理標準 |
發展基礎設施 | 公平的人工智能發展能力 | 技術基礎設施;培訓資源;開發工具 | 數字鴻溝;能力差距;資源不平等 | 基礎設施的益處隨著使用而倍增;知識共享提高價值 | 基本人工智能能力對所有人可用;開發資源可公開獲取 | 能力建設網絡;資源共享平臺;發展框架 |
人類能動性 | 人類自主權和尊嚴 | 有意義的人類選擇和控制;決策能動性 | 自動化壓迫;人類自主權喪失;算法歧視 | 對能動性的保護對所有人平等有益;保障措施隨著更廣泛的采用而加強 | 對人類能動性的影響影響所有人;無法排除在受保護自主權的益處之外 | 人類監督機制;能動性保護框架;權利保護工具 |
安全知識共享 | 集體人工智能安全專業知識 | 安全研究;最佳實踐;風險評估工具 | 知識差距;安全失??;系統性風險 | 安全知識隨著使用而增長;受益于多樣化的投入 | 安全見解使所有人受益;無法排除在知識益處之外 | 知識共享平臺;協作研究工具;最佳實踐庫 |
有益的人工智能系統 | 服務于人類利益的人工智能系統 | 安全且有益的人工智能應用;符合公共利益的人工智能工具 | 有害的人工智能應用;目標不一致的系統;負面外部性 | 人工智能應用的益處可以共享;價值隨著采用而增長 |
本文轉載自?????歐米伽未來研究所?????,作者:歐米伽未來研究所
