計算人工智能的碳成本
如果您正在尋找有趣的話題,那么人工智能 (AI) 不會讓您失望。人工智能包含一組強大的令人費解的統(tǒng)計算法,可以下棋、破譯潦草的筆跡、理解語音、分類衛(wèi)星圖像等等。用于訓練機器學習模型的巨型數(shù)據(jù)集的可用性一直是人工智能成功的關鍵因素之一。但所有這些計算工作都不是免費的。一些人工智能專家越來越關注與構建新算法相關的環(huán)境影響,這場辯論引發(fā)了關于如何讓機器更有效地學習以減少人工智能碳足跡的新想法。
回到地球
要深入了解細節(jié),我們首先需要考慮數(shù)以千計的數(shù)據(jù)中心(遍布世界各地),它們24小時全天候處理我們的計算請求。對于人工智能研究人員來說,這些任務包括訓練具有數(shù)十億數(shù)據(jù)元素(或標記——在英語中相當于四個字符或大約 3/4 個單詞的單詞位)的多層算法。所涉及的計算工作令人驚訝。人工智能基礎設施公司 Lambda 提供了一些關于 GPT-3(OpenAI 用于生成類人文本的強大自然語言模型)的有趣事實。根據(jù) Lambda 的分析,如果您希望在單個 NVIDIA RTX 8000 上訓練 GPT-3 的 1750 億參數(shù)模型,則需要 665 年,這在顯卡方面毫不遜色。
簡單來說,模型越大,性能就越好,Lambda 的團隊指出,state-of-the-art 語言模型的規(guī)模每年以 10 倍的速度增長,這讓我們回到了對 AI 增長的擔憂碳足跡。回到數(shù)據(jù)中心,有可能在討論中添加更多數(shù)字,至少在高層次上是這樣。根據(jù)國際能源署 (IEA) 的估計,全球數(shù)據(jù)中心的總用電量在 200 到 250 TWh 之間。為了使這個數(shù)字更容易可視化,假設機車和機車車輛平均每公里行駛消耗 2.5 千瓦時,225 太瓦時足以讓高速電動火車行駛 900 萬公里。雖然只有一部分(在數(shù)據(jù)中心)將用于訓練和運行 AI 模型,但消息來源表明,機器學習和訓練的計算需求正在超過數(shù)據(jù)中心活動的平均增長速度。
在這一點上,公平地承認數(shù)據(jù)中心在管理其能源需求方面做得很好——環(huán)境問題是一個動力,但值得一提的是,電力是一項重大的運營費用,對每個設施來說都是“關鍵任務” .盡管全球互聯(lián)網(wǎng)流量激增,僅在 2020 年就增長了 40%,但數(shù)據(jù)中心的能源使用在過去十年中保持相對穩(wěn)定。 “數(shù)據(jù)中心服務需求的強勁增長繼續(xù)被服務器、存儲設備、網(wǎng)絡交換機和數(shù)據(jù)中心基礎設施的持續(xù)效率提升以及高效云和超大規(guī)模數(shù)據(jù)所滿足的服務份額不斷增長所抵消。中心,”IEA 寫道。
光子等等
此外,垂直整合的數(shù)據(jù)中心運營商,如亞馬遜、谷歌、Facebook 等,將很快補充說他們的設施由可再生能源供電。自然地,這減輕了數(shù)據(jù)處理對環(huán)境造成的負擔,因為為計算硬件機架和必要的輔助服務(如加熱、冷卻和照明)供電的電力可以來自太陽和風。然而,正如英國《金融時報》未選擇的那樣,即使數(shù)據(jù)中心能源協(xié)議可能通過可再生能源抵消其 100% 的電力消耗,但在風能和太陽能不可用時,設施可能仍會消耗化石燃料。還需要考慮計算設備本身的嵌入式碳排放,這是因為制造方法和零部件材料采購活動也會產(chǎn)生碳排放——微軟承認這一點。
今年早些時候,微軟在最近的一篇博文中討論了高效模型訓練的話題。開發(fā)人員正忙于探索縮小人工智能碳足跡的方法——或者至少是抑制其增長。這里的步驟包括尋找在模型微調(diào)期間減少計算和內(nèi)存需求的方法,建議建議在該過程的這個階段將 GPU 使用量減少三倍。模型壓縮也顯示出了希望,其中 AI 數(shù)據(jù)的子層被修剪成更稀疏但仍具有代表性的先前組合條件的版本。在這里,研究表明,壓縮模型可能需要減少約 40% 的訓練時間,同時實現(xiàn)類似的算法效果。
開發(fā)人員還可以從監(jiān)控工具中受益,這些工具將查明通過優(yōu)化代碼或數(shù)據(jù)托管安排所獲得的收益。 “CodeCarbon 是一個輕量級的軟件包,可以無縫集成到你的 Python 代碼庫中,”免費提供他們的工具的發(fā)明者寫道。 “它估計了用于執(zhí)行代碼的云或個人計算資源產(chǎn)生的二氧化碳 (CO2) 量。”
完整的循環(huán)
循環(huán)往復,未來可能會部署更節(jié)能的人工智能,以幫助指導更高效的數(shù)據(jù)中心運營,以降低——你猜對了——人工智能的碳足跡。如今,Cirrus Nexus 提供了可用的軟件,數(shù)據(jù)中心運營商可以使用該軟件來為碳分配成本,并通過人工智能算法進行傳播。結果不僅顯示了二氧化碳計算,還提供了對用戶可以配置其設施以最大化可用環(huán)境收益的方式的洞察。
使支持當今技術的算法的碳足跡可見,這在多個方面都有幫助。它正在就培訓未來人工智能的最有效方式展開討論,讓 IT 部門及其客戶對計算的環(huán)境成本承擔更多責任。最后,它可能對企業(yè)有利。引人注目的是,亞馬遜今年早些時候發(fā)布了客戶碳足跡工具,谷歌等其他大公司也允許客戶導出云碳排放信息——這項服務目前處于預覽階段。