去太空訓練AI大模型,24小時太陽能供電的GPU明年上天
大模型的未來,其實是在天上?
為了跟上人工智能快速發展的步伐,最近全球都在爭搶 AI 算力,想得更遠的人(如 OpenAI CEO Sam Altman)甚至已經把問題想到了供電這一層。據說在 OpenAI 訓練新一代大模型時,計算集群甚至會對當地的電網造成沖擊。如果基礎設施能力提升的步伐不及 AI 技術發展,或許 AGI 的瓶頸會變成能源。
在這個時候,一家 Y-Combinator 投資的創業公司 Lumen Orbit 引發了人們的關注,他們發現在太空中組建 AI 計算集群是個好主意:可以直接利用太陽能、隨時隨地的被動冷卻,還有自由擴展的空間。
Lumen Orbit 建造太空數據中心的計劃已經提上了日程,該公司計劃明年發射第一顆衛星,還將每年發射一次更大的迭代,直到服務器總功率達到千兆瓦規模。
Lumen Orbit 已經在華盛頓州雷德蒙德建立了有效載荷制造工廠,設計并開始建造和測試第一艘航天器,其搭載的 GPU 會是有史以來發射到太空最快的 GPU,速度將要比當前發射到太空中的最強 GPU 快約 100 倍。第一顆衛星將是一顆 60 公斤的演示衛星,預計將于 2025 年 5 月作為 SpaceX 獵鷹 9 號火箭的共乘有效載荷發射,可用的微型數據中心則將在 2026 年進行發射。
該公司的 CEO Philip Johnston 表示,Lumen 正在與 Ansys 和 Solidworks 合作進行衛星設計和開發,并正在向聯邦通信委員會和國際電信聯盟提交申請。
雖然發射數據中心對于航天器運載能力的挑戰巨大,但從第一性原理出發,Lumen Orbit 已經開發了一系列概念設計,并且沒有發現任何難以克服的障礙。隨著 Starship 和 New Glenn 等新型、可復用、經濟高效的重型運載火箭即將投入使用,再加上在軌網絡的普及,軌道算力的設想或許將變得非常現實。
太空訓練大模型,有效率優勢
為什么要在太空建造 AI 算力集群呢?理論上來說,太空數據中心可全天候利用高強度太陽能,不受晝夜循環、天氣和大氣損耗(衰減)的影響。這使得邊際能源成本大大降低,與地面相比,運營成本大幅節省。
Lumen Orbit 為我們算了一筆賬,美國地面太陽能發電場的平均容量系數僅為 24%,相比之下,該公司提出的太空太陽能電池陣列的容量系數大于 95%,沒有晝夜循環,最佳面板方向垂直于太陽光線,不受季節或天氣的影響。因此,太空中的太陽能電池陣列產生的能量將是地球上相同陣列的 5 倍以上。
假設每發射一次 500 萬美元的火箭任務可轉換為 40 兆瓦的數據中心,太陽能電池的材料成本為每瓦 0.03 美元,均在 10 年內攤銷,我們將能夠獲得約 0.002 美元 / 千瓦時的等效能源成本。相比之下,美國、英國和日本的平均批發電力成本分別為 0.045 美元 / 千瓦時、0.06 美元 / 千瓦時和 0.17 美元 / 千瓦時。因此,軌道數據中心可以提供比當今能源價格更低能源。
下一個是散熱問題。外太空的「有效」環境溫度約為 - 270°C,相當于宇宙微波背景輻射的溫度。要利用深空作為散熱器來散發廢熱,需要避免太陽直射,設計一個可展開的散熱器。一塊保持在 20°C 的 1×1m 黑板可以向深空輻射約 850 瓦,這大約是太陽能電池板每平方米發電量的三倍。因此,這些散熱器的尺寸需要約為太陽能電池陣列的三分之一,具體取決于散熱器的配置。
在太空中,我們可以使用比常規高性能算力冷卻器更簡單、更高效的冷卻架構。據估計,我們可以實現與最先進的超大規模地面數據中心相當的 PUE。此外,某些軌道上的軌道數據中心幾乎沒有「環境溫度」波動(太陽輻射變化不超過約 0.2%),并且處于高度穩定的熱和機械環境中,這有助于熱控制和穩定性。
然后是可擴展性。軌道數據中心將解鎖地球上前所未見的下一代集群規模,發電量將遠超 GW 范圍。它們可以幾乎無限地線性擴展,不受地面項目的物理和規劃限制,可以在 3D 空間的各個方向上擴展。
如果按照大模型領域目前的趨勢繼續下去,從 2027 年開始,我們將需要數 GW 功率的集群來訓練最大的 LLM。假設一個 5 GW 集群將用于訓練 Llama 5 或 GPT-6 等模型,耗電量就直接超過了美國最大的發電廠供能。因此在當今的能源基礎設施條件下,這種集群根本是不可能運轉的,尋找新的方向對于訓練下一代人工智能模型至關重要。
在太空 AI 算力運行的過程中,其他衛星會將他們收集的數據發送給 Lumen Orbit 的星座,使用機載 GPU 進行推理,隨后輸出推理結果。
Lumen Orbit 并不是唯一一家致力于將數據中心送入軌道的公司:歐盟資助的項目 ASCEND 一直在研究太空數據中心的可行性,總部位于德克薩斯州的 Axiom Space 表示,它正在與 Kepler Space 和 Skyloom 合作,在 Axiom 的第一個太空艙上建立一個軌道數據中心,預計將于 2026-2027 年發射。
團隊成員
Lumen Orbit 于 2023 年底剛剛成立,公司創始人、CEO Philip Johnston 曾在 McKinsey & Co. 工作,負責國家航天局的衛星項目。Philip 擁有哈佛大學公共管理碩士學位、沃頓商學院工商管理碩士學位、哥倫比亞大學應用數學與理論物理碩士學位,他也是一名特許金融分析師(CFA)。
該公司的 CTO Ezra Feilden 擁有十年衛星設計經驗,專攻可展開太陽能電池陣列和大型可展開結構。Ezra 曾就職于空中客車防務與航天公司(SSTL)和牛津太空系統公司,參與過包括 NASA 的月球探路者號在內的任務。Ezra 擁有倫敦帝國理工學院材料工程博士學位。
首席工程師 Adi Oltean 曾任 SpaceX 首席軟件工程師,是 Starlink 網絡團隊的一員,曾為包括 Starship 在內的移動用戶提供 Starlink 服務。在此之前,他在微軟的大型 GPU 生產集群上部署了第一個大語言模型,在微軟工作的二十多年中,他曾獲得了 25 項專利。Adi 擁有布加勒斯特兩所頂尖大學的計算機科學和化學學位。