北京擬對 AI 訓練所需的算力推行統籌供給,整合大模型中文語料庫
5 月 17 日消息,北京市于 5 月 12 日發布了關于對《北京市促進通用人工智能創新發展的若干措施(2023-2025 年)(征求意見稿)》(下稱《征求意見稿》)公開征集意見的公告,擬對 AI 訓練所需的算力推行統籌供給。
《征求意見稿》提出,加強算力資源統籌供給能力,加強與頭部公有云廠商等市場主體合作,實施算力伙伴計劃,并確定首批伙伴計劃成員,明確供給技術標準、軟硬件服務要求、算力供給規模、優惠策略等,向在京高校院所和中小企業公布一批優質算力供應商。
《征求意見稿》稱,利用政府統一入口,降低公有云采購成本,普惠中小企業,同時減少企業分別面對不同云廠商的溝通成本。針對彈性算力需求,建設統一的多云算力調度平臺,實現異構算力環境統一管理、統一運營,方便企業在不同云環境上無縫、經濟、高效地運行各類人工智能計算任務。建設北京與河北、天津、山西、內蒙古等省(市)算力集群的直連基礎光傳輸網絡,進一步提升平臺對四地算力資源感知能力,探索開展算力交易。
《征求意見稿》還表示,針對目前大模型訓練高質量中文語料占比過少,不利于中文語境表達及產業應用的問題,整合現有開源中文預訓練數據集和高質量互聯網中文數據并進行合規清洗。同時持續擴展高質量多模態數據來源,建設合規安全的中文、圖文對、音頻、視頻等大模型預訓練語料庫,通過北京國際大數據交易所社會數據專區進行定向有條件開放。
IT之家附《北京市促進通用人工智能創新發展的若干措施(2023-2025 年)(征求意見稿)》完整文件:點此查看