魔搭社區與浦數平臺達成深度合作,引入超7000開源數據集
6月20日消息,魔搭社區與浦數人工智能開放數據平臺OpenDataLab達成深度合作,魔搭社區開發者將可直接調用浦數平臺上超7000個開源數據集,以高質量數據加速AI大模型研發。
數據和模型的融合是推動AI技術發展的核心動力。整合各類關鍵資源,構建一個高效、協同的開發環境,成為加速中國AI應用創新的關鍵。基于這一理念,聚焦開源數據的浦數平臺與聚焦開源模型的魔搭社區達成深度合作,實現底層接口打通,共同推動模型與數據的無縫對接,為中國開發者打造從數據獲取、模型下載、模型調優到部署應用的一站式開發體驗,降低AI創新門檻。
浦數平臺OpenDataLab是上海人工智能實驗室在WAIC 2022大會上發布的人工智能開源開放體系的核心項目之一,致力于為國產大模型提供高質量的開放數據資源。目前,浦數平臺已匯聚7700多個大模型相關的優質、開源數據集,覆蓋計算機視覺、自然語言處理、多模態、通用機器學習、音頻識別等領域800多種任務類型。
魔搭社區是阿里云2022年牽頭成立的AI模型開源社區,在業界首個提出了MaaS模型即服務的理念。經過一年多的發展,魔搭已成為國內最活躍的開源模型社區,也是中國眾多大模型開源的首發平臺,此前已匯聚4500多款優質模型及上千開源數據集,為超過500萬開發者提供模型及免費算力服務。
本次合作后,浦數平臺和魔搭社區在數據存儲、數據展現、工具鏈等技術層面,實現了互聯互通。用戶可以在魔搭社區上直接下載和管理從浦數平臺遷移過來的數據集,或在魔搭訓練推理框架中直接調用相關數據對模型進行微調。新引入的海量開源數據集,將極大豐富魔搭平臺上的數據資源,讓開發者選模型、找數據一站搞定。