以分布式網絡串聯閑置GPU,這家創企稱可將AI模型訓練成本降低90%
Monster API利用采礦設備等GPU算力來訓練AI模型
GPU通常用于挖掘比特幣等加密貨幣,而挖礦是一種資源密集型的過程,需要強大的計算能力。
加密貨幣炒作一度導致市場上GPU短缺,隨著價格飆升,企業和個人轉向采用英偉達(Nvidia) 為游戲行業提供的GPU,并將其轉變為加密挖礦設備專用的GPU。
然而隨著加密貨幣熱潮的消退,許多加密挖礦設備關閉甚至被廢棄。這讓Monster API創始人Gaurav Vij意識到,他們可以重新改變和調整這些設備的用途,以適應最新的計算密集型發展趨勢,也就是訓練和運行AI基礎模型。
雖然這些GPU并不具備AWS或谷歌云等部署的專用AI設備的強大功能,但Gaurav Vij表示,它們能夠訓練優化的開源模型,其成本僅為使用云計算提供商使用的超大規模計算設備的一小部分。
Monster API聯合創始人Saurabh Vij表示:“機器學習領域實際上正在與計算能力作斗爭,因為需求已經超過了供應。大多數機器學習開發人員如今都依賴AWS、谷歌云、微軟Azure來獲取資源,最終花費了大量資金。”
分布式算力網絡可以大幅降低AI基礎模型訓練成本
實際上,除了加密采礦設備之外,在PlayStation 5等游戲系統和較小的數據中心中也可以找到未使用的GPU。Saurabh Vij表示:“加密采礦平臺采用GPU,而游戲系統也采用GPU,且GPU的功能每年都會變得更加強大。”
企業和個人的算力匯入分布式網絡需要經歷包括數據安全檢查在內的一系列流程。需求方根據需求添加設備,擴展和縮小算力網絡。供應方可以從出售閑置算力中獲得了一部分收入。
Saurabh Vij強調,分布式計算系統將AI基礎模型的訓練成本降低到了將來可以由開源和非營利組織訓練的程度,而不僅僅是財力雄厚的大型科技公司。“如果建立一個AI基礎模型需要100萬美元,那么像我們這樣的去中心化網絡只需要10萬美元。”
極客網獲悉,Monster API現在還提供“無代碼”工具來微調模型,并向那些沒有技術專長或資源的用戶開放,讓他們從頭開始訓練模型,進一步“民主化”計算能力和AI基礎模型。
“微調非常重要,因為大量的開發者沒有足夠的數據和資金來從頭開始訓練模型。”他表示,通過優化,Monster API已將微調成本削減90%,使得每個模型的微調費用約為30美元。
開源模型訓練可以幫助開發人員利用AI進行創新
雖然AI開發商面臨迫在眉睫的監管,這可能會直接影響到這些訓練模型和開源,但Saurabh Vij認為開源模型訓練有其積極意義。Monster API已經認識到有必要在其分散的網絡中管理潛在風險,并確保“可追溯性、透明度和問責制”。
“在短期內,也許監管機構會獲勝,但我對開源社區非常有信心,它的發展非常非常快。在Postman (API開發平臺)上有2500萬注冊開發人員,其中很大一部分正在構建生成式AI,這為所有人開辟了新的業務和新的機會。”他表示。
極客網了解到,通過訓練低成本的AI模型,Monster API的目標是讓開發人員最大限度能夠利用機器學習進行創新。目前他們已經有了一些知名的AI模型(例如Stable Diffusion和Whisper)可以進行微調,此外用戶還可以使用這些GPU算力從頭開始訓練自己的AI基礎模型。
Saurabh Vij介紹稱:“我們已經在Macbook上進行了文圖生成實驗,每分鐘至少可以輸出10張圖像。我們希望在網絡上接入數百萬臺Macbook,讓用戶在睡覺時也能使用他們的Macbook運行Stable Diffusion、Whisper或其他AI模型獲利。
“最終,Playstation、Xbox、Macbook都將成為強大的計算資源,甚至是特斯拉汽車——因為特斯拉汽車也采用了強大的GPU,而且大多數時候停在車庫中。”Saurabh Vij補充道。