玩轉大模型!用Replicate一鍵部署 原創
Replicate是一個云端的機器學習模型運行平臺。它可以讓用戶使用云端API 直接運行機器學習模型,而無需了解復雜的機器學習模型內部構造。
Replicate允許用戶在Python或Jupyter Notebook中運行模型,并在云端進行模型的部署和調優。你可以用它運行他人發布的開源模型,也可以打包并發布自己的模型。使用Replicate,你只需一行代碼就可以生成圖像、運行和調優開源模型,以及部署自定義模型。通過在Python代碼中調用Replicate的API,你可以在Replicate上運行模型,并獲取模型的預測結果。
模型預測如何工作
無論何時運行一個模型,都是在創建一個模型預測。模型預測是使用建立的模型對新數據進行預測的過程。在模型預測中,我們使用已經訓練好的模型來預測未知數據的結果。這個過程可以通過輸入新數據到模型中,并獲得模型的輸出來完成。
有些模型運行速度很快,幾毫秒內就能返回結果。另外一些模型運行時間較長,尤其是生成模型,比如根據文本提示生成圖像的模型。
對于這些運行時間較長的模型,你需要輪詢 API 來檢查預測的狀態。模型預測可以有以下任何一種狀態:
- 開始:預測正在啟動。如果該狀態持續的時間超過幾秒鐘,那么通常是因為正在啟動一個新的線程來運行預測。
- 處理:模型的 predict() 方法正在運行。
- 成功:預測成功完成。
- 失敗:預測在處理過程中遇到錯誤。
- canceled(取消):用戶取消了預測。
登錄后,你可以在儀表板上查看預測列表,其中包含狀態、運行時間等摘要:
如何在瀏覽器中運行模型
你可以使用云端 API 或網頁瀏覽器在 Replicate 上運行模型。網頁能讓你直觀地看到模型的所有輸入,并生成一個表單,可直接從瀏覽器運行模型,如下所示:
如何使用 API 運行模型
網頁非常適合用來理解模型,但當你準備將模型部署到聊天機器人、網站或移動應用中時,API 就能發揮作用了。
Replicate的HTTP API 可與任何編程語言配合使用,而且還有 Python、JavaScript 和其他語言的客戶端庫,讓 API 的使用更加方便。
使用 Python 客戶端,只需幾行代碼即可創建模型預測,首先安裝Python庫:
pip install replicate
通過在環境變量中設置令牌來進行身份驗證:
export REPLICATE_API_TOKEN=<paste-your-token-here>
然后你可以通過 Python 代碼在 Replicate 上運行任何開源模型。下面的示例運行了 stability-ai/stable-diffusion:
import replicate
output = replicate.run(
"stability-ai/sdxl:39ed52f2a78e934b3ba6e2a89f5b1c712de7dfea535525255b1aa35c5565e08b",
input={"prompt": "An astronaut riding a rainbow unicorn, cinematic, dramatic"}
)
# ['https://replicate.delivery/pbxt/VJyWBjIYgqqCCBEhpkCqdevTgAJbl4fg62aO4o9A0x85CgNSA/out-0.png']
本文轉載自公眾號AIGC開發者,作者:阿橙AIGC
