成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

太酷了!iPhone、iPad、MacBook老舊設備組成異構集群,能跑Llama 3

人工智能 新聞
將 iPhone、iPad、Macbook 進行組合,就能組裝成「異構集群推理方案」, 然后順暢的運行 Llama3 模型。

這次,你手里的硬件設備也能在 AI 領域大展拳腳了。

將 iPhone、iPad、Macbook 進行組合,就能組裝成「異構集群推理方案」, 然后順暢的運行 Llama3 模型。

圖片

值得一提的是,這個異構集群可以是 Windows 系統,也可以是Linux、iOS 系統,并且對 Android 的支持很快到來。

圖片

異構集群正在運行中。

根據項目作者 @evilsocket 的介紹,這個異構集群包括 iPhone 15 Pro Max、iPad Pro、MacBook Pro (M1 Max)、NVIDIA GeForce 3080、2x NVIDIA Titan X Pascal。所有代碼都已經上傳到 GitHub。

看到這,網友紛紛表示,這位老哥確實不簡單。

圖片

不過也有網友開始擔心能耗問題,暫且不管速度,電費都耗不起。來回搬數據,損耗太大了。

圖片

圖片

項目介紹


上述功能的實現,離不開一個名為 Cake 的 Rust 框架。Cake 可以完成大模型(例如 Llama3)的分布式推理,旨在將消費級硬件組合成異構集群,其中消費級硬件采用多種操作系統,包括:iOS、Android、macOS、Linux 和 Windows,從而使 AI 更易于訪問。

圖片

項目地址:https://github.com/evilsocket/cake

Cake 的主要思路是將 transformer 塊分片到多個設備,以便能夠讓通常不適合單個設備 GPU 內存的模型運行推理。對同一工作線程上的連續 transformer 塊的推理是分批進行的,以便最大限度地減少數據傳輸造成的延遲。

Cake 目前支持的系統和設備如下:

圖片

編譯

安裝 Rust 后,運行下列代碼:

cargo build --release

假如用戶想要在應用程序中生成 iOS 綁定,可以進行下述操作:

make ios

使用

運行 worker 節點:

cake-cli --model /path/to/Meta-Llama-3-8B \ # model path, read below on how to optimize model size for workers
         --mode worker \                    # run as worker
         --name worker0 \                   # worker name in topology file
         --topology topology.yml \          # topology
         --address 0.0.0.0:10128            # bind address

運行 master 節點:

cake-cli --model /path/to/Meta-Llama-3-8B \
         --topology topology.yml

其中 topology.yml 確定哪些層由哪個 worker 提供服務:

linux_server_1:
  host: 'linux_server.host:10128'
description: 'NVIDIA Titan X Pascal (12GB)'
layers:
    - 'model.layers.0-5'
linux_server_2:
  host: 'linux_server2.host:10128'
description: 'NVIDIA GeForce 3080 (10GB)'
layers:
    - 'model.layers.6-16'
iphone:
  host: 'iphone.host:10128'
description: 'iPhone 15 Pro Max'
layers:
    - 'model.layers.17'
ipad:
  host: 'ipad.host:10128'
description: 'iPad'
layers:
    - 'model.layers.18-19'
macbook:
  host: 'macbook.host:10128'
description: 'M1 Max'
layers:
    - 'model.layers.20-31'

關于內存和磁盤空間優化問題,用戶可能希望只向 worker 提供模型中實際需要的數據,而不是整個文件夾,在這種情況下,可以使用 cake-split-model 。例如,要生成較小版本的 llama3 safetensors,可以采用如下代碼:

cake-split-model --model-path path/to/Meta-Llama-3-8B \ # source model to split
                 --topology path/to/topology.yml \      # topology file
                 --output output-folder-name
責任編輯:張燕妮 來源: 機器之心
相關推薦

2017-05-16 12:42:12

服務器

2013-10-16 14:16:45

iPhone 3GSiOS 7

2011-03-09 10:21:35

2022-03-23 09:55:14

PythonGUI代碼

2020-03-04 10:54:54

開源技術 數據

2010-01-15 10:41:20

2012-07-25 10:01:52

蘋果Q3財報

2011-08-05 16:58:25

iPad iPhone UIImagePic

2011-06-03 09:41:22

蘋果iPhoneiPad

2024-07-16 09:41:01

2024-02-19 07:42:41

pythonAndroid

2024-04-23 07:00:00

2019-08-07 15:11:27

iPad電腦集線器

2022-01-19 08:08:17

局域網異地設備

2018-06-29 15:38:55

iOS 12iPhoneiPad

2011-07-06 15:59:38

iPad iPhone iOS

2011-12-13 14:15:26

微軟OneNoteiPad

2012-05-01 21:27:55

圖標

2024-04-23 13:10:41

數據訓練

2017-03-09 10:07:04

Ubuntu系統技巧
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产一区二区中文字幕 | 久久国产精品视频 | 不用播放器看的av | 中文字幕乱码亚洲精品一区 | 夜夜骑综合 | 日韩精品视频中文字幕 | 久草免费在线视频 | 亚洲一区二区三区免费在线观看 | 国产精品久久久久无码av | 国产视频亚洲视频 | 久草网址 | 久久精品中文字幕 | 久久久久久91 | 亚洲国产成人精品久久久国产成人一区 | 日韩欧美国产精品一区二区三区 | 男女免费在线观看视频 | 天堂一区二区三区 | 欧美一区二区小视频 | 伊人伊人 | 国产精品区二区三区日本 | 久久中文字幕一区 | 国产精品观看 | 精品综合久久久 | 日韩视频免费 | 久久亚洲国产精品日日av夜夜 | 精品一区av | av影音| 欧美日韩精品一区二区三区四区 | 一级看片免费视频囗交动图 | 久久久精品一区二区三区四季av | 99精品99久久久久久宅男 | 特级做a爰片毛片免费看108 | 天天综合天天 | 一区二区三区免费观看 | 999久久久久久久久6666 | 亚洲二区在线观看 | 国产成人久久精品一区二区三区 | 国产成人亚洲精品自产在线 | 污视频免费在线观看 | 美国黄色毛片 | 99精品久久久久久中文字幕 |