不妨一試！這六種在智能手機上運行的開源LLM 原創

51CTO內容精選

發布于 2024-7-10 08:42

瀏覽

0收藏

您可以在不使用互聯網的情況下，利用智能手機上LLM 的強大功能，最大限度地加強隱私和控制。

大語言模型(LLM)需要大量的計算資源，這些資源通常局限于功能強大的服務器。然而，新一代的緊湊模型讓您可以直接在智能手機上運行這些強大的語言模型。有意思的是，您不需要互聯網就可以在智能手機上使用LLM。

下面這六種開源LLM經訓練和優化后，可以在智能手機上使用。

Gemma 2B：谷歌針對移動語言任務的緊湊型高性能LLM。
Phi-2：微軟的小型模型比規模大25倍的大型模型表現得還好。
Falcon-RW- 1B：面向資源受限的移動設備的高效1B參數模型。
StableLM-3B：Stability AI兼顧性能和效率的模型，用于處理手機上的各種語言任務。
TinyLlama：緊湊版Llama模型，在手機上提供出色的結果。
LLaMA-2-7B：Meta功能強大的7B模型，用于處理高端智能手機上的高級任務。

1. Gemma 2B

谷歌的Gemma 2B是一種緊湊型語言模型，盡管小巧，卻提供了出色的性能。它利用多查詢注意力機制，有助于減少推理期間對內存帶寬的需求。

這尤其有利于內存帶寬通常有限的設備端場景。僅用20億個參數，Gemma 2B在語言理解、推理和安全等方面的學術基準測試上取得了出色的成績。

在18項基于文本的任務中，它在11項上的表現勝過大小相似的開放模型。

2. Phi-2

Phi-2有27億個參數，在某些基準測試中，其性能比大25倍的模型更勝一籌。它擅長處理涉及常識推理、語言理解和邏輯推理的任務。

Phi-2可以量化到更低的位寬，比如4位或3位精度，從而將模型大小顯著縮小到1.17GB-1.48 GB，以便在內存和計算資源有限的移動設備上高效運行。

Phi-2的主要優點之一是它能夠執行常識推理。該模型已使用龐大的互聯網數據語料庫進行了訓練，因而能夠理解并推理日常概念和關系。

3. Falcon-RW-1B

Falcon-RW-1B是Falcon語言模型系列的一部分，以高效和性能出名。RW代表“精煉的Web”，表示篩選的訓練數據集注重質量而非數量。

Falcon-RW-1B的架構改編自GPT-3，但結合了ALiBi(具有線性偏差的注意力)和FlashAttention等技術來提高計算效率。這些優化機制使得Falcon-RW-1B非常適合在智能手機等資源受限的設備上進行設備端推理。

Falcon-RW-1B-Chat模型旨在為Falcon-RW-1B-Instruct-OpenOrca模型增加會話功能，以提高用戶參與度、擴大使用范圍，并為智能手機等資源受限的環境提供可訪問性。

4. StableLM-3B

StableLM-3B由Stability AI開發，有30億個參數的模型，兼顧了性能和效率。StableLM-3B最大的優點在于，盡管使用較少的token進行訓練，但在一些基準測試中，其表現勝過使用70億個參數進行訓練的模型。

StableLM-3B可以量化到更低的位寬，如4位精度，將模型大大顯著縮小到3.6 GB左右，使其可以在智能手機上高效運行。有用戶提到，StableLM-3B的性能超過了Stable自己的7B StableLM-Base-Alpha-v2。

5. TinyLlama

TinyLlama利用FlashAttention和RoPE位置嵌入等優化機制來提高計算效率，同時保持強大的性能。它與Llama架構兼容，可以整合到基于Llama的現有移動應用程序中，基本上不需要改動。

TinyLlama可以量化到更低的位寬，比如4位或5位精度，將模型大小顯著縮小到550MB-637 MB左右。一位用戶在分享使用TinyLlama方面的經驗時提到，在華碩ROG之類的中端手機上，TinyLlama每秒可以生成6-7個token。

6. LLaMA-2-7B

LLaMA-2-7B模型量化到4位寬和16位激活，使其適用于智能手機上的設備端部署。這種量化將模型大小縮小到3.6GB，從而可以在內存充足的移動設備上加載和運行。

移動端的LLaMA-2-7B模型需要設備至少有6GB內存。在推理過程中，三星Galaxy S23 Ultra上的峰值內存使用量在316MB到4785MB。這表明，雖然該模型可以在6GB以上內存的設備上運行，但擁有更大的內存可以獲得更好的性能，并降低內存不足錯誤的風險。

雖然LLaMA-2-7B模型需要設備有足夠的內存，其速度可能無法與基于云的模型相匹配，但它為希望創建直接在智能手機上運行的基于語言的智能功能的開發人員提供了一個誘人的選擇。

原文標題：6 Open-Source LLMs That Can Run on Smartphones，作者：Sagar Sharma

鏈接：https://analyticsindiamag.com/6-open-source-llms-that-can-run-on-smartphones/

?著作權歸作者所有，如需轉載，請注明出處，否則將追究法律責任

標簽

LLM

大語言模型

開源

已于2024-7-10 09:45:09修改

贊

回復

舉報

回復

相關推薦

這28種方法值得一看

51CTO技術棧 ? 3038瀏覽 ? 0回復
LLM4CS：一種利用LLM提升多輪會話檢索的效果的方案

arnoldzhw ? 1.1w瀏覽 ? 0回復
大模型應用的六種架構模式，你知道幾種？

玄姐聊AGI ? 5376瀏覽 ? 0回復
手機流暢運行470億大模型：上交大提出PowerInfer-2引領智能手機大模型推理新紀元

AI論文解讀 ? 4940瀏覽 ? 0回復
微軟開源Phi-3.5：支持手機、平板電腦，性能超Llama 3.1

Aceryt ? 2471瀏覽 ? 0回復
一種將RAG、KG、VS、TF結合增強領域LLM性能的框架

PaperAgent ? 3034瀏覽 ? 0回復
提升人工智能性能的三種關鍵的LLM壓縮策略

51CTO內容精選 ? 2207瀏覽 ? 0回復
如何借助Cortex運行本地LLM

51CTO內容精選 ? 2132瀏覽 ? 0回復
微軟發布LLM2CLIP：一種新型AI技術，LLM成為CLIP視覺編碼器的“老師”

Halo咯咯 ? 4063瀏覽 ? 0回復
如何在安卓手機上本地安裝和運行LLM?

51CTO內容精選 ? 9279瀏覽 ? 0回復
LLM 分布式訓練六大關鍵技術介紹

Baihai_IDP ? 3047瀏覽 ? 0回復
Google 的六大人工智能更新 – 2024 年綜述

Halo咯咯 ? 4381瀏覽 ? 0回復
在個人電腦上運行Llama 3 70B大規模模型指南

丟翅膀的魚 ? 4305瀏覽 ? 0回復
OpenAI將開源 o3-mini，或適合手機大模型

Aceryt ? 1966瀏覽 ? 0回復
LLM Agent 協作評估難？這 3 款評估監控工具來幫忙

Baihai_IDP ? 2565瀏覽 ? 0回復
基于瀏覽器運行的 Ollama WEB客戶端開源發布

V0ne ? 1992瀏覽 ? 0回復
別慌一文讀懂AI智能體常見的九種設計模式

數字化助推器 ? 3662瀏覽 ? 0回復
這十種方法你一定要知道

Halo咯咯 ? 1817瀏覽 ? 0回復
大語言模型（LLM）是如何思考的？講講推動下一代人工智能推理的五種途徑

51CTO內容精選 ? 1284瀏覽 ? 0回復

51CTO內容精選

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

51CTO

51CTO博客

51CTO學堂