千萬不要為了節(jié)約成本而選擇小模型，特別是開源模型原創(chuàng)

AI探索時代

發(fā)布于 2024-10-18 15:30

瀏覽

0收藏

?“ 大模型和小模型是從功能上來區(qū)分的，而不是參數(shù)上 ”

我們在工作的過程中，應(yīng)該多多少少都遇到過這樣的事情；那就是老板為了節(jié)省成本，然后找了一些不專業(yè)或者一些漏洞百出的工具給我們用；最后的結(jié)果就是成本沒節(jié)約下來，然后還出了一大堆亂七八糟的事。

這可真的是羊肉沒吃著，還惹了一身騷；成本沒節(jié)約，最后還耽誤時間，身心俱疲。

為什么不建議使用小模型？

首先聲明一下，這里的小模型不是指參數(shù)體量小的模型，是指功能太差，無法滿足業(yè)務(wù)場景的模型；更有甚者很多小企業(yè)老板會選擇一些開源模型，自己部署，就為了省錢。

但他們卻不知道，這里的“節(jié)省成本”并沒有真正節(jié)省成本，反而大大地增加了成本。

使用小模型會面臨著哪些問題？

使用小模型最大的問題就是，其性能不足，而且由于沒有專業(yè)的團(tuán)隊(duì)維護(hù)，導(dǎo)致其會出現(xiàn)各種亂七八糟的問題。

以作者本人來說，公司最近的一個AIGC(AI生成內(nèi)容)產(chǎn)品中，有一個文字生成視頻的功能，這也是大模型應(yīng)用中比較常見的一個功能。

千萬不要為了節(jié)約成本而選擇小模型，特別是開源模型-AI.x社區(qū)

然后使用的就是社區(qū)里的一個開源模型，而這種開源模型只能自己來部署，因此還專門買了算力機(jī)去部署。

而關(guān)于大模型的部署與運(yùn)維，在前面的文章中也提到過，復(fù)雜性和工作量就不用細(xì)說了，感興趣的可以查看文章??關(guān)于大模型在企業(yè)生產(chǎn)環(huán)境中的獨(dú)立部署問題??。

關(guān)于這個文字生成視頻的功能，說句實(shí)話，浪費(fèi)了大量時間和精力開發(fā)的產(chǎn)品，效果真的是一言難盡；而且，這個模型使用的還不是傳統(tǒng)的類似sora這種真正的視頻生成模型，而更像是生成一張圖片，然后增加了動態(tài)的效果。

而且，不只是模型本身的效果問題，也是為了節(jié)約成本選擇的算力機(jī)并不是知名企業(yè)提供的算力，而是找的一個不知名企業(yè)的算力云機(jī)器，結(jié)果就是性能差的要死；跑在上面的服務(wù)經(jīng)常莫名其妙的被殺掉，系統(tǒng)莫名其妙的重啟。

而這就間接導(dǎo)致了各種各樣的莫名其妙的問題，然后就需要浪費(fèi)大量的時間和精力去排查；看到這里有些人可能會說，知道是算力機(jī)不穩(wěn)定，肯定先查算力機(jī)啊？

但事實(shí)上問題出現(xiàn)的表象和算力機(jī)一點(diǎn)關(guān)系都沒有，甚至你會懷疑是不是自己代碼寫的有問題，亦或者是不是某個中間件出問題了。

而這種亂七八糟，奇奇怪怪的問題不但耽誤大量的時間和精力，最重要的是它會讓我們特別的煩躁；本來簡簡單單就能解決的問題，然后中間出現(xiàn)一堆莫名其妙的bug，耽誤進(jìn)度，更影響心情。

最重要的一點(diǎn)是什么？

人的時間和精力都是有限的，當(dāng)你把大量的時間和精力浪費(fèi)在一些亂七八糟的事情之上后，你的核心業(yè)務(wù)就會受到影響。

千萬不要為了節(jié)約成本而選擇小模型，特別是開源模型-AI.x社區(qū)

首先，使用小模型帶來的各種各樣的問題，直接導(dǎo)致你本來有半年的時間開發(fā)核心功能，結(jié)果被奇奇怪怪的bug耽誤了一大半時間；然后核心功能可能就會被做的亂七八糟的，甚至是匆匆忙忙的上線。

然后，技術(shù)人員就不得不花大量的時間去四處救火，最后形成惡性循環(huán)。

在前面的文章中作者曾說過，大模型+小模型是現(xiàn)在企業(yè)開發(fā)的主流模式；這里說的大模型+小模型是指性能足夠的前提下，而不是說你隨便找一個根本無法滿足業(yè)務(wù)需求的模型，不但如此還要花費(fèi)大量的時間去運(yùn)維，這就更不值得了。

在基于大模型開發(fā)上層應(yīng)用的過程中，除了大模型服務(wù)商之外，對絕大部分企業(yè)來說，使用第三方模型是最好的選擇。

一個穩(wěn)定的模型能夠給你節(jié)省大量的時間和精力，這時你就有更多的時間把核心業(yè)務(wù)處理好，這也是為什么很多大企業(yè)會把一些非核心業(yè)務(wù)外包出去的原因之一。

本文轉(zhuǎn)載自公眾號AI探索時代作者：DFires

原文鏈接：??https://mp.weixin.qq.com/s/HSeDfYq5Va3efsce7JbGPw???

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責(zé)任

標(biāo)簽

模型

開源模型

贊

回復(fù)

舉報

回復(fù)

相關(guān)推薦

大模型應(yīng)用落地：如何選擇合適的 Embedding 模型？

玄姐聊AGI ? 5067瀏覽 ? 0回復(fù)
小模型和開源正在成為AI發(fā)展的變數(shù)

51CTO技術(shù)棧 ? 2303瀏覽 ? 0回復(fù)
大模型 VS 小模型

NLP工作站 ? 3319瀏覽 ? 0回復(fù)
不要沉迷大模型的技術(shù)與理論，學(xué)習(xí)大模型的方法——從做一個小應(yīng)用開始

AI探索時代 ? 2845瀏覽 ? 0回復(fù)
小扎深夜炸場！Meta首個開源多模態(tài)模型Llama 3.2橫空出世，能力不輸GPT4o-mini；小扎：開源的拐點(diǎn)來了！

51CTO技術(shù)棧 ? 3411瀏覽 ? 0回復(fù)
不要上來就大模型，從訓(xùn)練一個小模型開始

AI探索時代 ? 2878瀏覽 ? 0回復(fù)
AI界的"小而美"：Mistral AI的最新力作如何重新定義邊緣計(jì)算 | 多智能體協(xié)作讓大語言模型訓(xùn)練效率暴增

sbf_2000 ? 2577瀏覽 ? 0回復(fù)
QVQ-72B，如期而至！繼QWQ后，通義千問又開源視覺推理大模型！

NLP工作站 ? 2731瀏覽 ? 0回復(fù)
為啥強(qiáng)化學(xué)習(xí)開始成為了大語言模型（LLM）的新寵？

智駐未來 ? 2896瀏覽 ? 0回復(fù)
大模型之嵌入與向量化的區(qū)別是什么？

AI探索時代 ? 2423瀏覽 ? 0回復(fù)
微軟開源最強(qiáng)小模型Phi-4，超GPT-4o、可商用

Aceryt ? 2388瀏覽 ? 0回復(fù)
微軟開源小模型Phi系列：技術(shù)演進(jìn)、能力突破與未來展望

上堵吟1 ? 3311瀏覽 ? 0回復(fù)
選擇哪個Batchsize對模型效果最好？

石映飛云 ? 1967瀏覽 ? 0回復(fù)
開源版o1！中國大模型讓國外陷入瘋狂，成本猛降90%

Aceryt ? 3263瀏覽 ? 0回復(fù)
小而美！1B模型如何通過測試時優(yōu)化逆襲405B LLM？

arnoldzhw ? 2185瀏覽 ? 0回復(fù)
DeepSeek 模型架構(gòu)的特殊選擇

amei2000go ? 1985瀏覽 ? 0回復(fù)
為了狙擊Manus，OpenAI開源了首個Agent SDK

Halo咯咯 ? 2731瀏覽 ? 0回復(fù)
AMD開源30億小參數(shù)模型，媲美Qwen-2.5

Aceryt ? 1644瀏覽 ? 0回復(fù)
千億模型做不到的事，7B小模型實(shí)現(xiàn)了？阿里這次開源有點(diǎn)狠！

蜂耘網(wǎng)iphoneyun ? 1819瀏覽 ? 0回復(fù)

AI探索時代

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

51CTO

51CTO博客

51CTO學(xué)堂

千萬不要為了節(jié)約成本而選擇小模型，特別是開源模型原創(chuàng)

為什么不建議使用小模型？

目錄

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

51CTO

51CTO博客

51CTO學(xué)堂

千萬不要為了節(jié)約成本而選擇小模型，特別是開源模型 原創(chuàng)

為什么不建議使用小模型？

目錄

千萬不要為了節(jié)約成本而選擇小模型，特別是開源模型原創(chuàng)