千萬不要為了節(jié)約成本而選擇小模型,特別是開源模型 原創(chuàng)
?“ 大模型和小模型是從功能上來區(qū)分的,而不是參數(shù)上 ”
我們在工作的過程中,應(yīng)該多多少少都遇到過這樣的事情;那就是老板為了節(jié)省成本,然后找了一些不專業(yè)或者一些漏洞百出的工具給我們用;最后的結(jié)果就是成本沒節(jié)約下來,然后還出了一大堆亂七八糟的事。
這可真的是羊肉沒吃著,還惹了一身騷;成本沒節(jié)約,最后還耽誤時間,身心俱疲。
為什么不建議使用小模型?
首先聲明一下,這里的小模型不是指參數(shù)體量小的模型,是指功能太差,無法滿足業(yè)務(wù)場景的模型;更有甚者很多小企業(yè)老板會選擇一些開源模型,自己部署,就為了省錢。
但他們卻不知道,這里的“節(jié)省成本”并沒有真正節(jié)省成本,反而大大地增加了成本。
使用小模型會面臨著哪些問題?
使用小模型最大的問題就是,其性能不足,而且由于沒有專業(yè)的團(tuán)隊(duì)維護(hù),導(dǎo)致其會出現(xiàn)各種亂七八糟的問題。
以作者本人來說,公司最近的一個AIGC(AI生成內(nèi)容)產(chǎn)品中,有一個文字生成視頻的功能,這也是大模型應(yīng)用中比較常見的一個功能。
然后使用的就是社區(qū)里的一個開源模型,而這種開源模型只能自己來部署,因此還專門買了算力機(jī)去部署。
而關(guān)于大模型的部署與運(yùn)維,在前面的文章中也提到過,復(fù)雜性和工作量就不用細(xì)說了,感興趣的可以查看文章??關(guān)于大模型在企業(yè)生產(chǎn)環(huán)境中的獨(dú)立部署問題??。
關(guān)于這個文字生成視頻的功能,說句實(shí)話,浪費(fèi)了大量時間和精力開發(fā)的產(chǎn)品,效果真的是一言難盡;而且,這個模型使用的還不是傳統(tǒng)的類似sora這種真正的視頻生成模型,而更像是生成一張圖片,然后增加了動態(tài)的效果。
而且,不只是模型本身的效果問題,也是為了節(jié)約成本選擇的算力機(jī)并不是知名企業(yè)提供的算力,而是找的一個不知名企業(yè)的算力云機(jī)器,結(jié)果就是性能差的要死;跑在上面的服務(wù)經(jīng)常莫名其妙的被殺掉,系統(tǒng)莫名其妙的重啟。
而這就間接導(dǎo)致了各種各樣的莫名其妙的問題,然后就需要浪費(fèi)大量的時間和精力去排查;看到這里有些人可能會說,知道是算力機(jī)不穩(wěn)定,肯定先查算力機(jī)啊?
但事實(shí)上問題出現(xiàn)的表象和算力機(jī)一點(diǎn)關(guān)系都沒有,甚至你會懷疑是不是自己代碼寫的有問題,亦或者是不是某個中間件出問題了。
而這種亂七八糟,奇奇怪怪的問題不但耽誤大量的時間和精力,最重要的是它會讓我們特別的煩躁;本來簡簡單單就能解決的問題,然后中間出現(xiàn)一堆莫名其妙的bug,耽誤進(jìn)度,更影響心情。
最重要的一點(diǎn)是什么?
人的時間和精力都是有限的,當(dāng)你把大量的時間和精力浪費(fèi)在一些亂七八糟的事情之上后,你的核心業(yè)務(wù)就會受到影響。
首先,使用小模型帶來的各種各樣的問題,直接導(dǎo)致你本來有半年的時間開發(fā)核心功能,結(jié)果被奇奇怪怪的bug耽誤了一大半時間;然后核心功能可能就會被做的亂七八糟的,甚至是匆匆忙忙的上線。
然后,技術(shù)人員就不得不花大量的時間去四處救火,最后形成惡性循環(huán)。
在前面的文章中作者曾說過,大模型+小模型是現(xiàn)在企業(yè)開發(fā)的主流模式;這里說的大模型+小模型是指性能足夠的前提下,而不是說你隨便找一個根本無法滿足業(yè)務(wù)需求的模型,不但如此還要花費(fèi)大量的時間去運(yùn)維,這就更不值得了。
在基于大模型開發(fā)上層應(yīng)用的過程中,除了大模型服務(wù)商之外,對絕大部分企業(yè)來說,使用第三方模型是最好的選擇。
一個穩(wěn)定的模型能夠給你節(jié)省大量的時間和精力,這時你就有更多的時間把核心業(yè)務(wù)處理好,這也是為什么很多大企業(yè)會把一些非核心業(yè)務(wù)外包出去的原因之一。
?
本文轉(zhuǎn)載自公眾號AI探索時代 作者:DFires
