什么時候需要訓練和微調屬于自己的大模型——小微企業必須要明白的問題 原創
“ 從問題出發,先有需求再有解決方案 ”
老板和員工在思維方式上有一個很大的差別就是,作為老板他們喜歡尋找現有的解決方案,如果現有的解決方案無法滿足的情況下,才會自己設計一個解決方案。
而作為員工來說特別是技術人員,大都有一種技術至上的心態,比如說很多技術人員找工作會特別在乎公司用的技術是否足夠牛逼,足夠高大上。
之所以產生這種現象的原因是因為,技術人員的心態是學會牛逼的技術,走到哪里都不怕。
而老板的心態是,能解決問題把業務跑起來最重要,現有的解決方案或許不是最好的,但它卻是經過驗證的,能夠保證業務的穩定性;但如果提出新的解決方案,就要承擔新方案潛在的各種風險。等以后業務穩定之后,可以慢慢的優化現有的方案。
什么時候需要訓練和微調模型?
在上面的內容中,描述了一下員工與老板思維以及心態上的區別;這兩種思維方式沒有絕對的對錯之分,區別只是兩種完全不同的發展方向,一種是打工人的思維方式,一種是創業者的思維方式。
就拿大模型訓練與微調來說,很多技術人員都想親自參與或體驗一下一個模型從無到有的誕生過程;但受限于各種原因,有機會參與這樣工程的人還是比較少的;因此很多人都退而求其次,想做一下模型的訓練與微調。
舉個例子,你是某個小公司的技術人員,老板想引入大模型技術來升級現有的業務系統,然后讓你做一下前期調查和簡單的解決方案。
不管使用的是大模型的什么技術,比如Agent,知識庫,AIGC等;很多技術人員下意識的方式就是先搞一個本地模型,試試能不能訓練和微調一下,然后就陷入各種技術細節中無法自拔。
但事實上,市面上已經有很多大模型服務商,他們有專門訓練和微調過的模型;根據現有的業務體系,或許隨便找一個合適的模型就可以用了。
為什么不建議企業引入大模型技術時,就直接打造屬于自己的大模型?
原因就是,你還不知道怎么把大模型技術與自己的業務場景相結合;雖然市面上可能有一些相似的案例,但每個企業都有其獨特的運作方式,適合別人的不一定適合你。
簡單來說就是,你都不知道現有業務引入大模型能解決哪些問題,以及潛藏著哪些問題;說白了就是,你都不知道要訓練和微調出一個需要解決什么問題的模型,這樣的模型怎么可能做的好呢?
就類似于你需求都不清楚,就直接開始開發產品了,這樣的產品能有人用嗎?
當然,如果說你覺得你是上帝之子,即使需求不明確也能做出符合業務場景的大模型;或者說你不差錢,訓練一次不行就重新訓練,那也可以。
因此,什么時候開始訓練和微調模型?
最好的時機就是,在你的業務成型之后,有一些問題確實需要解決或者說需要節約成本;這時,你再去考慮訓練和微調一個模型,甚至是找模型服務商幫你重新設計一個模型都可以。
一句話就是,在你的需求明確之后,也就是你知道要訓練出一個什么樣的模型,并且你有足夠的技術和資金支持,那么你就可以訓練和微調自己的模型了。
說到底還是那句話,技術是為業務服務的,技術的發展是基于業務場景的落地,而不是從技術去推動業務場景的發展,雖然技術的發展也有可能顛覆現有的業務場景,但那是技術與業務場景的深度融合的結果。
總之,不要一開始就想著訓練和微調屬于自己的模型,要從問題出發,而不是從結果出發。
本文轉載自公眾號AI探索時代 作者:DFires
原文鏈接:??https://mp.weixin.qq.com/s/Ag2thIY2-TCAX15rbugWyA??
