大模型應用開發過程中主流架構模式——大模型+多個小模型 原創
“ 架構是靈活多變的,切勿鉆牛角尖 ”
在上一篇文章中講到大模型的能力問題,雖然說經過這一兩年時間的發展,大模型的能力已經得到巨大的提升,甚至有些模型已經超出了意料。
但大模型在工程化落地中依然面臨著很多問題,比如說成本問題,技術問題,以及能力問題,畢竟大模型并不是萬能的,某些模型雖然在某些方面表現較強,但并不是無所不能的。
因此,該怎么解決這個問題呢?
這時 通用大模型+多個垂直小模型的解決方案就出現了。
大模型+多個小模型
大家看到大模型+多個小模型,會不會就認為大模型就是參數量龐大的模型,多個小模型就是參數量較小的模型?
其實這里說的大模型+多個小模型并不是從我們傳統意義從技術角度理解的模型,而是從業務角度上的模型。
這里的大模型指的是你們公司主要業務依賴的模型,比如一家做AIGC業務的企業,它的大模型肯定是以生成業務為主;但生成式范圍那么大,不可能有一家公司能維護如此多的模型,肯定是以一兩個業務方向為主,其它的為輔。
比如說一家公司做AI音樂生成業務,但如果它還想做視頻處理和文字處理的業務,這時它可能就沒有那么多資金,技術和時間來維護如此多的模型。
而多個垂直小模型也并不是說一定是體量小的模型,而是那種非主要業務的模型;可能是自己維護的小模型,也可能是調用第三方的大模型服務。
大模型+小模型的配置方式細分來說還有很多適用場景,比如上面說的主業務模型+邊緣業務模型;再比如,一個功能強大的視頻生成模型+多個不同風格的垂下小模型,通過大+小的方式來解決不同場景的問題,以及節約企業成本。
不論是學習還是實際的企業應用,千萬要明白沒有人能做解決所有的問題,也沒有人能完成所有的任務,因此合作才是最好的選擇,而大模型+垂直小模型的方式就是最好的合作體現——合作共贏。
個人或企業只需要關注于自身的核心業務,而不用把時間和精力浪費在一些自己根本無力完成的任務上,這就是要做回報率最高,最有性價比的事情。
很多人都喜歡做一條龍,集研發,生產,銷售為一體,但對大部分中小企業來說成為產業鏈條上的一環或許是更好的選擇。
而在今年上半年,360CEO周鴻祎也不止一次的提過,不要過分追求大模型的能力和性能,使用多個功能強大的垂直小模型可能會比一個大模型做的更好,更強。
前面可以說是使用大模型+多個小模型的好處,那么使用這種方案有沒有什么壞處呢?
凡事都有兩面性,使用大模型+小模型雖然能帶來很多好處但同樣也面臨著很多問題。
雖然很多時候由于業務的多元性導致我們不得不使用多個模型,但使用多個模型最大的問題就是要適配不同的模型,每個模型都有其不同的輸入和輸出,而且不同模型的能力不一而足。
我們要在兼容不同模型的基礎之上,還要同時兼顧多種模型的復雜性和穩定性。
就類似于傳統業務系統架構中,由于業務需要或其它原因導致我們不得不引入一些中間件,但有過項目經驗的人應該都知道,每引入一個中間件都會給項目帶來一些不確定的潛在風險。
萬一中間件不穩定怎么辦,萬一中間件宕機了怎么辦等等,怎么做容錯處理等。
總之,沒有一成不變的架構,也沒有完美無缺的系統,我們需要根據實際情況根本不同的業務場景,選擇合適的解決方案,而不是想著靠一個架構解決所有問題。
最后,最最最重要的事就是,面對問題一定要靈活多變,切記不可鉆牛角尖。
本文轉載自公眾號AI探索時代 作者:DFires
