如果老板讓你基于大模型搭建一個系統,怎么選擇一個適合自己任務的大模型?選擇大模型需要考慮哪些問題? 原創
“ 怎么選擇和測試一款大模型,是一個需要思考的問題”
到今天為止,市面上的大模型沒有一萬也有三千;如果算上那些學習使用的大模型,可能幾十萬都不止。
但對企業來說,要想構建一個企業級的AI應用,最好的選擇就是使用第三方大模型或者使用開源大模型,那么在如此多的模型中,怎么選擇一個適合自己任務的大模型呢?
個人開發的人工智能聊天小程序,感興趣的可以點擊查看:
01、為什么要選擇模型?
這兩年市面上的模型如雨后春筍般不斷涌現,而且模型的能力也在不斷加強。但不論是對個人還是企業來說,東西多了反而不知道該怎么選了。
有句老話叫:“沒有最好的,只有最合適的”;這句話放到大模型上也是一樣,不論是對個人還是對企業,怎么選擇一個好的模型,是一個值得思考的問題。
對個人來說,如果學的是自然語言處理,那么選擇一個圖片處理的模型就走偏了。
而對一家企業來說,選擇模型需要考慮的問題就更多了,比如模型的功能是否滿足需求,模型的響應速度,數據安全問題,更新頻率以及是否有完善的文檔,更重要的是使用模型的成本問題。
而目前由于大模型的應用還處于初級階段,雖然搞了一年多的千模大戰,但真正能把大模型貼合到具體的應用場景中,還處于探索的階段。
因此,市面上也很難見到完整的大模型企業級解決方案;而今天就來簡單討論一下怎么選擇一個適合的大模型;也可以說是選擇模型的一個簡單方法論。
02、怎么選擇模型?
無論做任何事,都會有固定的幾個步驟,選擇模型也不例外;而怎么選擇模型,總結了以下幾個步驟:
明確任務需求
選擇大模型之前,第一步就是要確定任務需求,也就是說你想用大模型干什么?只有明確了任務需求,才能知道應該選擇什么樣的大模型。
舉例來說,你想利用大模型做一個具有圖像處理功能的大模型,那么你選擇自然語言處理的模型就肯定不合適。
在明白需求的情況下,你才知道怎么想干嘛,以及能干嘛。
確定模型類型和架構
根據任務需求,篩選符合任務功能的模型;比如說,同樣都能進行圖片處理的大模型,是選擇開源的,還是商業閉源;是選擇AGI(通用人工智能)這種能夠進行多模態處理的大模型,還是選擇垂直領域內的模型。
評估大模型和基礎能力
在確定大模型的類型之后,就可以對模型進行簡單的評估;不論是使用官方給出的評測結果,還是自身的評測手段,比如自己整理一部分業務數據做成測試集,然后丟到模型中進行交叉測試。
評估大模型不但要評估大模型的基礎能力,同時還要看大模型的響應速度,是否支持大數據量處理,大模型是否會經常更新等。
選擇模型
在確定了前面幾個步驟之后,可能會有幾個模型供我們選擇;這時我們就需要對它們進行篩選了,如果說前面的步驟是硬性條件,那么現在就需要篩選一些軟性條件。
比如說,這款大模型的文檔是否完善,文檔更新是否及時;以及,如果是第三方大模型,那么使用大模型的成本是否合適。
還有就是,大模型是否能本地部署,本地部署需要的成本有多少,需要多少硬件設備,以及需要多少人力進行維護。還有就是數據安全問題,是否能夠得到保障等。
總之,選擇大模型是一個復雜的過程,特別是不使用第三方模型的情況,自己部署大模型的情況下。
使用第三方模型,如果覺得效果不好換一家就行了;但如果本地部署大模型,如果表現不好那么前期的人力和硬件資源的投入就無法收回了。
當然,這里只是記錄一下自己認為的大模型選擇方案,可能還有很多問題有待完善,對企業級大模型有了解或感興趣的朋友可以來參與討論。
本文轉載自公眾號AI探索時代 作者:DFires
原文鏈接:??https://mp.weixin.qq.com/s/_gM_dUuzWk1tDCBASSq-jg??
