大模型的能力和大模型應用 原創
“ 目前大模型技術發展的如火如荼,但關于大模型的應用大家都在摸著石頭過河。”
目前大模型技術發展的如火如荼,但關于大模型的應用大家都在摸著石頭過河;技術人員不知道大模型技術應該怎么使用,產品和業務人員又不知道大模型能干啥。
但我們要貫徹一個理念——技術只是工具,我們只是利用工具來解決問題。
既然技術就是一個工具,因此我們就需要從兩個方面來理解工具:
1. 工具的能力
2. 工具的應用
大模型的能力與應用
在上一篇文章中介紹了大模型從技術到應用到梳理——???你了解大模型的生態體系嗎?大模型從技術到應用的內容梳理???中介紹了大模型的技術和應用問題。
但由于大模型技術還在快速發展,因此很多人不知道大模型能干什么,以及怎么干;包括作者自己也是如此。
雖然說現在大模型主要應用場景有AIGC,RAG和智能體;而且其應用技術也在快速發展;但為了加深我們對大模型的理解,以及基于大模型做一些技術創新。
因此,今天我們就從問題的本質出發,來理解和使用大模型。
任何技術從本質上來說都是一個工具,因此了解一個工具我們主要有兩個方面;這個工具能干什么——工具的能力,這個工具能解決什么問題——工具的使用/應用。
當然,很多時候很多工具都具有多種功能;比如說你用錘子砸釘子,但你也可以使用斧頭砸釘子。當然,有些工具的功能卻很單一,只能做一件事,比如說鋸子。
為什么要說上面的例子?
原因就在于我們很多人分不清技術的能力和應用,甚至認為他們是一體的。
不了解大模型的能力,更不了解大模型的應用;只是別人告訴你大模型能做什么,以及怎么做;
以計算機網絡為例,網絡的作用只有一個,那就是信息傳輸;不管實現網絡的技術有多么復雜,比如說路由協議,傳輸協議等;它們的唯一目的就是把信息準確地送到目的地。
而我們產品和技術人員就在此基礎上構建了各種各樣的應用,比如說網站,APP,小程序;娛樂,教育,生活等各種各樣的應用場景。
同樣大模型也是如此,但大模型的功能并不像計算機網絡那么單一;同一個大模型可能同時具備多種功能,最典型的就是多模態大模型;從數據形式上來看有文字,圖片和視頻;從表現形式上來看又生成功能和推理功能等。
所以只有當你理解了大模型有哪些功能之后,才知道大模型可以被應用于哪些業務場景,以及其潛在的優點和問題是什么。
當然,大模型的能力一直在進化,今天的大模型和兩年前的大模型可能在功能上天差地別;但這些都屬于怎么把大模型這個技術工具做的更好,而且從具體的應用場景中去發現大模型的不足,以此來不斷的優化這個技術工具。
本文轉載自公眾號AI探索時代 作者:DFires
