不要沉迷大模型的技術(shù)與理論,學(xué)習(xí)大模型的方法——從做一個(gè)小應(yīng)用開始 原創(chuàng)
“ 在應(yīng)用中學(xué)習(xí)技術(shù),而不是沉迷于技術(shù)本身 ”
不知道大家都是怎么學(xué)習(xí)大模型技術(shù)的,但從個(gè)人的經(jīng)驗(yàn)和公眾號(hào)的反饋來看,有些人在學(xué)習(xí)大模型技術(shù)時(shí)轉(zhuǎn)進(jìn)了牛角尖,導(dǎo)致很多東西學(xué)不明白,事倍功半。
今天就從個(gè)人的學(xué)習(xí)歷程出發(fā),來討論一下關(guān)于大模型技術(shù)的學(xué)習(xí)方法。
學(xué)習(xí)大模型技術(shù)的方法
應(yīng)該跟很多人一樣,之所以學(xué)習(xí)大模型技術(shù)是因?yàn)榇竽P图夹g(shù)的爆火,以及大模型技術(shù)在未來的發(fā)展?jié)摿Γ匾囊稽c(diǎn)是不了解和學(xué)習(xí)大模型以后可能會(huì)找不到工作。
有句話叫,以后被人工智能淘汰的不是農(nóng)民工,也不是高級(jí)白領(lǐng),是不會(huì)學(xué)習(xí)和使用人工智能的人。
雖然大模型技術(shù)的前景并不是很明朗,但這并不妨礙我們學(xué)習(xí)大模型技術(shù);但應(yīng)該怎么學(xué)習(xí)大模型技術(shù),卻是一個(gè)值得思考的問題。
在剛開始接觸人工智能技術(shù)的時(shí)候,應(yīng)該像絕大部分人一樣,面對(duì)人工智能技術(shù)領(lǐng)域一大堆專業(yè)名詞,框架,技術(shù),架構(gòu)等等;感覺自己無從下手,不論是看書還是看視頻,都聽得迷迷糊糊,很多地方也聽不懂。
但是,比較好的一點(diǎn)就是剛好這段時(shí)間學(xué)會(huì)了寫公眾號(hào),把自己對(duì)大模型技術(shù)的學(xué)習(xí),理解以及思考給記錄了下來;雖然其中可能存在很多問題,但這并不重要,重要的是自己在寫公眾號(hào)的同時(shí)對(duì)大模型技術(shù)有了更加深刻的認(rèn)識(shí)與理解。
在剛開始寫關(guān)于人工智能技術(shù)的內(nèi)容時(shí),大家也可以翻到之前的文章看一下,大部分都是一些概念性的東西;反正只要是自己看到的,不懂的東西就寫下來,權(quán)當(dāng)是一個(gè)個(gè)人筆記,記錄一下。
但是在寫公眾號(hào)的過程中,慢慢就發(fā)現(xiàn)一個(gè)問題,那就是很多不明白的東西,寫著寫著就慢慢明白了。
因?yàn)閷懽鞯倪^程是一個(gè)重新思考的過程,很多不明白的東西,你雖然也可以照搬的抄下來,但會(huì)覺得這樣總是怪怪的;因此,你就會(huì)主動(dòng)思考,用自己的話,把自己的理解給下來。
這樣,哪怕別人看不懂,但它記錄的是你的學(xué)習(xí)與思考的過程,而在這個(gè)過程中,你就會(huì)加深對(duì)大模型技術(shù)的理解。
在前面寫的文章中,有很多我自己都不是很理解,有些就是照搬照抄下來的,但現(xiàn)在回頭看一下,發(fā)現(xiàn)有些東西在不知不覺中就理解了。
因此,再次建議一定要養(yǎng)成寫作的習(xí)慣,哪怕你寫的都是錯(cuò)的;學(xué)習(xí)是一個(gè)輸入的過程,寫作是一個(gè)輸出的過程,有輸入,就要有輸出;否則學(xué)習(xí)的意義就不存在了。
這也是為什么很多人覺得,讀了很多書為什么還是過不好這一生的原因;因?yàn)槟銓W(xué)了,但并沒有用出來。
這也是為什么一些戰(zhàn)爭(zhēng)時(shí)期的高級(jí)將領(lǐng),雖然沒有讀過書認(rèn)過字,甚至靠一本三國(guó)就敢?guī)П蛘蹋疫€勝多敗少。
原因就是,他們能夠把三國(guó)里的知識(shí)和現(xiàn)實(shí)中的戰(zhàn)爭(zhēng)問題相結(jié)合,然后在不斷地實(shí)踐過程中加深對(duì)三國(guó)和戰(zhàn)爭(zhēng)的理解,最后越戰(zhàn)越強(qiáng)。
其次,學(xué)習(xí)是一個(gè)循序漸進(jìn),不斷驗(yàn)證又不斷推翻的過程;很多人鉆牛角尖的原因就是,想把大模型的技術(shù)與理論完全吃透。但這怎么可能呢?
在此之前,作者本人也是鉆進(jìn)大模型技術(shù)里無法自拔,整體滿腦子想的就是大模型是怎么設(shè)計(jì)出來的,Transformer架構(gòu)為什么這么牛逼,自注意力機(jī)制的原理是什么?chatGPT是怎么實(shí)現(xiàn)的?怎么訓(xùn)練和微調(diào)一個(gè)大模型,怎么在本地部署大模型等等。
這些東西有用嗎?
答案是有用,而且有大用;但對(duì)現(xiàn)階段很多人工智能剛?cè)腴T的人來說,它們沒什么用。因?yàn)樗鼈冸x我們太遠(yuǎn),我們夠不著,反而徒增煩惱。
在之前的學(xué)習(xí)過程中,作者也天天想自己本地部署一個(gè)大模型,然后訓(xùn)練一個(gè)模型;但后來發(fā)現(xiàn),即使本地部署大模型又有什么用?能解決什么問題?除了能夠用來吹牛逼之外,還有其它的實(shí)際作用嗎?
有些人可能會(huì)覺得,至少熟悉了大模型是怎么部署的?
但事實(shí)是,大模型的本地部署大部分人都是下載一個(gè)工具,然后把大模型下載下來就叫會(huì)部署了。
但大模型在真正的企業(yè)應(yīng)用中,怎么解決其性能問題,并發(fā)問題,輸出質(zhì)量問題;比如說,大模型的分布式部署怎么搞?有哪幾種方案,每種方案的優(yōu)劣是什么?
那些在本地部署大模型的人,有誰能回答上面的問題?
如果能回答上面的問題,還有其它新的問題,比如長(zhǎng)文本問題怎么解決,模型幻覺怎么解決,如果需要對(duì)大模型進(jìn)行微調(diào),怎么解決并行計(jì)算問題,在并行計(jì)算的過程中會(huì)潛藏著哪些問題?有哪些注意點(diǎn)?
更不用說更加細(xì)節(jié)的,用什么傳播算法,損失函數(shù)怎么設(shè)計(jì),大批量訓(xùn)練數(shù)據(jù)怎么處理等等。
因此,最好的方式應(yīng)該是在了解一些大模型的基礎(chǔ)理論之后,找一個(gè)大模型的技術(shù)方向或應(yīng)用方向,去自己深度地研究一下。
比如說,自己手動(dòng)打造一個(gè)大模型知識(shí)庫,哪怕這個(gè)知識(shí)庫很簡(jiǎn)陋,但在做的過程中,肯定會(huì)遇到各種各樣的問題。
再比如,大模型在AIGC領(lǐng)域的應(yīng)用,怎么用大模型構(gòu)造AIGC的應(yīng)用,其存在哪些問題,需要怎么解決。
比如說,搭建大模型知識(shí)庫面臨著龐大數(shù)據(jù)的存儲(chǔ)與檢索問題,大模型的理解能力不足,該怎么解決。再比如在AIGC領(lǐng)域,假如想用大模型做一個(gè)視頻生成的應(yīng)用,怎么解決不同場(chǎng)景和視頻風(fēng)格的問題。
比如說,國(guó)風(fēng)類的視頻,可愛型視頻,二次元視頻,美女跳舞視頻,走的清純路線,可愛路線,白月光路線。
大模型能同時(shí)滿足這些不同的場(chǎng)景與風(fēng)格化視頻的生成嗎?生成質(zhì)量怎么保證?
這時(shí)你就會(huì)考慮該怎么解決這個(gè)問題,比如說是因?yàn)榇竽P偷闹R(shí)不足,訓(xùn)練效果不好,還是模型設(shè)計(jì)有問題。
這時(shí)再去學(xué)習(xí)大模型技術(shù)的原理,實(shí)現(xiàn),你這時(shí)就會(huì)有的放矢,而不是純粹的學(xué)習(xí)大模型技術(shù)理論,然后也不知道自己學(xué)了之后能干嘛。
再拿大模型的應(yīng)用來說,在之前的學(xué)習(xí)過程中,一直不明白大模型有什么用?難道只能用來回答問題,生成一些圖片和視頻?而且還不能保證答案的準(zhǔn)確性以及生成內(nèi)容的質(zhì)量。
而在自己真的開始動(dòng)手用大模型解決問題的時(shí)候,才方向大模型的應(yīng)用方向有很多。比如前面說的生成視頻的例子,怎么生成不同風(fēng)格的視頻;內(nèi)容生成方向多種多樣,明顯不是一個(gè)大模型就能完全做到的。
就像一個(gè)人一樣,他不可能同時(shí)精通天文地理,物理化學(xué),寫作繪畫,古董鑒賞等多個(gè)領(lǐng)域,大模型也是如此。
而且隨著對(duì)大模型技術(shù)理解的加深,自己慢慢就會(huì)發(fā)現(xiàn)大模型的一些應(yīng)用方向,比如說利用大模型的推理能力實(shí)現(xiàn)的Agent,來解決不同領(lǐng)域的問題,比如旅行,寫作,營(yíng)銷,工業(yè)制造等。
再比如,大模型與知識(shí)庫技術(shù)的結(jié)合,去實(shí)現(xiàn)智能問答,教育培訓(xùn)等;還有在昨天文章中說的,大模型應(yīng)用于內(nèi)容合規(guī)性校驗(yàn)。
在當(dāng)前大模型技術(shù)發(fā)展的初期,這隨便拎出一個(gè)方向都可以作為一個(gè)創(chuàng)業(yè)項(xiàng)目;不論是做出一個(gè)能高質(zhì)量生成各種風(fēng)格視頻的大模型,還是結(jié)合知識(shí)庫做一套智能客服。還是打造各個(gè)領(lǐng)域內(nèi)的大模型,都具有廣闊的發(fā)展前景,以及發(fā)展空間。
總之,知識(shí)不只是書本上的才叫知識(shí),實(shí)踐更是一個(gè)大的課堂;要把理論與實(shí)踐相結(jié)合,才能讓理論去指導(dǎo)實(shí)踐,讓實(shí)踐去驗(yàn)證理論。
本文轉(zhuǎn)載自公眾號(hào)AI探索時(shí)代 作者:DFires
