不要沉迷大模型的技術(shù)與理論，學(xué)習(xí)大模型的方法——從做一個(gè)小應(yīng)用開始原創(chuàng)

發(fā)布于 2024-9-18 10:49

瀏覽

0收藏

“ 在應(yīng)用中學(xué)習(xí)技術(shù)，而不是沉迷于技術(shù)本身 ”

不知道大家都是怎么學(xué)習(xí)大模型技術(shù)的，但從個(gè)人的經(jīng)驗(yàn)和公眾號(hào)的反饋來看，有些人在學(xué)習(xí)大模型技術(shù)時(shí)轉(zhuǎn)進(jìn)了牛角尖，導(dǎo)致很多東西學(xué)不明白，事倍功半。

今天就從個(gè)人的學(xué)習(xí)歷程出發(fā)，來討論一下關(guān)于大模型技術(shù)的學(xué)習(xí)方法。

學(xué)習(xí)大模型技術(shù)的方法

應(yīng)該跟很多人一樣，之所以學(xué)習(xí)大模型技術(shù)是因?yàn)榇竽Ｐ图夹g(shù)的爆火，以及大模型技術(shù)在未來的發(fā)展?jié)摿Γ匾囊稽c(diǎn)是不了解和學(xué)習(xí)大模型以后可能會(huì)找不到工作。

有句話叫，以后被人工智能淘汰的不是農(nóng)民工，也不是高級(jí)白領(lǐng)，是不會(huì)學(xué)習(xí)和使用人工智能的人。

雖然大模型技術(shù)的前景并不是很明朗，但這并不妨礙我們學(xué)習(xí)大模型技術(shù)；但應(yīng)該怎么學(xué)習(xí)大模型技術(shù)，卻是一個(gè)值得思考的問題。

在剛開始接觸人工智能技術(shù)的時(shí)候，應(yīng)該像絕大部分人一樣，面對(duì)人工智能技術(shù)領(lǐng)域一大堆專業(yè)名詞，框架，技術(shù)，架構(gòu)等等；感覺自己無從下手，不論是看書還是看視頻，都聽得迷迷糊糊，很多地方也聽不懂。

不要沉迷大模型的技術(shù)與理論，學(xué)習(xí)大模型的方法——從做一個(gè)小應(yīng)用開始-AI.x社區(qū)

但是，比較好的一點(diǎn)就是剛好這段時(shí)間學(xué)會(huì)了寫公眾號(hào)，把自己對(duì)大模型技術(shù)的學(xué)習(xí)，理解以及思考給記錄了下來；雖然其中可能存在很多問題，但這并不重要，重要的是自己在寫公眾號(hào)的同時(shí)對(duì)大模型技術(shù)有了更加深刻的認(rèn)識(shí)與理解。

在剛開始寫關(guān)于人工智能技術(shù)的內(nèi)容時(shí)，大家也可以翻到之前的文章看一下，大部分都是一些概念性的東西；反正只要是自己看到的，不懂的東西就寫下來，權(quán)當(dāng)是一個(gè)個(gè)人筆記，記錄一下。

但是在寫公眾號(hào)的過程中，慢慢就發(fā)現(xiàn)一個(gè)問題，那就是很多不明白的東西，寫著寫著就慢慢明白了。

因?yàn)閷懽鞯倪^程是一個(gè)重新思考的過程，很多不明白的東西，你雖然也可以照搬的抄下來，但會(huì)覺得這樣總是怪怪的；因此，你就會(huì)主動(dòng)思考，用自己的話，把自己的理解給下來。

這樣，哪怕別人看不懂，但它記錄的是你的學(xué)習(xí)與思考的過程，而在這個(gè)過程中，你就會(huì)加深對(duì)大模型技術(shù)的理解。

在前面寫的文章中，有很多我自己都不是很理解，有些就是照搬照抄下來的，但現(xiàn)在回頭看一下，發(fā)現(xiàn)有些東西在不知不覺中就理解了。

因此，再次建議一定要養(yǎng)成寫作的習(xí)慣，哪怕你寫的都是錯(cuò)的；學(xué)習(xí)是一個(gè)輸入的過程，寫作是一個(gè)輸出的過程，有輸入，就要有輸出；否則學(xué)習(xí)的意義就不存在了。

不要沉迷大模型的技術(shù)與理論，學(xué)習(xí)大模型的方法——從做一個(gè)小應(yīng)用開始-AI.x社區(qū)

這也是為什么很多人覺得，讀了很多書為什么還是過不好這一生的原因；因?yàn)槟銓W(xué)了，但并沒有用出來。

這也是為什么一些戰(zhàn)爭(zhēng)時(shí)期的高級(jí)將領(lǐng)，雖然沒有讀過書認(rèn)過字，甚至靠一本三國(guó)就敢?guī)П蛘蹋疫€勝多敗少。

原因就是，他們能夠把三國(guó)里的知識(shí)和現(xiàn)實(shí)中的戰(zhàn)爭(zhēng)問題相結(jié)合，然后在不斷地實(shí)踐過程中加深對(duì)三國(guó)和戰(zhàn)爭(zhēng)的理解，最后越戰(zhàn)越強(qiáng)。

其次，學(xué)習(xí)是一個(gè)循序漸進(jìn)，不斷驗(yàn)證又不斷推翻的過程；很多人鉆牛角尖的原因就是，想把大模型的技術(shù)與理論完全吃透。但這怎么可能呢？

在此之前，作者本人也是鉆進(jìn)大模型技術(shù)里無法自拔，整體滿腦子想的就是大模型是怎么設(shè)計(jì)出來的，Transformer架構(gòu)為什么這么牛逼，自注意力機(jī)制的原理是什么？chatGPT是怎么實(shí)現(xiàn)的？怎么訓(xùn)練和微調(diào)一個(gè)大模型，怎么在本地部署大模型等等。

這些東西有用嗎？

答案是有用，而且有大用；但對(duì)現(xiàn)階段很多人工智能剛?cè)腴T的人來說，它們沒什么用。因?yàn)樗鼈冸x我們太遠(yuǎn)，我們夠不著，反而徒增煩惱。

在之前的學(xué)習(xí)過程中，作者也天天想自己本地部署一個(gè)大模型，然后訓(xùn)練一個(gè)模型；但后來發(fā)現(xiàn)，即使本地部署大模型又有什么用？能解決什么問題？除了能夠用來吹牛逼之外，還有其它的實(shí)際作用嗎？

有些人可能會(huì)覺得，至少熟悉了大模型是怎么部署的？

但事實(shí)是，大模型的本地部署大部分人都是下載一個(gè)工具，然后把大模型下載下來就叫會(huì)部署了。

但大模型在真正的企業(yè)應(yīng)用中，怎么解決其性能問題，并發(fā)問題，輸出質(zhì)量問題；比如說，大模型的分布式部署怎么搞？有哪幾種方案，每種方案的優(yōu)劣是什么？

那些在本地部署大模型的人，有誰能回答上面的問題？

如果能回答上面的問題，還有其它新的問題，比如長(zhǎng)文本問題怎么解決，模型幻覺怎么解決，如果需要對(duì)大模型進(jìn)行微調(diào)，怎么解決并行計(jì)算問題，在并行計(jì)算的過程中會(huì)潛藏著哪些問題？有哪些注意點(diǎn)？

不要沉迷大模型的技術(shù)與理論，學(xué)習(xí)大模型的方法——從做一個(gè)小應(yīng)用開始-AI.x社區(qū)

更不用說更加細(xì)節(jié)的，用什么傳播算法，損失函數(shù)怎么設(shè)計(jì)，大批量訓(xùn)練數(shù)據(jù)怎么處理等等。

因此，最好的方式應(yīng)該是在了解一些大模型的基礎(chǔ)理論之后，找一個(gè)大模型的技術(shù)方向或應(yīng)用方向，去自己深度地研究一下。

比如說，自己手動(dòng)打造一個(gè)大模型知識(shí)庫，哪怕這個(gè)知識(shí)庫很簡(jiǎn)陋，但在做的過程中，肯定會(huì)遇到各種各樣的問題。

再比如，大模型在AIGC領(lǐng)域的應(yīng)用，怎么用大模型構(gòu)造AIGC的應(yīng)用，其存在哪些問題，需要怎么解決。

比如說，搭建大模型知識(shí)庫面臨著龐大數(shù)據(jù)的存儲(chǔ)與檢索問題，大模型的理解能力不足，該怎么解決。再比如在AIGC領(lǐng)域，假如想用大模型做一個(gè)視頻生成的應(yīng)用，怎么解決不同場(chǎng)景和視頻風(fēng)格的問題。

比如說，國(guó)風(fēng)類的視頻，可愛型視頻，二次元視頻，美女跳舞視頻，走的清純路線，可愛路線，白月光路線。

大模型能同時(shí)滿足這些不同的場(chǎng)景與風(fēng)格化視頻的生成嗎？生成質(zhì)量怎么保證？

不要沉迷大模型的技術(shù)與理論，學(xué)習(xí)大模型的方法——從做一個(gè)小應(yīng)用開始-AI.x社區(qū)

這時(shí)你就會(huì)考慮該怎么解決這個(gè)問題，比如說是因?yàn)榇竽Ｐ偷闹R(shí)不足，訓(xùn)練效果不好，還是模型設(shè)計(jì)有問題。

這時(shí)再去學(xué)習(xí)大模型技術(shù)的原理，實(shí)現(xiàn)，你這時(shí)就會(huì)有的放矢，而不是純粹的學(xué)習(xí)大模型技術(shù)理論，然后也不知道自己學(xué)了之后能干嘛。

再拿大模型的應(yīng)用來說，在之前的學(xué)習(xí)過程中，一直不明白大模型有什么用？難道只能用來回答問題，生成一些圖片和視頻？而且還不能保證答案的準(zhǔn)確性以及生成內(nèi)容的質(zhì)量。

而在自己真的開始動(dòng)手用大模型解決問題的時(shí)候，才方向大模型的應(yīng)用方向有很多。比如前面說的生成視頻的例子，怎么生成不同風(fēng)格的視頻；內(nèi)容生成方向多種多樣，明顯不是一個(gè)大模型就能完全做到的。

就像一個(gè)人一樣，他不可能同時(shí)精通天文地理，物理化學(xué)，寫作繪畫，古董鑒賞等多個(gè)領(lǐng)域，大模型也是如此。

而且隨著對(duì)大模型技術(shù)理解的加深，自己慢慢就會(huì)發(fā)現(xiàn)大模型的一些應(yīng)用方向，比如說利用大模型的推理能力實(shí)現(xiàn)的Agent，來解決不同領(lǐng)域的問題，比如旅行，寫作，營(yíng)銷，工業(yè)制造等。

再比如，大模型與知識(shí)庫技術(shù)的結(jié)合，去實(shí)現(xiàn)智能問答，教育培訓(xùn)等；還有在昨天文章中說的，大模型應(yīng)用于內(nèi)容合規(guī)性校驗(yàn)。

在當(dāng)前大模型技術(shù)發(fā)展的初期，這隨便拎出一個(gè)方向都可以作為一個(gè)創(chuàng)業(yè)項(xiàng)目；不論是做出一個(gè)能高質(zhì)量生成各種風(fēng)格視頻的大模型，還是結(jié)合知識(shí)庫做一套智能客服。還是打造各個(gè)領(lǐng)域內(nèi)的大模型，都具有廣闊的發(fā)展前景，以及發(fā)展空間。

總之，知識(shí)不只是書本上的才叫知識(shí)，實(shí)踐更是一個(gè)大的課堂；要把理論與實(shí)踐相結(jié)合，才能讓理論去指導(dǎo)實(shí)踐，讓實(shí)踐去驗(yàn)證理論。

本文轉(zhuǎn)載自公眾號(hào)AI探索時(shí)代作者：DFires

原文鏈接：??https://mp.weixin.qq.com/s/mU3e5Fj5fmI52EHz9Ef_KA???

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請(qǐng)注明出處，否則將追究法律責(zé)任

標(biāo)簽

大模型

贊

回復(fù)