人工智能應(yīng)用最大的問(wèn)題是數(shù)據(jù)問(wèn)題,而不是技術(shù)問(wèn)題 原創(chuàng)
“ 數(shù)據(jù)才是人工智能模型應(yīng)用的主要問(wèn)題,也是一切人工智能的基礎(chǔ)。”
隨著人工智能技術(shù)的發(fā)展,人工智能也從剛開(kāi)始的聊天模型變成了能夠應(yīng)用到實(shí)際場(chǎng)景中的一項(xiàng)新的技術(shù);而且隨著國(guó)家大力發(fā)展人工智能技術(shù),人工智能就像二十年前的互聯(lián)網(wǎng)技術(shù)一樣,充斥著各種機(jī)會(huì),但同樣也面臨著各種各樣的挑戰(zhàn)。
但是,以個(gè)人從事一段時(shí)間的人工智能技術(shù)應(yīng)用,以及個(gè)人對(duì)人工智能技術(shù)的了解來(lái)看;人工智能目前在實(shí)際應(yīng)用中所存在的主要問(wèn)題就是數(shù)據(jù)問(wèn)題,而不僅僅只是技術(shù)問(wèn)題。
當(dāng)然,人工智能技術(shù)還需要時(shí)間繼續(xù)發(fā)展,但以解決實(shí)際問(wèn)題出發(fā),目前的人工智能模型需要大量的行業(yè)數(shù)據(jù)做支撐。
人工智能應(yīng)用所面臨的數(shù)據(jù)問(wèn)題
為什么說(shuō)目前人工智能的應(yīng)用主要是數(shù)據(jù)問(wèn)題?
以目前大模型實(shí)際發(fā)展情況來(lái)看,chatGPT的出現(xiàn)使得大模型技術(shù)進(jìn)入了一個(gè)嶄新的時(shí)代;而經(jīng)過(guò)這兩三年的發(fā)展,大模型技術(shù)的范圍也越來(lái)越廣;比如視頻,圖片生成,自動(dòng)化工具等的出現(xiàn)。
隨著今年國(guó)內(nèi)大模型DeepSeek的爆火,其最大的優(yōu)點(diǎn)并不是解決了應(yīng)用問(wèn)題,而是解決了模型的成本問(wèn)題;其使得中小型企業(yè)也有可能訓(xùn)練和部署自己的專有模型。
但從24年開(kāi)始,有人提出大模型不應(yīng)該僅僅停留在理論研究和技術(shù)迭代,還需要關(guān)注大模型解決實(shí)際問(wèn)題的能力,也就是大模型的應(yīng)用場(chǎng)景。
但等到真正把大模型切入到具體的應(yīng)用場(chǎng)景中才發(fā)現(xiàn),現(xiàn)在市面上的模型很難去滿足具體行業(yè)或領(lǐng)域的業(yè)務(wù)需求。而僅僅只能用來(lái)搞一些創(chuàng)作類的工作,而且效果也不太好。
其中有一部分原因在于模型本身的問(wèn)題,還有很大一部分原因就在于數(shù)據(jù)問(wèn)題;數(shù)據(jù)是一切AI的基礎(chǔ),沒(méi)有數(shù)據(jù)AI技術(shù)就像空中樓閣。
舉個(gè)具體的例子來(lái)說(shuō),很多公司基于一些模型服務(wù)商做套殼,開(kāi)發(fā)一些應(yīng)用;但實(shí)際操作中才發(fā)現(xiàn),哪些服務(wù)商提供的模型都是一些通用模型,無(wú)法解決具體領(lǐng)域的問(wèn)題。
比如,使用文本生成模型做套殼的助手應(yīng)用,你問(wèn)它大而泛大問(wèn)題它可能回答的還不錯(cuò);但你要是問(wèn)它具體領(lǐng)域的問(wèn)題,它可能就傻眼了。比如你問(wèn)它你們公司內(nèi)部的管理制度等,因?yàn)槿鄙傧鄳?yīng)的數(shù)據(jù),因此它就無(wú)能為力了。
以上的例子可能并不是很合適,但從技術(shù)的本質(zhì)出發(fā),技術(shù)只是技術(shù);它的本質(zhì)只是一個(gè)工具,與任何一個(gè)行業(yè)都是無(wú)關(guān)的;比如說(shuō)互聯(lián)網(wǎng)技術(shù)即可以應(yīng)用于新興行業(yè),也可以應(yīng)用于傳統(tǒng)行業(yè)。
而人工智能技術(shù)也是如此,但要把技術(shù)應(yīng)用到具體的領(lǐng)域,這時(shí)就需要把技術(shù)和具體領(lǐng)域相結(jié)合;而這個(gè)結(jié)合的點(diǎn)就是數(shù)據(jù)。
互聯(lián)網(wǎng)行業(yè)有互聯(lián)網(wǎng)行業(yè)的數(shù)據(jù)特征,傳統(tǒng)工業(yè)有其獨(dú)特的數(shù)據(jù)特征;而這也是為什么很多企業(yè)選擇自己訓(xùn)練和微調(diào)模型,而不是直接把別人訓(xùn)練好的模型拿過(guò)來(lái)用;原因就是因?yàn)閿?shù)據(jù)對(duì)不上。
要想把人工智能技術(shù)應(yīng)用到某個(gè)行業(yè),那么就需要根據(jù)行業(yè)特性設(shè)計(jì)符合其特點(diǎn)的模型結(jié)構(gòu);以及使用大量的行業(yè)數(shù)據(jù)對(duì)模型進(jìn)行定制化訓(xùn)練。
數(shù)據(jù)是互聯(lián)網(wǎng)時(shí)代的石油,同樣也是人工智能時(shí)代的血液;所以,在以后越來(lái)越多的企業(yè)會(huì)選擇定制化模型來(lái)解決實(shí)際問(wèn)題,而不是僅僅做套殼應(yīng)用。
本文轉(zhuǎn)載自公眾號(hào)AI探索時(shí)代 作者:DFires
