別只看LLM!為什么知識(shí)圖譜才是通往AGI的關(guān)鍵一步
智能時(shí)代,我們已經(jīng)習(xí)慣讓AI為我們提供各種服務(wù)。
當(dāng)你問(wèn)DeepSeek:"北京的天氣怎么樣"時(shí),它能精準(zhǔn)回答;當(dāng)你讓ChatGPT"用簡(jiǎn)單語(yǔ)言解釋相對(duì)論",它能流暢作答...
這些AI能力的背后,除了神經(jīng)網(wǎng)絡(luò)的感知能力,還有一個(gè)關(guān)鍵支撐技術(shù)——知識(shí)圖譜。
知識(shí)圖譜:機(jī)器的認(rèn)知地圖
知識(shí)圖譜本質(zhì)上是用關(guān)聯(lián)圖的方式表示現(xiàn)實(shí)世界中的事物和關(guān)系
。
例如你翻開(kāi)一本百科全書(shū),里面的知識(shí)點(diǎn)彼此孤立。知識(shí)圖譜則將這些知識(shí)點(diǎn)通過(guò)關(guān)系連接起來(lái),形成網(wǎng)狀結(jié)構(gòu)
。
在知識(shí)圖譜中,節(jié)點(diǎn)代表實(shí)體
(如中國(guó)、北京、人口),邊代表關(guān)系
(如"首都是"、"擁有")。
這種結(jié)構(gòu)讓AI不僅知道獨(dú)立的事實(shí),還能理解事物間的聯(lián)系。當(dāng)你問(wèn)"中國(guó)的首都是哪里"時(shí),AI能通過(guò)知識(shí)圖譜直接找到答案;當(dāng)你進(jìn)一步詢問(wèn)"北京的人口多少"時(shí),AI可以順著關(guān)系網(wǎng)絡(luò)
找到相關(guān)信息
。
知識(shí)圖譜由三元組構(gòu)成:實(shí)體-關(guān)系-實(shí)體。這種結(jié)構(gòu)與人類認(rèn)知方式相近,讓機(jī)器能更自然地理解世界。與傳統(tǒng)數(shù)據(jù)庫(kù)的表格存儲(chǔ)不同,知識(shí)圖譜將信息組織成網(wǎng)絡(luò),便于推理和發(fā)現(xiàn)隱含關(guān)系。
當(dāng)我們說(shuō)"AI擁有知識(shí)
"時(shí),實(shí)際上是指AI能夠訪問(wèn)和利用知識(shí)圖譜中儲(chǔ)存的結(jié)構(gòu)化信息。這些信息經(jīng)過(guò)精心組織,使AI能夠進(jìn)行類似人類的思考過(guò)程。
構(gòu)建AI的知識(shí)架構(gòu)
構(gòu)建知識(shí)圖譜如同為AI打造一張認(rèn)知地圖。這個(gè)過(guò)程涉及多個(gè)環(huán)節(jié):數(shù)據(jù)收集、數(shù)據(jù)清洗、結(jié)構(gòu)設(shè)計(jì)、圖譜構(gòu)建、圖計(jì)算和應(yīng)用部署
。
數(shù)據(jù)是知識(shí)圖譜的基礎(chǔ)
。在金融風(fēng)控領(lǐng)域,我們需要收集客戶手機(jī)號(hào)、銀行卡、設(shè)備信息、單位數(shù)據(jù)、位置信息等多維度數(shù)據(jù)。這些數(shù)據(jù)點(diǎn)將成為圖譜中的節(jié)點(diǎn)或?qū)傩浴?shù)據(jù)質(zhì)量直接影響圖譜效果,所以數(shù)據(jù)清洗至關(guān)重要。
結(jié)構(gòu)設(shè)計(jì)決定了知識(shí)圖譜的組織方式。常見(jiàn)的有兩種結(jié)構(gòu):
隱性申請(qǐng)節(jié)點(diǎn)結(jié)構(gòu)
強(qiáng)調(diào)客戶間關(guān)系的簡(jiǎn)潔呈現(xiàn),計(jì)算效率高,客戶關(guān)聯(lián)只需兩度計(jì)算。適合簡(jiǎn)單業(yè)務(wù)模式,如單次授信用款場(chǎng)景。
顯性申請(qǐng)節(jié)點(diǎn)結(jié)構(gòu)
將申請(qǐng)行為作為獨(dú)立節(jié)點(diǎn),能清晰表現(xiàn)客戶多次申請(qǐng)行為,適合復(fù)雜業(yè)務(wù)場(chǎng)景如循環(huán)額度、多次用款。這種結(jié)構(gòu)計(jì)算客戶關(guān)聯(lián)需要四度計(jì)算,資源消耗較大。
圖譜構(gòu)建完成后,我們可以通過(guò)社區(qū)發(fā)現(xiàn)算法識(shí)別緊密連接的客戶團(tuán)簇,通過(guò)中心度算法
發(fā)現(xiàn)關(guān)鍵節(jié)點(diǎn),用最短路徑算法分析客戶間最緊密的關(guān)聯(lián)途徑。這些圖計(jì)算能力是傳統(tǒng)數(shù)據(jù)庫(kù)難以實(shí)現(xiàn)的。
知識(shí)圖譜:AI賦能的關(guān)鍵戰(zhàn)場(chǎng)
知識(shí)圖譜在多個(gè)領(lǐng)域展現(xiàn)出強(qiáng)大價(jià)值,從金融風(fēng)控到醫(yī)療健康,從智能搜索到AI集成,正成為數(shù)字化轉(zhuǎn)型的核心引擎
。
金融風(fēng)控領(lǐng)域
,知識(shí)圖譜通過(guò)構(gòu)建客戶關(guān)系網(wǎng)絡(luò),能高效識(shí)別欺詐團(tuán)伙。
一個(gè)示例場(chǎng)景:18個(gè)申請(qǐng)客戶通過(guò)設(shè)備、電話等多種關(guān)系形成緊密連接,其中13人出現(xiàn)逾期,逾期率高達(dá)72.2%。傳統(tǒng)數(shù)據(jù)庫(kù)需要多次全量掃描才能發(fā)現(xiàn)這樣的關(guān)聯(lián)團(tuán)簇,而知識(shí)圖譜可以秒級(jí)完成。知識(shí)圖譜還能識(shí)別團(tuán)伙中的核心節(jié)點(diǎn),發(fā)現(xiàn)可能的中介欺詐行為。
醫(yī)療健康領(lǐng)域
,知識(shí)圖譜連接癥狀、疾病、治療和藥物,支持智能診療。
有趣的是,百度靈醫(yī)智惠系統(tǒng)通過(guò)知識(shí)圖譜實(shí)現(xiàn)了智能問(wèn)診,其診斷準(zhǔn)確率和人類醫(yī)生相當(dāng),處方藥方與老中醫(yī)開(kāi)具的方案相似度可達(dá)80-90%。這說(shuō)明AI已經(jīng)可以將結(jié)構(gòu)化醫(yī)學(xué)知識(shí)轉(zhuǎn)化為臨床決策支持。
智能搜索方面
,知識(shí)圖譜是Google、百度等搜索引擎革命性升級(jí)的核心技術(shù)。
當(dāng)你搜索"周杰倫的妻子"時(shí),搜索引擎不再僅僅匹配關(guān)鍵詞,而是理解"周杰倫"是一個(gè)人,"妻子"是一種關(guān)系,直接給出"昆凌"這個(gè)答案。
最令人興奮的是知識(shí)圖譜與大語(yǔ)言模型的結(jié)合
。
當(dāng)前的LLM主要解決了感知問(wèn)題,而知識(shí)圖譜作為符號(hào)學(xué)派的代表,可以為AI提供結(jié)構(gòu)化的世界知識(shí)和推理能力。多倫多大學(xué)的Geoffrey Hinton教授指出,AI未來(lái)發(fā)展方向之一是深度神經(jīng)網(wǎng)絡(luò)與符號(hào)人工智能的深入結(jié)合。知識(shí)圖譜正在成為邁向通用人工智能(AGI)的重要基石。
從本質(zhì)上看,知識(shí)圖譜是AI從"感知智能
"邁向"認(rèn)知智能
"的關(guān)鍵一步。它不僅提供了海量結(jié)構(gòu)化知識(shí),更重要的是提供了一種類似人類思維的關(guān)聯(lián)推理方式。
隨著知識(shí)圖譜技術(shù)的發(fā)展,我們將看到AI在理解、推理、聯(lián)想等高級(jí)認(rèn)知功能上的顯著進(jìn)步,最終實(shí)現(xiàn)真正意義上的智能AGI
。