神了!最大化 DeepSeek 潛能 :知識圖譜激活
deepseek原理+應用+實踐,和大家分享:
- 小眾的,deepseek核心技術原理;
- 大眾的,提示詞要怎么寫;
畫外音:文末有大彩蛋。
今天和大家聊聊,deepseek的核心技術之一的知識圖譜激活。
什么是知識圖譜(Knowledge Graph)?
互聯(lián)網(wǎng)上有很多孤立的信息,知識圖譜以一種圖的形式,通過實體(Entity),關系(Relation)和屬性(Atrribute)這個三維組將這些信息組織起來,形成知識,來描述這個世界,這就是知識圖譜。
知識圖譜簡直就是為AI量身定做的:
(1) 信息檢索效率極大提升
- 傳統(tǒng):關鍵詞匹配
- 知識圖譜:語義關聯(lián)
(2) 推理速度極大替身
- 傳統(tǒng):海量數(shù)據(jù)分析(秒,十秒級)
- 知識圖譜:節(jié)點跳轉(zhuǎn)(毫秒級)
(3) 可解釋性強
- 傳統(tǒng):難以解釋
- 知識圖譜:按照路徑推理
結合前幾天兩處核心知識的鋪墊:
- 多跳推理:將信息關聯(lián),整合與推理;
- MOE:模型不再追求大而全,而是追求多個專而精的專家;
知識圖譜能夠以MOE訓練出的多個專家為核心,將知識快速組織與關聯(lián)起來。
那什么是知識圖譜激活?
Knowledge Graph Activation,AI通過MOE預訓練,得到了非常多專家核心節(jié)點。在回答用戶問題的時候,需要:
- 快速定位專家類型;
- 快速加載專家子圖譜;
這個過程,就是知識圖譜激活。
知識圖譜激活對我們寫提示詞,獲取更佳的回答質(zhì)量有什么啟示呢?
為了提高效率與質(zhì)量,可以在提示詞中:
- 實體(Entity)或者屬性(Atrribute)明確化:包含能夠快速定位專家身份的關鍵詞;
- 關系(Relation)顯式化:包含能夠快速定位專家身份的關鍵詞;
- 領域或者身份顯式化:明確告知領域,或者明確定義專家(專家團)身份;
畫外音:MOE機制支持定義多專家身份,并且多個身份交叉驗證能夠提升回復質(zhì)量。
如果我們不顯式告訴AI希望他扮演什么專家:
- AI需要通過提示詞推理出MOE專家角色,占用深度思考時間,效率會降低;
- 有概率推理出錯誤的專家,回復質(zhì)量會下降;
案例一:屬性明確化。
bad case:請介紹“架構師之路”。
這樣的提示詞,完全不符合預期。
畫外音:Kimi居然還需要搜索,說明無法解答相關知識。
better case:請介紹帥氣的“架構師之路”?
加入明確的屬性,AI立刻能識別,載入并激活正確的知識子圖譜,快速輸出高質(zhì)量內(nèi)容。
畫外音:Kimi不需要搜索,說明學習并固化了相關知識,形成了“真理”。
案例二:關系顯示化。
bad case:請介紹幾種降低通訊延時的方法。
軟件?硬件?哪個領域?這樣的提示詞,未必能夠找到正確的專家子節(jié)點。
better case:請介紹幾種互聯(lián)網(wǎng)架構中,降低服務與數(shù)據(jù)庫通訊延時的方法。
通過提示詞告之顯示的關系:
互聯(lián)網(wǎng)架構 -> 服務與數(shù)據(jù)庫 -> 通訊延時
提升定位專家節(jié)點的效率,快速輸出相關的知識。
案例三:領域或者身份顯示化。
上面的case,還可以這么優(yōu)化。
best case:假設你是由以下專家組成的團隊:
- 分布式領域系統(tǒng)架構師
- 互聯(lián)網(wǎng)資深網(wǎng)絡工程師
- 資深DBA
請分別從各自領域提出3種降低服務與數(shù)據(jù)庫通訊延時的方法。
直接定位專家節(jié)點,縮短回復時間,提升回答質(zhì)量,多個專家還能夠交叉驗證(大而全模型可能過擬合)。
總結
- 知識圖譜是AI的核心技術(之一),通過實體,關系,屬性組織與描述現(xiàn)實世界的信息,形成知識;
- 知識圖譜激活能極大提升AI輸出效率與輸出質(zhì)量;
- 提示詞通過屬性明確化,關系顯示化,領域與身份顯示化,能夠最大化發(fā)揮AI的潛力;
一切的一切,提示詞只有適配了AI的認知模式,才能最高效的發(fā)揮最大的作用。
知其然,知其所以然。
思路比結論更重要。
補充閱讀材料:
《知識圖譜激活》:https://www.clouddatainsights.com/activating-an-active-metadata-knowledge-graph-for-data-management-applications/