成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<strike id="48yim"></strike>

<abbr id="48yim"><source id="48yim"></source></abbr>

<cite id="48yim"></cite>

<abbr id="48yim"><source id="48yim"></source></abbr>

<rt id="48yim"></rt>

<button id="48yim"></button>

<cite id="48yim"></cite>

<rt id="48yim"><delect id="48yim"></delect></rt>

<li id="48yim"><source id="48yim"></source></li>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

賬號設置退出

賈強槐：螞蟻大規模知識圖譜構建及其應用

作者：賈強槐 2023-09-08 07:45:32

人工智能知識圖譜

知識圖譜旨在利用圖結構建模、識別和推斷事物之間的復雜關聯關系和沉淀領域知識，是實現認知智能的重要基石，已經被廣泛應用于搜索引擎、智能問答、語言語義理解、大數據決策分析等眾多領域。本文將分享螞蟻集團在知識圖譜上的工作。

一、圖譜概覽

首先介紹知識圖譜的一些基礎概念。

1、什么是知識圖譜

知識圖譜旨在利用圖結構建模、識別和推斷事物之間的復雜關聯關系和沉淀領域知識，是實現認知智能的重要基石，已經被廣泛應用于搜索引擎、智能問答、語言語義理解、大數據決策分析等眾多領域。

知識圖譜同時建模了數據之間的語義關系和結構關系，結合深度學習技術可以把這兩者關系更好得融合和表征。

2、為什么要建知識圖譜

我們要建設知識圖譜主要是從如下兩點出發考慮：一方面是螞蟻本身的數據來源背景特點，另一方面是知識圖譜能帶來的好處。

[1] 數據來源本身是多元和異構的，缺乏一套統一的知識理解體系。

[2] 知識圖譜能夠帶來多個好處，包括：

語義標準化：利用圖譜構建技術提升實體、關系、概念等的標準化和歸一化水平。
領域知識沉淀：基于語義、圖結構實現知識表示和互聯，從而積累豐富的領域知識。
知識復用：構建高質量的螞蟻知識圖譜，通過融合、鏈接等服務多下游，為業務降本提效。
知識推理發現：基于圖譜推理技術發現更多長尾知識，服務風控、信貸、理賠、商家運營、營銷推薦等場景。

3、如何構建知識圖譜的概覽

在構建各類業務知識圖譜的過程中，我們沉淀出了一套螞蟻知識圖譜的通用構建范式，主要分為如下五個部分：

從業務數據出發，作為圖譜冷啟動的重要數據來源。
他域的知識圖譜同現有圖譜進行融合，通過實體對齊的技術來實現。
業務領域結構化的知識庫同現有的知識圖譜的進行融合，也是通過實體對齊的技術實現。
非結構和半結構化的數據，例如文本會對其進行信息抽取，通過實體鏈指技術實現對現有圖譜進行更新。
領域概念體系和專家規則的融入，將相關概念、規則與現有知識圖譜進行鏈接。

有了通用的構建范式后，就需要進行體系化的建設。從兩個視角來看螞蟻知識圖譜的體系化建設。首先是從算法視角來看，有各種算法能力，比如知識推理、知識匹配等等。從落地視角來看，自下而上，最下面的基礎依賴包括圖計算引擎和認知底座計算；其上是圖譜底座，包括NLP&多模平臺以及圖譜平臺；往上是各種圖譜構建技術，基于此我們就可以構建螞蟻知識圖譜；在知識圖譜的基礎上，我們可以做一些圖譜推理；再往上，我們提供一些通用的算法能力；最上面是業務應用。

二、圖譜建設

接下來分享螞蟻集團建設知識圖譜的一些核心能力，包括圖譜構建、圖譜融合、圖譜認知三個方面。

1、圖譜構建

圖譜構建的流程主要包括六步：

數據源，獲取多元數據。
知識建模，將海量數據轉化成結構化的數據，從概念、實體和事件三個域來建模。
知識獲取，搭建了知識加工研發平臺。
知識存儲，包括Ha3存儲和圖存儲等。
知識運營，包括知識編輯、在線查詢、抽取等。
持續學習，讓模型自動地進行迭代學習。

構建過程中的三個經驗與技巧

融合專家知識的實體分類

在構建知識圖譜中，需要對輸入的實體進行分類，在螞蟻場景下是一個大規模多標簽分類的任務。為了融合專家知識來進行實體分類，主要做如下三點優化：

語義信息增強：引入label語義圖表示學習的Embedding。
對比學習：加入層次label監督的對比。
邏輯規則約束：融入專家先驗知識。

領域詞表注入的實體識別

在實體識別的基礎上，從字詞連邊的圖結構出發，讓模型學習到對連邊的合理賦權，對噪聲詞連邊減小權重。提出了邊界對比學習和語義對比學習兩個模塊：

邊界對比學習，用來解決邊界沖突問題。在詞表注入之后，構建一個全連接圖，用GAT來學習每個token的表征，邊界分類正確的部分構建一個正例的圖，錯誤的部分構建負例的圖，通過對比讓模型學到每個token的邊界信息。
語義對比學習，用來解決語義沖突問題。借鑒了原型學習思想，把label的語義的表征加進來，強化每個token與label語義之間的關聯關系。

邏輯規則約束的小樣本關系抽取

在領域問題上我們的標注樣本很少，會面臨few-shot或zero-shot的場景，在這種情況下進行關系抽取的核心思想就是引入外部知識庫，為了解決語義空間不同導致的性能下降問題，設計了基于邏輯規則的推理模塊；為了解決實體類型匹配導致的死記硬背問題，設計了細微差異感知模塊。

2、圖譜融合

圖譜融合是指不同業務領域下圖譜之間的信息融合。

圖譜融合的好處：

跨業務的知識復用：基于圖譜本體模型，實現跨業務的知識連接。
減少無效數據拷貝：連接即可應用，標準化知識服務鏈路。
業務快速價值落地：減少業務找數據的成本，通過知識復用帶來更大業務價值，降本提效。

圖譜融合中的實體對齊

知識圖譜融合過程中一個核心技術點就是實體對齊，這里我們采用了SOTA算法BERT-INT，主要包括兩個模塊，一個是表示模塊，另一個是交互模塊。

算法的實現流程主要包括召回和排序：

召回：在表示模塊，利用標題文本的 BERT向量相似度召回。

基于標題+屬性+鄰居的排序模型：ü 利用表示模塊，完成對標題、屬性和鄰居的向量表示：

計算標題的cos相似度。
分別計算兩個實體的屬性和鄰居集合間的相似度矩陣，并提取一維相似度特征。
將三個特征拼接為特征向量計算Loss。

3、圖譜認知

這一部分，主要介紹一下螞蟻內部的知識表示學習框架。

螞蟻提出了一個基于Encoder-Decoder框架的知識表示學習。其中Encoder是一些圖神經的學習方法，Decoder是一些知識表示的學習，比如鏈接預測。這套表示學習框架可以自監督產出通用的實體/關系Embedding，有幾個好處：1）Embedding Size遠小于原始特征空間，降低了存儲成本；2）低維向量更稠密，有效緩解數據稀疏問題；3）同一向量空間學習，對多源異質數據的融合更自然；4）Embedding具有一定的普適性，方便下游業務使用。

三、圖譜應用

接下來分享幾個在螞蟻集團中知識圖譜的典型應用案例。

1、圖譜的場景應用模式

在介紹具體案例前，先來介紹一下螞蟻知識圖譜場景應用的幾種模式，主要包括知識獲取、知識管理和推理，以及知識服務。如下圖所示。

2、一些典型的案例

案例1：基于知識圖譜的結構化匹配召回

業務場景是支付寶主搜里面的小程序的內容下掛，要解決的業務痛點是：

商品實體，以及商品上下位關系匱乏。
小程序商品級理解能力弱。

解決方案是，構建了商家知識圖譜。結合商家圖譜的商品關系，實現對用戶query商品級別的結構化理解。

案例2：用戶意圖實時預測在推薦系統應用

這一案例是針對首頁推薦進行用戶意圖實時預測，構建了AlipayKG，框架如上圖所示。相關工作也發表在頂會www 2023上，可以參考論文做更進一步的理解。

案例3：融合知識表征的營銷券推薦

這個場景是消費券推薦的一個場景，業務面臨的痛點為：

頭部效應嚴重。
用戶核銷領取行為稀疏。
冷啟動用戶和券很多，缺少對應的足跡數據。

為了解決上述問題，我們設計了融合動態圖表征的深度向量召回算法。因為我們發現用戶消費券的行為是有周期性的，靜態的單條邊是無法建模這種周期性行為的。為此我們首先構建了動態圖，接著采用團隊自研的動態圖算法來學習Embedding表征，得到表征之后再放到雙塔模型中去，進行向量召回。

案例4：基于診療事件的智能理賠專家規則推理

最后一個案例是關于圖譜規則推理。以醫療保險健康圖譜為例，包括醫學知識、理賠規則、“人”的健康的信息，進行實體鏈指，再加上邏輯規則，來作為決策的依據。通過圖譜實現了專家理賠效率的提升。

四、圖譜與大模型

最后簡單探討一下在當前大模型快速發展的背景下知識圖譜的機遇。

1、知識圖譜與大模型的關系

知識圖譜與大模型各有優缺點，大模型的主要有通用知識建模和普適性等優點，而大模型的缺點正好是知識圖譜的優點所能彌補的。圖譜的優點包括準確性很高、可解釋性強等。大模型和知識圖譜是能夠相互影響的。

圖譜和大模型的融合通常存在三種路線，一種是利用知識圖譜來增強大模型；第二種是利用大模型來增強知識圖譜；第三種是大模型和知識圖譜協同并進，優勢互補，大模型可以認為是一種參數化的知識庫，知識圖譜可以認為是一種顯示化的知識庫。

2、大模型與知識圖譜相應用的案例

大模型應用于知識圖譜構建

在知識圖譜構建的過程中，可以利用大模型來進行信息抽取、知識建模和關系推理。

如何利用大模型來應用于知識圖譜的信息抽取

達摩院的這個工作將信息抽取問題分解成了兩個階段：

在第一階段，我們想要找到文本中存在的實體、關系或者事件類型，以減小搜索空間和計算復雜度。
在第二階段，我們根據前面抽取的類型和給定的對應列表，進一步抽取出相關信息。

將知識圖譜應用于大模型

將知識圖譜應用于大模型主要包括三個方面：

將知識圖譜整合到大模型輸入中?？梢岳弥R圖譜來進行數據清洗，或利用知識圖譜直接顯式地進行形式化拼接。

將知識圖譜融合到大模型訓練中。比如同時進行兩個任務的訓練，知識圖譜可以做知識表示的任務，大模型做MLM的預訓練，兩者聯合建模。

將知識圖譜注入到大模型推理中。首先可以解決大模型的兩個問題，一是將知識圖譜作為先驗約束，來避免大模型“胡說八道”；第二就是解決大模型時效性問題。另一方面，基于知識圖譜，可以為大模型生成提供可解釋方案。

知識增強的問答系統

主要包括兩類，一塊是知識圖譜增強的問答系統，即用大模型來優化KBQA的模式；另一個是信息檢索增強，類似LangChain、GopherCite、New Bing等用大模型來做知識庫問答的形式。

知識增強的生成式搜索問答系統，有如下優勢：

通過接入搜索系統，解決時效性問題。
通過提供Reference鏈接，可以進行人工核查，以解決事實性錯誤問題。
引入搜索結果，豐富上下文，增強大模型生成效果。

3、總結與展望

知識圖譜與大模型如何更好地交互協同共進，包括如下三個方向：

推進知識圖譜和大模型在NLP、問答系統等領域的深入應用。
使用知識圖譜進行大模型的幻覺檢測和去毒。
結合知識圖譜的領域大模型研發。

責任編輯：姜華來源： DataFunTalk

知識圖譜深度學習

51CTO技術棧公眾號

業務
速覽

媒體

51CTO CIOAge HC3i

社區

51CTO博客鴻蒙開發者社區 AI.x社區

教育

51CTO學堂精培企業培訓 CTO訓練營

主站蜘蛛池模板：亚洲午夜av久久乱码 | 97av视频在线 | 视频一区在线观看 | 蜜臀网站 | 三级黄片毛片 | 成人福利 | 看av片网站| 欧美日韩高清 | 欧美日韩一区精品 | 成人精品国产一区二区4080 | a级黄色片视频 | 亚洲一区综合 | 精品中文视频 | 亚洲91精品 | 精品国产乱码久久久久久丨区2区 | 操操操日日日 | 国产成人精品一区二区三区四区 | 成人在线免费观看 | 中文字幕在线一区 | 美国黄色毛片 | www.887色视频免费 | 一区二区久久精品 | 男人的天堂亚洲 | 国产 91 视频 | 老外黄色一级片 | 亚洲精品www.| 91福利网址| 91视频免费在观看 | 国产日韩欧美一区二区在线播放 | 在线日韩 | 国产女人与拘做视频免费 | 日韩黄色av| 成人高清在线视频 | 黄视频网站在线 | 午夜三级在线观看 | a级大片免费观看 | 久草视频观看 | 国产成人综合一区二区三区 | 天堂在线www | 日韩中文字幕在线观看 | 日韩欧美在线观看视频 |

<li id="okwqs"></li>

<li id="okwqs"></li>

<cite id="okwqs"></cite>

<abbr id="okwqs"></abbr>