成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

人工智能和知識圖譜四:知識圖譜的超大規模產品

人工智能
知識圖譜的超大規模產品主要的提供商者包括:亞馬遜網絡服務 (AWS)、谷歌云平臺 (GCP)、微軟 Azure 和 IBM Cloud——都提供用于構建和管理知識圖譜的服務和工具,這些服務和工具通常作為其更廣泛的數據和 AI 平臺的一部分。本文我們將回顧這些產品,包括具體產品,它們的功能、定價模型以及與 AI 服務的集成。

一、亞馬遜網絡服務 (AWS) — Amazon Neptune

AWS 的主要圖形數據庫服務是Amazon Neptune,這是一款完全托管的圖形數據庫引擎。Neptune 功能多樣,既支持 使用 SPARQL 查詢的RDF 模型,也支持使用 Apache TinkerPop Gremlin 查詢的屬性圖模型。這種雙重支持使 Neptune 適用于各種 KG 實現——您可以使用 RDF/OWL 存儲語義知識圖并通過 SPARQL 進行查詢,或者將屬性圖方法與 Gremlin 結合使用。

1.Neptune 強調云原生和可擴展性:它可以處理數十億個關系,并具有讀取副本等功能,可水平擴展讀取吞吐量,并通過集群實現高可用性。Neptune 值得注意的集成之一是Neptune ML,它利用 Amazon SageMaker 對圖形數據執行機器學習。 Neptune ML 使用深度圖庫 (DGL) 基于您的 Neptune 數據訓練圖神經網絡模型,從而能夠直接在數據庫中的圖上執行鏈接預測或節點分類等任務。這使得在知識圖譜之上構建人工智能變得更加容易,而無需將數據拉入單獨的機器學習管道。

2.在功能方面,Neptune 支持時間點恢復、靜態加密和 VPC 隔離,以滿足企業需求。其市場用例包括知識圖譜、身份圖譜、欺詐檢測網絡、推薦引擎等。例如,Amazon Alexa 團隊使用 Neptune 來存儲和查詢 Alexa 知識圖譜以進行問答。

3.在定價方面: Neptune 的定價模式是 AWS 數據庫的典型定價模式,您需要按實例小時數(實例大小不同)、使用的存儲空間和 I/O 操作付費。根據最近的定價,db.r5.large美國地區的一個實例每小時費用約為 0.23 美元。如果您需要副本來實現讀取擴展,則每個副本都是另一個以類似方式收費的實例。存儲按每月每 GB 收費,I/O 請求按每百萬次請求收費。除了 SageMaker 的訓練實例費用外,Neptune ML 沒有其他費用(AWS 指出,Neptune 不會對 ML 集成收取額外費用)。這意味著,如果您啟用 Neptune ML,則需要為所使用的 ML 實例/時間付費。AWS 采用按需付費模式,小型開發者可以相對便宜地在 Neptune 上進行實驗,甚至還有幾個月的免費試用套餐,而企業則可以配置大型集群(使用多可用區以提高彈性)。

4.在AI集成方面:除了 Neptune ML,AWS 還提供其他可與圖數據集成的 AI 服務。例如,Amazon Comprehend(用于自然語言處理)可以從文本中提取實體,然后將其添加到 Neptune 以豐富知識圖譜。此外,還有用于數據集成的 AWS Glue,可以將數據輸入 Neptune。AWS 已經發布了一些示例,例如“欺詐圖譜筆記本”展示了如何使用 Neptune 進行欺詐團伙檢測,并將其與 SageMaker 連接進行預測建模。總體而言,AWS 的策略是提供一個穩定的圖形數據庫核心(Neptune),并允許用戶將其連接到 AWS 生態系統中的各種分析和機器學習工具。

二、Google Cloud——企業知識圖譜及相關服務

 Google 在內部大規模使用知識圖譜,Google 知識圖譜支持 Google 搜索的功能,可以回答諸如“埃菲爾鐵塔有多高?”之類的事實性問題。對于外部客戶,Google Cloud 除了 API 和解決方案框架外,沒有同名的單一“Google 知識圖譜”產品:

1.知識圖譜搜索 API:谷歌提供了一個功能有限的知識圖譜搜索 API,允許開發者通過名稱或關鍵字查詢谷歌公共知識圖譜中的實體。這將返回實體元數據(例如 ID、描述和一些已知屬性)。然而,該 API 的使用范圍相當有限,主要用于基本的實體識別或查找,而非完整的圖數據庫解決方案(并且受到配額等限制)。

2.企業知識圖譜解決方案: 2022-2023 年,谷歌云推出了企業知識圖譜 (EKG)解決方案,本質上是在 GCP 上構建知識圖譜的工具包。它并非單一的托管圖形數據庫,而是提供實體協調 API (Entity Reconciliation API)等服務,并提供使用現有 GCP 服務構建知識圖譜的指南。例如,實體協調 API 是一種人工智能驅動的服務,用于跨數據集匹配和去重實體(例如,解析一個數據庫中的“Bob J. Smith”和另一個數據庫中的“Robert Smith”是同一個人)。它利用谷歌的知識和機器學習進行大規模模糊匹配,在底層聚類分析中處理多達“數十億個節點和數萬億條邊”[37]。本質上,谷歌正在利用其在實體解析方面的經驗將其作為一項服務提供,這是從孤立數據構建干凈的知識圖譜的關鍵一步。 EKG 還包含將關系數據轉換為 RDF 圖的工具(文檔中提到將 BigQuery 表轉換為 RDF 三元組)。因此,谷歌的方法更面向解決方案:他們提供構建企業級知識圖譜的構建模塊——存儲可以存儲在 BigQuery 中(使用鄰接表或圖結構),并通過 AI API 進行分析。

3.圖形數據庫選項:有趣的是,谷歌云并沒有像 Neptune 或 Cosmos DB Graph 這樣的原生圖形數據庫產品。相反,他們與企業合作或鼓勵使用谷歌云市場上的平臺(例如,Neo4j 的云服務 Neo4j Aura 可在 GCP 上使用)。谷歌也提到了其內部圖形引擎,但并未正式發布。不過,人們當然可以在 GCP 虛擬機上運行開源圖形數據庫,或者使用 BigQuery 的新圖形擴展(BigQuery 推出了一些圖形分析功能和執行遞歸 SQL 的能力,可以模擬某些圖形查詢)。谷歌云解決方案資源管理器提供了知識圖譜的模式,通常將 BigQuery 與機器學習相結合。此外,還有Vertex AI(谷歌的機器學習平臺),它可以與知識圖譜數據一起使用——例如,構建一個引用知識圖譜特征的人工智能模型。

4.AI 集成與定價:谷歌的知識圖譜 (KG) 相關服務(例如知識圖譜搜索 API)按 API 調用次數計費(有免費配額)。實體協調 API 可能會按使用量計費(作為 Vertex AI 或數據集成成本的一部分)。谷歌傾向于對數據處理和存儲收費(BigQuery 按掃描的 TB 和存儲的 TB 收費)。如果您使用 BigQuery 托管知識圖譜(表格形式,例如三重表),則查詢將按掃描的每條數據收費。用于知識圖譜構建的 Vertex AI 流水線(例如運行 TensorFlow 模型以嵌入知識圖譜)將產生計算費用。谷歌也一直在探索圖譜 + 知識圖譜 (LLM) 集成——例如,他們已經發表了關于將 PaLM 語言模型與知識圖譜信息相結合以獲得更佳答案的文章。在其 GenAI 產品中,“Vertex AI 搜索”和“Vertex AI 對話”工具可能會選擇在后端使用知識圖譜。例如,谷歌的生成式 AI 應用構建器可以查詢知識庫或向量數據庫作為響應的一部分,盡管細節正在浮現。

綜上所述,谷歌云的戰略有些割裂:他們擁有面向消費者的專有且龐大的知識圖譜(KG,搜索),以及面向企業的工具(EKG、API),幫助企業利用谷歌的技術構建自己的知識圖譜。這些功能雖然強大(例如,通過實體解析對數十億條記錄進行聚類),但需要集成,而且不像 Neptune 那樣提供單一的交鑰匙數據庫。使用 GCP 的組織通常會將這些服務整合在一起:使用 Cloud Storage/BigQuery 處理數據,使用 AI API 進行處理,或許還會使用第三方圖數據庫進行查詢。

三、Microsoft Azure — Azure Cosmos DB(Gremlin API)和認知服務

Microsoft 主要通過適用于 Apache Gremlin 的 Azure Cosmos DB提供圖形功能。Cosmos DB 是 Azure 的全球分布式多模型數據庫,其 API 之一是 Gremlin(圖形)API,它支持屬性圖形數據和 Gremlin 查詢/遍歷語言。這實際上允許您將 Cosmos DB 用作類似于 Neo4j 的托管圖形數據庫,但它是云原生的并且跨區域分布。Cosmos DB 的 Gremlin API 是無模式的(您可以隨時定義頂點和邊標簽),非常適合需要高可用性和擴展的應用程序。Azure Cosmos 可以自動跨分區對圖形進行分片以實現擴展,并提供有保證的延遲和吞吐量(您配置 RU/s - 每秒請求單位)。

這種定價模型是基于吞吐量的 ,您需要為預配置的 RU/s 和存儲付費。例如,您可以配置 10,000 RU/s(對應于每秒一定數量的讀/寫容量),并按小時收費,無論使用情況如何。如果過度配置,Cosmos DB 的成本可能會很高,但如果調整得當,它可以確保快速的性能。Azure 還推出了適用于 PostgreSQL 的 Cosmos DB(帶有 pgGraph) ——但這在其他類型的圖數據庫方面還處于預覽階段。除了數據庫之外,微軟還在Azure 認知服務中利用知識圖譜。知識類別中有一個認知服務子集,歷史上包括 QnA Maker(現在是 Azure 語言認知服務的一部分,用于從文檔構建常見問題機器人)。還有Azure 認知搜索,它具有知識存儲的概念,它可以將從文檔中提取的豐富內容存儲在類似圖形的結構中(鏈接實體的表格或 JSON)。

微軟的研究有幾個知識驅動的項目:例如,知識探索服務(KES),它支撐了一些學術搜索,以及現已退役的微軟學術圖譜 (Microsoft Academic Graph)。微軟的必應 (Bing) 雖然沒有直接以產品形式呈現,但它擁有自己的 Satori 知識圖譜,可在必應搜索和 Windows 系統中使用(類似于谷歌為谷歌搜索提供的 KG)。對于企業,Azure 建議使用Azure Databricks或Synapse等模式來處理數據,然后將關系存儲在 Cosmos DB 或帶有圖擴展的 Azure SQL 中。Azure上的人工智能集成現在有一個流行的概念:圖譜 + RAG(檢索增強生成)。微軟發布了“GraphRAG”方法,將知識圖譜與 Azure OpenAI(提供 GPT 模型)結合使用,以改進響應。例如,與其僅使用文本塊作為 GPT-4 模型的知識,不如使用圖譜檢索相關事實的子圖并將其提供給模型,或者讓模型生成在圖譜上執行的查詢。事實上,微軟在 GitHub 上的示例代碼 (GraphRAG) 展示了從文檔中提取知識圖譜并將其與 LLM 結合使用的流程。這反映了 Azure 如何將知識圖譜集成到其 AI 堆棧中,以支持需要更好數據基礎的企業用例。

四、IBM Cloud

 IBM 的知識圖譜方法通常通過解決方案而非單一的云服務實現。IBM 在知識表示方面有著悠久的歷史,例如IBM Watson 在 Jeopardy 上的成功就體現在問答對和本體的知識圖譜上。IBM 提供的Cloud Pak for Data包含一個知識目錄——主要用于數據治理(元數據管理),但也可以看作是企業數據資產知識圖譜的一部分。IBM 的研究和咨詢部門經常提供定制的知識圖譜解決方案,例如,為金融或醫療保健領域的客戶構建知識圖譜。IBM 確實在 2017 年左右創建了一款名為IBM Knowledge Graph的產品,作為 IBM Cloud 上的一項服務,專注于從結構化和非結構化數據創建知識圖譜,但現在它并不十分突出(IBM 的云經歷了許多變化)。相反,IBM 目前的敘述將知識圖譜與其Watson AI 服務和Watsonx(他們的新 AI/LLM 平臺)聯系在一起。他們主張使用知識圖譜來實現值得信賴的人工智能。例如,IBM 數據科學博客 (2025) 中一篇關于實現Graph RAG 的文章在 Watsonx.ai 環境中使用了 Memgraph(一個開源圖形數據庫)。IBM 的策略似乎是在需要的地方集成開放技術——他們可能會部署 Neo4j 或 Neptune 來解決問題,并結合 IBM 自己的 NLP 來填充圖形。IBM 強調知識圖譜在某些行業中的作用:在醫療保健領域,他們將知識圖譜與 NLP 相結合以協助臨床決策,例如,Watson for Oncology 系統使用了精心挑選的疾病、藥物、試驗的醫學知識圖譜;在金融領域,他們將知識圖譜與可解釋的人工智能相結合以遵守法規;在制造業,他們將知識圖譜用于供應鏈和物聯網(數字孿生)。IBM 已經撰寫了關于知識圖譜的文章,使人工智能更易于解釋、更透明,并符合負責任的人工智能原則。IBM 員工在《福布斯技術委員會》上發表的文章可能會指出,知識圖譜通過顯式編碼知識使人工智能系統更易于檢查和控制。

在功能方面: IBM 的知識圖譜解決方案通常包括從文本中提取實體和關系的工具(利用 IBM 的自然語言處理 (NLP))、本體管理(IBM 多年來一直為 RDF/OWL 標準做出貢獻),有時還包括邏輯規則(IBM 在 ILP 和規則系統方面擁有專業知識)。它們通常采用開源技術:例如,使用 JanusGraph(IBM 參與開發,因為它是從 Titan 分叉而來的)作為大規模圖存儲的后端。IBM 還有一款名為Watson Discovery 的產品,它通過構建知識圖譜或至少是企業內容的語義索引來進行認知搜索。

在定價方面:對于 IBM,如果使用 Cloud Pak for Data,則更像是一種許可模式(為軟件和云基礎設施付費)。對于 Watson 服務,通常基于 API 調用進行定價(例如 NLU、Discovery 按 1000 個項目定價等)。IBM 的方法通常是解決方案驅動的,因此確切的定價會根據每個項目量身定制。例如,如果一家銀行聘請 IBM 來實施欺詐知識圖譜,則成本包含 IBM 服務以及任何云使用費用。

五、小結

每個超大規模器在其堆棧中集成知識圖譜的方式不同:

AWS:提供一個簡單的托管圖形數據庫 (Neptune),可以作為知識圖譜的骨干,并與 AWS ML 服務緊密集成(使用 SageMaker 的 Neptune ML)。定價按小時和按請求計算,這是 AWS 數據庫服務的典型做法。

谷歌:谷歌在搜索領域利用其自身無與倫比的知識圖譜,同時為客戶提供企業級知識圖譜框架(具有谷歌規模的實體協調功能)等工具,并鼓勵使用其數據云 (BigQuery) 和機器學習 (Vertex) 構建知識圖譜。他們確實有一個面向開發人員的知識圖譜搜索 API,用于基本信息檢索 。這些組件的定價通常基于使用情況。

Azure:通過 Cosmos DB 的 Gremlin API(全球分布,基于 RU 定價)提供圖形功能,并將知識圖譜集成到認知解決方案中(例如,AI Search 的知識存儲、Graph RAG 模式)。Azure 的 OpenAI 服務可以與知識圖譜結合,構建高級問答或搜索功能。

IBM:專注于利用知識圖譜 (KG) 構建可信的人工智能和領域解決方案,并結合使用 IBM 和開源工具。他們強調咨詢式的混合方法——例如,展示如何在 IBM 的人工智能平臺 (Watsonx) 中使用開放圖譜數據庫。定價更偏向企業軟件導向或基于服務參與。

所有超大規模企業都認識到知識圖譜是現代人工智能架構的關鍵組成部分。Gartner 的 2024 年技術成熟度曲線顯示,知識圖譜對于增強人工智能戰略的重要性日益提升。它們的產品允許企業利用云規模的基礎設施構建知識圖譜,并將其與人工智能服務集成,實現知識驅動的人工智能。競爭也促使它們不斷改進:AWS 增加了Neptune Serverless等用于自動擴展的功能,谷歌投資AutoML 用于實體提取,微軟創建了從非結構化數據到知識的無縫管道(通過認知搜索和 Power BI 集成),IBM 專注于將知識 + 治理作為人工智能的一部分。用戶現在有很多選擇可以在云端開始使用知識圖譜,而無需從頭開始管理自己的圖形數據庫服務器。

責任編輯:龐桂玉 來源: 數據驅動智能
相關推薦

2025-06-03 06:03:06

2025-06-06 01:00:00

AI人工智能知識圖譜

2025-06-09 03:00:00

人工智能AI知識圖譜

2025-06-09 09:10:26

2025-06-05 09:09:50

2025-06-03 15:00:04

2020-12-18 11:59:21

人工智能知識圖譜

2025-06-03 06:14:37

2018-02-27 08:39:47

圖譜數據存儲

2021-01-19 10:52:15

知識圖譜

2025-04-27 00:10:00

AI人工智能知識圖譜

2017-03-06 16:48:56

知識圖譜構建存儲

2020-12-02 08:14:05

行業規模經驗

2021-01-25 10:36:32

知識圖譜人工智能

2024-10-12 08:03:25

2023-09-08 07:45:32

2024-06-03 07:28:43

2017-10-11 15:00:44

2024-10-08 10:37:12

語言數據自然語言

2017-04-13 11:48:05

NLP知識圖譜
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日批免费看 | 亚洲影音| 亚洲视频在线一区 | 日韩免费福利视频 | 成人在线精品视频 | 91电影| 久久国产精品网站 | 国产精品资源在线观看 | 色视频在线播放 | 99日韩| 在线观看国产精品一区二区 | 91成人午夜性a一级毛片 | 国产精品网址 | 美人の美乳で授乳プレイ | 国产视频精品在线 | 九色网址 | 日韩精品在线观看一区二区 | 成人自拍视频 | 成人久久18免费网站 | 午夜激情影院 | 国产高清一区二区三区 | 啪啪精品 | h视频免费观看 | 91中文视频 | 亚洲成人午夜在线 | 国产在线观看一区 | 久久久www成人免费精品 | 欧美视频二区 | 久久精品无码一区二区三区 | 国产精品福利在线观看 | 嫩草视频在线免费观看 | 岛国毛片在线观看 | 国产小视频自拍 | 一区二区三区四区在线视频 | 欧美日韩一区不卡 | 91久久精品视频 | 天天综合成人网 | 国产a视频 | 视频在线日韩 | 亚洲一区综合 | 97精品超碰一区二区三区 |