成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Facebook開源了超大規模圖嵌入算法,上億個節點也能快速完成

新聞 開源 算法
Facebook開源了叫做PyTorch-BigGraph (簡稱PBG) 的新工具。有了它,再大的圖 都能快速生成圖嵌入。而且,完全不需要GPU。

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

,是很有用的數據結構,用節點 (Node) 和 (Edge) 織成一張網。比如,知識圖譜就是這樣的網。

Facebook開源了超大規模圖嵌入算法,上億個節點也能快速完成

處理這樣的數據,要用到圖嵌入 (Graph Embedding) :把高維的網絡,轉換成低維的向量。處理之后,機器學習模型才能輕易食用。

如果像上圖這樣,只有幾個節點,十幾條邊,圖嵌入沒什么難度。

如果有幾十億個節點,幾萬億條邊呢?傳統的圖嵌入方法就捉急了。

但現在,Facebook開源了叫做PyTorch-BigGraph (簡稱PBG) 的新工具。

Facebook開源了超大規模圖嵌入算法,上億個節點也能快速完成

有了它,再大的圖 (原文是arbitrarily large,任意大) 都能快速生成圖嵌入。而且,完全不需要GPU

開源模型除了可以自己訓練之外,還有拿7,800萬節點的Wikidata數據預訓練過的模型,可以直接下載來用。

PBG發表之后,小伙伴們紛紛奔走相告:

Facebook開源了超大規模圖嵌入算法,上億個節點也能快速完成

LeCun老師還親自轉發了兩次。

如何養成

PBG是一個分布式系統,用1.2億個節點的完整FreeBase知識圖譜來訓練的。

Facebook開源了超大規模圖嵌入算法,上億個節點也能快速完成

訓練過程中,PBG會吃進圖上所有 (Edge) 的大列表,每條邊都是用它兩端的節點來定義,一個是源 (Source) ,一個是目標 (Target) 。定義中也有兩點之間的關系 (Relation Type) 。

然后,PBG給每一個節點,輸出一個特征向量 (就是嵌入) ,讓兩個相鄰的節點在向量空間中離得近一些,讓不相鄰節點的離遠一些。

這樣一來,那些周圍環境分布相近的節點,在向量空間里的位置也會彼此靠近,圖原本要表達的意思就保留下來了。

另外,針對每種不同的關系,“近似度得分 (Proximity Score) ”都可以定制不同的計算方法。這樣,一個節點的嵌入,就可以在不同種類的關系里共享了。

快一點,再快一點

要快速處理大規模的圖數據,PBG用了這幾個法術:

一是圖分區 (Graph Partitioning) ,這樣就不需要把整個模型加載到內存里了。在圖嵌入質量不損失的情況下,比不分區時節省了88%的內存占用。二是一臺機器進行多線程計算。三是在多臺機器上同時跑,在圖上各自跑一個不相鄰的區域。四是批次負采樣(Batched Negative Sampling) ,能讓一臺CPU每秒處理100萬條邊,每條邊100次負采樣。

訓練完成之后,在FB15k、Youtube、LiveJournal等等圖譜上,都測試過。

團隊說,PBG和大前輩們的圖嵌入質量相當,但需要的時間明顯縮短了。

你也試一試吧

你也去訓練一個PBG吧。

反正,也不用GPU。

不想訓練的話,還有用完整WikiData預訓練的模型。

你需要的傳送門,都在這里了。

代碼傳送門:

https://github.com/facebookresearch/PyTorch-BigGraph

食用索引:

https://torchbiggraph.readthedocs.io/en/latest/

論文傳送門:

https://arxiv.org/abs/1903.12287

博客傳送門:

https://ai.facebook.com/blog/open-sourcing-pytorch-biggraph-for-faster-embeddings-of-extremely-large-graphs/

 

責任編輯:張燕妮 來源: 量子位
相關推薦

2020-09-25 09:52:48

機器學習人工智能計算機

2016-12-14 11:44:25

阿里Docker大數據

2015-11-20 17:28:57

Ceph開源存儲大規模存儲

2020-07-23 14:03:09

數據中心數據網絡

2025-06-16 02:11:00

2021-09-23 10:20:16

算法模型技術

2011-12-16 09:54:17

網絡架構網絡架構系統架構系統

2020-12-11 19:52:06

數據中心超大規模數據中心

2023-02-14 11:24:36

2025-02-26 08:30:00

2022-12-30 14:14:51

數據中心服務器

2024-01-23 15:11:55

云計算云市場混合云

2022-04-22 10:58:25

系統緩存數據庫

2020-02-10 08:00:38

AI 數據人工智能

2021-03-16 10:28:41

數據中心IT云計算

2020-10-30 11:09:30

Pandas數據代碼

2024-04-30 07:00:00

公共云云策略云計算

2023-01-11 21:11:37

RabbitMQRocketMQ消息中間件

2015-10-27 11:32:41

數據中心超大規模數據中心

2024-10-21 17:40:22

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 免费黄色av网站 | 狠狠干2020 | 久草热线 | 久久久久国 | 亚洲精品欧洲 | 中文字幕视频在线 | 99在线资源| 亚洲成人久久久 | 一区二区在线不卡 | 成人在线观看免费视频 | 午夜影院在线观看免费 | 日本成人福利 | 理论片午午伦夜理片影院 | 免费黄篇| 91九色视频 | 国产精品久久久久久久久 | 欧美日韩在线综合 | 欧美久久久久久久 | 国产aa | 国产精品99久久久久久宅男 | 免费成人高清在线视频 | 婷婷福利视频导航 | 欧美色成人 | 国产欧美精品一区二区色综合 | 精品久久香蕉国产线看观看亚洲 | 福利网址| 日本一区二区三区四区 | 波多野结衣中文字幕一区二区三区 | 日韩免费 | 亚洲国产福利视频 | 日本在线一区二区三区 | 九九热这里只有精品6 | 亚洲a视频| 欧美成人一区二免费视频软件 | 久久精品色欧美aⅴ一区二区 | 国产偷录叫床高潮录音 | 久久一区二| 成人免费视频网站在线看 | 欧美久久国产精品 | 夜夜草| 91精品久久久久久久久久 |