成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

社區發現技術淺析

網絡
社區發現算法能夠用于在復雜網絡中揭示社區結構,是一種能夠在微觀視角對網絡進行分析的新穎工具。我們日常生活中能夠接觸到的抖音用戶風控、QQ/微博的好友推薦,以及基于真實世界數據的城市交通流量預測、電網負荷分析,這些應用的背后都離不開社區發現算法的驅動。

Part 01、社區發現簡介 

復雜網絡是由大量的網絡節點以及節點之間錯綜復雜的鏈接關系所形成的一種網絡結構。生活中所接觸到的許多自然、科學、社會關系和基礎設施系統可以用復雜網絡建模表示,如電力系統、社交網絡、通信網絡、交通網絡等。用數學的語言來表述,復雜網絡就是一個有著足夠復雜的拓撲結構特征的圖。

圖片

圖1 各類復雜網絡將現代社會中的人與人、人與物相聯結

復雜網絡中總是能夠被進一步劃分為各種各樣的社區。所謂社區,就是一種網絡中特殊的子圖結構,在拓撲結構上表現為:社區成員內部緊密連接,但與網絡其余部分的連接較為稀疏。社區發現算法能夠用于在復雜網絡中揭示社區結構,是一種能夠在微觀視角對網絡進行分析的新穎工具。因此,目前各種互聯網企業中都廣泛使用社區發現算法輔助研究人員理解復雜網絡中的信息,在社交網絡分析、推薦系統、風控等領域都能夠見到它的身影。無論是基于社交網絡數據的抖音用戶風控、QQ/微博的好友推薦,還是基于真實世界數據的城市交通流量預測、電網負荷分析,這些應用的背后都離不開社區發現算法的驅動。

Part 02、常用社區發現技術

社區檢測是一個豐富且極具挑戰性的問題,部分原因是社區的定義仍然沒有明確的描述。在圖論中,社區被定義為不重疊的節點組,且組內的邊連接遠多于組間的邊。但是這個定義仍然留下了許多可能性,相應地也有許多基于不同領域學說的計算方法被提出。

- 基于優化的方法

最常見的是基于優化的方法,貪婪算法、模擬退火算法、Louvain算法、PSO算法、進化多目標優化算法等均屬于此類。一種典型的優化方法首先需要建立一種社區質量評分標準,能夠通過判斷子圖結構和社區定義的接近程度來分配對應的分數;再利用貪婪/分布迭代等算法搜索網絡中每個可能的社區劃分,記錄并輸出得分最高的劃分結果。目前有眾多的社區質量函數被提出,其中應用最為廣泛的是模塊度(Modularity)質量函數,模塊度將社區評分定義為組內邊的連接數量與隨機網絡中期望數量的差值。

- 基于統計推斷的方法

另一種在近年來引起了廣泛關注的方法是基于統計推斷的社區發現方法。這類方法將社區視為網絡結構的主要驅動因素,而非一種孤立的特征,認為節點之間的連接概率與它們所屬的社團是否相關有著密切聯系,類似于社交網絡中有相似興趣的人之間更容易產生鏈接。

通過利用隨機塊模型(SBM)等概率模型,基于統計推斷的方法能夠利用現有的社區劃分計算各節點間邊分布的概率,進而重新生成圖的鏈接結構。該方法認為,若由這種方式重新生成的圖結構和原始圖結構的相似程度越高,則社區劃分的質量越高。

- 基于隨機游走的方法

隨機游走可以通過在節點之間隨機跳轉,獲得圖中節點與節點之間的共現關系,以檢測圖中的社區結構。由于網絡社區之間通常只有稀疏的連接,跳轉到的節點往往處于同一社區的內部,因此可以利用該方法自底向上地合并不同的節點組以生成社區。游走的關鍵在于下一跳節點的選擇,根據所應用的場景和數據特征的不同,需要不同的策略進行處理,常見的游走策略包括uniform、frequency、markov等。

這種方法的一個很好的特性是,我們不需要實際執行任何隨機游走來計算信息:無限長的隨機游走會收斂到一個固定的概率值的熵的封閉表達式,我們可以直接使用它作為社區檢測的質量函數。

上述方法所涉及的學科、領域各不相同。由于篇幅原因,這里節選出Louvain算法—— 一種基于優化的社區發現方法來進行相對詳細的學習。

Part 03、Louvain——基于模塊度最優化的方法 

上一節中提到,基于優化的方法需要通過社區質量函數來評估子圖結構和社區定義的接近程度,而目前應用最為廣泛的質量函數是模塊度(Modularity),Louvain算法正是基于模塊度來進行社區發現的。因此我們先對模塊度的定義進行簡要介紹。

Newman等人提出了模塊度(modularity)的概念,用來衡量社區劃分的好壞,公式如下:

圖片


其中圖片表示圖節點圖片和節點圖片之間邊的數目,圖片表示圖中邊的個數,圖片表示節點圖片的度,圖片表示邊隨機放置的情況下,節點圖片圖片之間邊數量的期望值。

因此可以將模塊度簡單理解為:在社區內部的邊的比例,減去邊隨機放置時社區內部期望邊數的比例,除以某個常數后所得到的值。如果一個社區劃分算法能夠盡可能多的將連接比較稠密的點劃分在相同社區中,而盡量減少社區之間的連接,這樣就能得到較高的模塊度評分。

可以通過下面的Python Demo簡單的計算網絡劃分的模塊度:


    import networkx as nx
    # G1為原始圖,G2為劃分后的圖,均用networkx.graph來表示
    def Modularity(G1,G2):
    m=len(G1.edges())
    Aab=0
    Q=0.0
    for a in G1.nodes():
    for b in G1.nodes():
    if nx.has_path(G2,a,b):
    Aab=0
    if b in G1.neighbors(a):
    Aab=1
    Q=Q+(Aab*m*2-nx.degree(G1,a)*nx.degree(G1,b))/(4*m*m)
    return Q

    Louvain算法則是由Blondel等人提出的基于模塊度的社區發現算法。可以將整個算法分為兩個階段:

    ? 模塊度優化階段——每個節點自身作為自己的社區標簽,此時網絡中的社區數和結點數一致。計算此時圖劃分的模塊度作為基準,然后逐個嘗試改變圖中某一個節點的社區標簽,將其更新成鄰居節點的社區標簽,計算此時的模塊度與基準值的差距,記為當前劃分下的模塊度增量。選出能夠使得模塊度增量最大的網絡劃分。

    ? 網絡凝聚階段——將上個階段劃分出來的每個社區合并為一個新的超級節點,節點的邊權重為原始社區中所有節點的邊權重之和,構建一個新的網絡。

    Louvain算法不斷在1,2兩個階段之間迭代,直到模塊度增量為負時停止;此時的社區劃分即為算法的輸出。


    Part 04、展望 

    總的來說,CAT作為綜合性的平臺,提供的監控功能較為全面;Zipkin是由Twitter開源的調用鏈分析工具,非常輕量,使用部署簡單;Pinpoint和SkyWalking都專注于鏈路和性能監控,追蹤數據粒度較細、用戶界面功能強大。隨著信息技術的發展和工業互聯網的廣泛應用,生活中能夠接觸到的復雜網絡結構越來越多,比如交通網絡、金融網絡、通信網絡、輸電網絡等等。通過在后端對這些網絡中蘊含的信息進行分析預處理,為用戶提供更貼心、智能的服務成為了信息時代的新興增長點。作為國內領先的電信運營商,中國移動必將能夠依靠廣泛且先進的網絡基礎設施,為城市服務數字化和智能化貢獻力量。

    ??參考文獻

    [1] Fortunato S, Newman M E J. 20 years of network community detection[J]. Nature Physics, 2022: 1-3.

    [2] Newman M E J, Girvan M. Finding and evaluating community structure in networks[J]. Physical review E, 2004, 69(2): 026113.

    [3] Blondel V D, Guillaume J L, Lambiotte R, et al. Fast unfolding of communities in large networks[J]. Journal of statistical mechanics: theory and experiment, 2008, 2008(10): P10008.

    責任編輯:龐桂玉 來源: 移動Labs
    相關推薦

    2013-10-29 13:25:03

    開源社區

    2010-09-17 14:16:21

    2011-09-30 10:34:03

    無線

    2017-03-06 14:44:49

    Androidhook技術

    2009-02-23 14:44:10

    Java游戲Java開發現狀

    2011-04-13 15:01:39

    2011-07-28 12:36:43

    2024-11-04 09:04:20

    2023-03-12 15:25:37

    2012-08-29 16:24:15

    2021-01-08 14:55:03

    RDWARoCE數據

    2013-08-01 11:31:50

    存儲虛擬化虛擬化

    2023-06-18 19:21:04

    技術架構服務網格

    2011-03-09 10:30:55

    2011-04-13 14:53:32

    2011-07-28 13:08:51

    2018-11-13 09:49:11

    存儲云存儲云備份

    2009-07-14 14:00:47

    iData技術

    2011-04-13 15:03:25

    NATlP

    2011-05-23 13:23:53

    點贊
    收藏

    51CTO技術棧公眾號

    主站蜘蛛池模板: 国产伦精品一区二区三区视频金莲 | 欧美激情国产日韩精品一区18 | 成人在线免费 | 婷婷五月色综合香五月 | 三a毛片| 亚洲精品成人 | 国产成人网 | 国产精品日韩在线观看 | 黄视频网站免费观看 | 国产真实乱全部视频 | 亚洲免费人成在线视频观看 | 91高清在线观看 | 91在线观看 | 亚洲日本欧美日韩高观看 | 蜜月aⅴ免费一区二区三区 99re在线视频 | 欧美日韩一卡二卡 | 国产精品欧美一区二区三区不卡 | 日韩三级在线 | 日韩欧美在线视频一区 | 中文在线a在线 | 国产精品3区| 四虎永久免费影院 | 日韩国产中文字幕 | 亚洲小视频在线观看 | 毛片一区二区三区 | 久久一区二区三区电影 | 亚洲协和影视 | 日韩av手机在线观看 | 一区二区三区在线观看视频 | 国产精品欧美一区二区三区 | 欧美中文字幕一区二区三区亚洲 | 欧美日韩亚洲国产 | 精品粉嫩aⅴ一区二区三区四区 | 日韩欧美在线观看 | 午夜精品一区二区三区在线视频 | 一区二区三区不卡视频 | 欧美精品一区二区三区在线播放 | 成人国产午夜在线观看 | 五月婷婷在线视频 | 精品久 | 一级大片网站 |