文本分析之制作網絡關系圖——Python
今天給大家帶來我一個腳本,用來分析社會網絡關系。
這個圖我沒有用到gephi或者其他的工具,是我用python純腳本運行出來的。簡單的實現了封裝,大家有興趣可以下載下腳本,運行下。
原理知識
我就簡單說下原理吧,先刻畫一個簡單的圖A
- import networkx as nx
- import matplotlib.pyplot as plt
- #有向圖
- DG = nx.DiGraph()
- #添加一個節點
- DG.add_node('A')
- #作圖,設置節點名顯示,節點大小,節點顏色
- nx.draw(DG,with_labels=True,node_size=900,node_color = 'green')
- plt.show()
雙節點,有方向A–>B
- #有向圖
- DG = nx.DiGraph()
- #添加一個節點
- DG.add_node('A')
- DG.add_node('B')
- #添加邊,有方向,A-->B
- DG.add_edge('A','B')
- #作圖,設置節點名顯示,節點大小,節點顏色
- nx.draw(DG,with_labels=True,node_size=900,node_color = 'green')
- plt.show()
添加更多節點
- import networkx as nx
- import matplotlib.pyplot as plt
- colors = ['red', 'green', 'blue', 'yellow']
- #有向圖
- DG = nx.DiGraph()
- #一次性添加多節點,輸入的格式為列表
- DG.add_nodes_from(['A', 'B', 'C', 'D'])
- #添加邊,數據格式為列表
- DG.add_edges_from([('A', 'B'), ('A', 'C'), ('A', 'D'), ('D','A')])
- #作圖,設置節點名顯示,節點大小,節點顏色
- nx.draw(DG,with_labels=True, node_size=900, node_color = colors)
- plt.show()
好了,同樣的道理,咱們建立角色詞典,插入節點列表,然后遍歷插入有向邊關系,就能做出這圖:
《Python基于共現提取《釜山行》人物關系》
這篇文章寫的很好(希望不要黑我,我也是覺得真心好)。我基本上借鑒了這篇文章思路寫今天這個腳本,實現了自動生成關系網絡圖。
準備工作
- 一、安裝matplotlib、networkx
- 二、解決matplotlib無法寫中文問題
- 1、找到pythonX\lib\site-packages\matplotlib\mpl-data\fonts\ttf文件夾
- 2、matplotlib默認調用的為DejaVuSans.ttf字體文件,網上下載個
- 微軟雅黑.ttf
- 3、將微軟雅黑文件名改為DejaVuSans.ttf粘貼到ttf文件夾下即可。
腳本文件簡介
你下載后腳本文件夾名為:人民的名義
其中的relationship.py就是大鄧寫的庫(直接能調用的哦)
實現功能:
1、讀入小數數據和角色詞典后,對數據分詞后生成角色關系數據(有向關系數據)
2、無需gephi繪圖即可制作絢麗角色關系網絡圖。
注意:
1、運行腳本前,文件夾中只保留角色名單.txt 人民的名義.txt 和 relationship.py
2、要想圖片好看點,一定要聯網啊。里面我寫了個爬蟲,爬取一個配色網站的配色值。
如果你們想單機也可以畫出好看的圖,可以修改下代碼,將代碼爬蟲部分改成讀取本地顏色數據
使用示例
1、建好小說數據中的角色字典,格式如下
2、在文件夾中放入小說txt文件(人民的名義.txt)
3、在腳本文件夾中新建一個test.py文件
- #導入relationship庫中的Relationship類
- from relationship import Relationship
- #自定義節點詞典(小說中人物角色)
- dictpath = r'/Users/suosuo/Desktop/人民的名義/角色名單.txt'
- #小說路徑,只能是編碼方式為utf-8的txt文件
- datapath = r'/Users/suosuo/Desktop/人民的名義/人民的名義.txt'
- #程序運行生成的角色關系圖保存地址
- pic = r'/Users/suosuo/Desktop/人民的名義/人物關系圖.png'
- Re = Relationship(dictpath, datapath)
- relation = Re.relationship()
- graph = Re.network_digraph(relation, pic)
4、運行
文件夾中生成了 人物關系圖.png、node_edge.txt和node_freq.txt文件。
node_edge.txt 有向圖關系數據,可以后續導入gephi軟件自定義制圖
node_freq.txt 節點出現頻率
注意:每次運行前請把人物關系圖.png、node_edge.txt和node_freq.txt文件刪除掉,再運行。