Pajek:關係網絡分析和可視化工具

2021-02-20 網際網路大數據處理技術與應用

        近日做社交媒體用戶行為分析,需要展示用戶關係的結果。發現Pajek已經到5.0版了,幾年前版本還很低。於是下載下來用了一下。

        據介紹,Pajek專門用來分析大型網絡,可以支持成百上千個結點的網絡。在Pajek中有兩種類型的網絡,體現了它對不同應用場景的支持。

        一種是1-mode(一模網絡),其中每個頂點都允許與其他頂點連接。另一種是2-mode(二模網絡),主要用於具有從屬關係的網絡,比如人員和部門可以作為網絡的節點,這樣該網絡就有兩種節點。如此,看來,在用戶社交關係分析和可視化中,選擇1-mode就可以。

網絡數據文件

       在我的分析任務中,用戶數據存儲於關係型資料庫,因此可以比較方便生成Pajek所需要的網絡數據文件。格式如下

*Vertices  220(指定節點數)

1 "u1"        (節點描述)

2 "u2"

3 "u3"

...

*Arcs          (有向邊,構造用戶關係的有向圖)

1 2 1          (用戶1指向用戶2,相應的權重為1)

33 3 10

83 1 1

...

        這些數據保存成文本文件,在Pajek中打開。然後直接選擇菜單「Draw」,可以看到所生成的圖,目前該軟體支持kamada-kawaiReingo兩種能量型的布局算法。

       在節點數量很大的情況下,網絡圖就不是太清楚,可以通過局部放大,比如在我的數據中,用戶83的連接關係很多,可以以此為中心放大顯示。

       當然作為一個網絡分析工具,也提供了對最短路徑、關鍵路徑、網絡參數計算等的支持。以下是u1到u10提取出來的最短路徑。

        除了有向圖之外,還支持無向圖,在定義網絡數據文件時稍有區別。如下(注意改為了Edges)

*Vertices  220(指定節點數)

1 "u1"        (節點描述)

2 "u2"

3 "u3"

...

*Edges          (無向圖)

1 2          (用戶1和用戶2之間存在連接)

33 3

83 1

...

         可以進一步做些社區識別( 菜單:Network|partition|communities|Louvain),它使用了Louvain這個社區發現算法,源於文章(Fast unfolding of communities in large networks, 2008)。

從而,將整個關係網絡劃分為若干個連接關係比較強的區域,以下是劃分的結果。相同顏色的節點被劃分為屬於同一個群體。

       除了上述介紹的功能,Pajek還有很多功能,包括網絡的剪枝、各種子網的提取、兩個網絡的運算等等。

       網上可以很方便找到相應的下載網址和參考資料,也可以關注本公眾號,後臺回復pajek,可以獲得下載pajek使用手冊(資料來源於網絡)的網址

作者編著的《網際網路大數據處理技術與應用》專著(清華大學出版社,2017)、同名公眾號,專注於大數據技術的相關科學和工程知識傳播,同時也為讀者提供一些拓展閱讀材料。本書中也談到了大數據可視化,本文也算是對書中這部分的一個拓展和補充。

關注後可閱讀以前推送的原創文章,部分如下。

PageRank算法及其收斂性解釋,從分糖果說起

金融/證券大數據的相關性分析

《網際網路大數據處理技術與應用》的相關教學資源

AlphaGo Zero來了,我們還需要大數據嗎?

點擊閱讀原文連結,查看圖書詳情信息(目錄、引言)。

相關焦點

  • 新年微課:實戰學習網絡輿情可視化工具
    不穩定輿論的發酵擴散,不負責任言語的謾罵與傳播,不僅易引發網絡暴力,更不利於社會和諧和國家穩定。而隨著大數據時代的到來,網絡輿論在數據體量、複雜性和產生速度等方面發生巨大變化。以往的網絡輿情的內容樣本分析已無法準確的描繪熱點事件中網絡輿論的發展之勢了。而可視化工具的出現則很好的彌補了這一缺陷。
  • Python的數據可視化:對比7種工具包
    Python 的scientific stack(一個介紹Python科學計算包的網站)已經完全成熟,並且有各種各樣用例的庫,包括機器學習(連結:machine learning),數據分析(連結:data analysis)。數據可視化是探索數據和清晰的解釋結果很重要的一部分,但是Python在過去卻相對於其他工具比如R落後一點。
  • 乾貨分享:據說這是史上最全的大數據分析工具
    |沙龍精選自大數據人,原文來源於網絡百度ECharts:http://echarts.baidu.com/Cytoscape:http://www.cytoscape.org/圖表秀:http://www.tubiaoxiu.com/數據觀:http://shujuguan.cn/
  • 龍裡公安接處警可視化——110貼心生命線
    通過高科技裝備,在城區110指揮中心可以做到報警定位可視化、巡處警力分布可視化、警情現場可視化和處警過程可視化,從而更好地打擊犯罪。 2015年1月,龍裡縣城內發生了一系列的門面偷盜案件,110指揮中心正是以視頻監控為引導,街面警力同步協調、快速反應的扁平化指揮、點對點調度追蹤,運用犯罪實時控制警務運行模式,最終將犯人抓獲。
  • 大數據2015:Hadoop和大數據-60款頂級大數據開源工具
    Sqoop企業經常需要在關係資料庫與Hadoop之間傳輸數據,而Sqoop就是能完成這項任務的一款工具。它可以將數據導入到Hive或HBase,並從Hadoop導出到關係資料庫管理系統(RDBMS)。支持的作業系統:與作業系統無關。
  • Python數據可視化:2018年電影分析
    法納斯特,Python愛好者,喜歡爬蟲,數據分析以及可視化
  • momo答疑| 社會網絡分析
    作為一種理論方向,社會網絡分析最富有生命力的地方就在於它抓住了社會結構的重要本質—社會單位間關係的模式,並且認真地對實體和關係及其性質進行概念化,形成了許多基本概念。社會網絡分析就是要了解位置的內容、位置間的關係以及形式等。關係,或稱聯繫:是指在網絡分析圖中結點之間的連線結點本身可能是單個的人,但聯繫的種類可以是多樣的,如信息、金錢、商品、服務、影響、感情、尊重、特權等。網絡分析通過聯繫的數量、密度、方向、強度等方面,分析社會網絡的特徵。
  • 【研究方法】國際關係中的網絡分析 | 國政學人 第334期
    【作者】Emilie Hafner-Burton, 加州大學聖地牙哥分校全球政策與戰略學院的教授,主要研究方向為國際法、人權、社會網絡分析、經濟制裁等。Miles Kahler , 華盛頓特區外交關係委員會全球治理高級研究員,美國大學國際服務學院特聘教授,曾任美國加州大學聖地牙哥分校全球政策與戰略學院太平洋國際關係教授、政治學特聘教授。
  • NPDP小知識:創意工具-PESTLE分析
    PESTEL分析模型又稱大環境分析,是分析宏觀環境的有效工具,不僅能夠分析外部環境,而且能夠識別一切對組織有衝擊作用的力量。
  • Excel數據分析工具:直方圖
    Excel數據分析工具中的直方圖模塊,除了可以直接用直方圖對數據做出分析外,還有柏拉圖的內容。柏拉圖在有些地方又稱為帕累託圖(Pareto chart)、排列圖或主次圖,在問題分析和解決過程中經常會被使用, 特別是製造業生產的質量控制。通俗解釋:通過對數據的分類和統計,做出柏拉圖,可以清晰的在圖上表示問題產生的主要原因。
  • V-RAY: 建築可視化 3D 渲染軟體
    V-Ray 是建築可視化行業首屈一指的渲染器100 家頂級建築公司中有 92 家選擇 V-Ray 來表現他們的設計,方案包含世界最高的大廈,可持續的住宅,和智能城市。V-Ray 為建築學而生。擁有全面的工具,設計師可以渲染任何內容 — 從初期體量模型到照片級圖片,動畫和最終成果的 VR。對於任何建築項目,V-Ray 無縫對接各種 3D 建模軟體和設計軟體,包括  3ds Max,Revit,Rhino 和 SketchUp。
  • DNA序列分析:SnapGene 5.2.0
    SnapGene:一款功能強大的DNA序列分析軟體,使用能夠幫用戶分析和修改DNA圖譜並將它們導出到其它格式,支持分析酶切位點、標籤、啟動子、終止子和複製子等質粒原件
  • 陳振明 張敏 | 國內政策工具研究新進展:1998—2016
    通過Ucinet6.0軟體對關鍵詞共詞進行分析, 再通過Netdraw可視化技術, 可以更直觀地了解當前政策工具研究的次領域分布情況:從研究主題來看, 涉及政策執行、政策網絡、政府治理等;從研究方法來看, 多採用的是政策的內容文本分析;從行業領域來看, 當前研究主要集中在財經、環保、教育等領域。這與期刊來源的類別基本吻合。
  • 可視化教程:教你用2016版office軟體做treemap樹狀圖
    愛數據(lovedata.cn)是最大、最專業的大數據在線學習社區,專注大數據、數據分析、數據挖掘、數據應用案例和數據可視化等領域
  • Python數據分析:股票數據分析案例
    步驟:準備數據可視化數據、審查數據處理數據根據ACF、PACF定階擬合ARIMA模型預測準備數據    # 指定股票分析開始日期    start_date = datetime.datetime(2009, 1, 1)    # 指定股票分析截止日期    end_date = datetime.datetime(2019, 4, 1)    # 股票代碼    stock_code = '600519.SS'    # 滬市貴州茅臺
  • 鋒友分享:在iPhone上設置可視化語音信箱
    而什麼是可視化語音信箱呢?我們來具體了解一下。日前,鋒友 Gavin.Ding 為我們解釋了可視化語音信箱的各項功能以及具體的設置方法。目前,使用 iPhone 4s 以上機型的中國移動用戶已經可以體驗到可視化語音信箱,而電信和聯通還沒有提供此項服務。要想解釋什麼是可視化語音信箱,我們需要先說一說語音信箱業務。
  • SWOT分析升級版:SWOT光譜
    編者按:新的一年即將到來,制定各種戰略時除了SWOT分析,還有什麼簡明有效的工具?不妨試試SWOT光譜。