2011-07-07 16 views
2

我只是用C++編寫一個程序,它計算格式的無向圖的聚類係數[CC](本地和全局)。我的問題是我的程序的結果不輸出從[R(與的igraph庫)匹配:爲什麼聚類係數與我的程序和igraph R的庫不同?

我的程序:

The cluster coefficient of "0" is: 0.257 (88/342) 
The cluster coefficient of "1" is: 0.444 (40/90) 
The cluster coefficient of "10" is: 1.000 (2/2) 
The cluster coefficient of "2" is: 0.418 (46/110) 
The cluster coefficient of "11" is: 1.000 (2/2) 
The cluster coefficient of "12" is: 0.667 (8/12) 
The cluster coefficient of "3" is: 0.346 (54/156) 
The cluster coefficient of "5" is: 0.571 (24/42) 
The cluster coefficient of "13" is: 1.000 (12/12) 
The cluster coefficient of "4" is: 0.607 (34/56) 
The cluster coefficient of "7" is: 0.679 (38/56) 
The cluster coefficient of "14" is: 1.000 (6/6) 
The cluster coefficient of "15" is: 0.833 (10/12) 
The cluster coefficient of "16" is: 1.000 (6/6) 
The cluster coefficient of "17" is: 0.733 (22/30) 
The cluster coefficient of "9" is: 0.833 (10/12) 
The cluster coefficient of "18" is: 0.714 (30/42) 
The cluster coefficient of "19" is: 1.000 (6/6) 
The cluster coefficient of "6" is: 1.000 (2/2) 
The cluster coefficient of "8" is: 0.733 (22/30) 

凡「」的是圖(n/m)的節點是「其鄰域內的頂點之間的」鏈接「和」它們之間可能存在的鏈接的數量「(m)(description from Wikipedia) 並從R輸出:

0 0.2631579  x (+2 links) 
1 0.4666667  x (+2 links) 
2 0.4181818 
3 0.3461538 
4 0.6071429 
5 0.6190476  x (+2 links) 
6 1.0000000 
7 0.6785714 
8 0.6666667  x (-2 links) 
9 0.8000000 
10 1.0000000 
11 1.0000000 
12 0.6666667 
13 1.0000000 
14 1.0000000 
15 0.8333333 
16 1.0000000 
17 0.7333333 
18 0.7142857 
19 1.0000000 

,每一行的第一個數字是節點,第二是它的本地CC,第三個是我的註釋,當它不符合我的輸出(指定的鏈接數( n)我需要添加/刪除以匹配R的輸出)。

第二個問題我已經是全球CC[R不符合我的定義或維基百科的(除非我誤解公式)。從[R輸出對於此圖是0.458891和我是0.742


所以我手動做到了:我計算出的8的CC和我的程序的輸出相匹配。所以我的問題是,「igraph庫甚至有可能存在bug?」如果答案是「否」:「我錯過了什麼?」

的圖形文件是這一個:

graph { 
    1 -- 0; 
    10 -- 0; 
    10 -- 2; 
    11 -- 0; 
    11 -- 2; 
    12 -- 0; 
    12 -- 1; 
    12 -- 3; 
    12 -- 5; 
    13 -- 0; 
    13 -- 3; 
    13 -- 4; 
    13 -- 7; 
    14 -- 0; 
    14 -- 1; 
    14 -- 4; 
    15 -- 0; 
    15 -- 2; 
    15 -- 3; 
    16 -- 0; 
    16 -- 15; 
    16 -- 3; 
    17 -- 0; 
    17 -- 1; 
    17 -- 2; 
    17 -- 5; 
    17 -- 7; 
    17 -- 9; 
    18 -- 0; 
    18 -- 1; 
    18 -- 2; 
    18 -- 3; 
    18 -- 4; 
    18 -- 7; 
    19 -- 0; 
    19 -- 18; 
    19 -- 3; 
    2 -- 0; 
    2 -- 1; 
    3 -- 0; 
    3 -- 2; 
    4 -- 0; 
    4 -- 1; 
    4 -- 3; 
    5 -- 0; 
    5 -- 2; 
    5 -- 3; 
    6 -- 0; 
    6 -- 3; 
    7 -- 0; 
    7 -- 1; 
    7 -- 2; 
    7 -- 3; 
    7 -- 4; 
    8 -- 0; 
    8 -- 1; 
    8 -- 2; 
    8 -- 3; 
    8 -- 4; 
    8 -- 5; 
    9 -- 0; 
    9 -- 1; 
    9 -- 5; 
} 

予算出的CCř加載曲線圖中的方式(或生成一個新的,因爲它不能讀取的點的文件)轉換爲變量「f」,並且對於全局執行傳遞性(f),對於本地一個傳遞性(f,「本地」),對於全局CC

非常感謝您的閱讀和抱歉,因爲我的英語不好。

回答

6

這裏是igraph的作者之一。

我剛剛把你的圖加載到了igraph(Python接口)中,並且它的結果與你的最後一位數字相匹配。你正在使用哪個版本的igraph?

至於「全球性」的聚類係數,注意,至少有兩個相互矛盾的定義:

  1. 計算三角形的數量在整個網絡中,並通過可能的三角形的數量除以。這是「真正的」全局聚類係數,igraph默認計算這個係數。

  2. 計算每個節點的局部聚類係數並取平均值。這是「平均局部」聚類係數,並且您正在計算這一點。

+0

非常感謝答案(和速度)。如果你獲得了相同的結果,也許我使用的是舊版本,所以我會盡快檢查它。對於全球CC我誤解了這兩種類型,所以謝謝澄清:) – Aballano

相關問題