2012-05-29 37 views
0

我剛剛開始熟悉複雜網絡和社交網絡分析背後的想法和技術。我似乎總是絆倒在數據準備階段。我經常在Google Refine中有一個數據集,它基本上是一些相關的行。比如目前我對他們所參加的組織和活動的名單(有一些重複作爲一個組織可能已經派出超過一位代表一個事件)從複雜網絡/ SNA開始。將數據集轉換爲預期格式

My Google Refine Data

所以我可以看到,組織會在我的圖上是節點,如果它們都出現在同一個事件中,它們之間的關係就存在,但是我不知道如何將這個數據集轉換成NWB,Gephi,R或Tulip等工具可以理解的格式。

我經常發現自己處於一種數據集狀態,我可以看到列之間的關係,但我不知道下一步應該採取哪些準備工作以準備好通過這些工具導入數據以探索關係。我爲支持的文件類型探討了文檔,我的猜測是在Refine中使用RDF骨架工具並採用鏈接數據樣式方法可能是一種可行的解決方案,但我沒有運氣。

數據準備的任何提示將不勝感激。

回答

0

只是在任何人在未來絆倒這一點..我通過創建在R中導入我的CSV並創建一個模式矩陣,然後創建一個基於此的圖形。

organisations_events<-read.csv("/Users/David/Desktop/PhD/R_github/ROI/data/Ins_Event.csv" , header=T, sep=",") 

df<-read.csv("/Users/David/Desktop/PhD/R_github/ROI/data/Ins_Event.csv" , header=T,  sep=",") 

M = as.matrix(table(df)) 

Mrow = M %*% t(M) 

#Mcol = t(M) %*% M 

write.csv(Mrow, "test.csv") 

的志作者這裏的答案是否有幫助.. http://www.davidsherlock.info/network-analysis

相關問題