我想對具有多種模式(即多種類型的網絡節點)和多路複用關係(即多種類型的網絡邊緣)的網絡數據進行一些分析。對以RDF表示的網絡數據應用圖表分析
分析可能是關於SNA或應用圖論中的任何算法,例如,關係強度,中心性,中介性,節點距離,塊,集羣等。
源數據是非結構化的,因此我應該首先考慮如何表示,存儲和檢索數據。
以下是一些想法。我會很感激任何反饋或進一步的建議。:)
我知道已經有一些很棒的NoSQL數據庫,例如Neo4J,InfoGrid,用於這種類型的應用程序。但出於一些可擴展性原因(例如許可證,網絡標準...),我希望使用RDF來存儲和表示我的數據。使用的工具將是SESAME或JENA。
用RDF表示網絡/圖形數據的想法是微不足道的。 例如:
網絡/圖形數據
*Alice* ----lend 100USD----> *Bob* ----- likes ----> *Skiing*
與RDF
*Alice* --src--> *lend_relation* <---target--- *Bob* ---likes---> *Skiing*
|
has_value
\|/
*100USD*
[Alice src lend_relation]
[Bob target lend_relation]
[lend_relation has_value 100USD]
[Bob likes Skiing]
表示然而,問題是,RDF以及SPARQL圖模型的觀點缺乏。 在RDF查詢之間遍歷節點或查找(最短)距離效率不高。 它必須使用一些額外的分析工具完成,例如JUNG或JGarphT, ,我必須首先通過查詢RDF存儲構建子圖,然後將其轉換爲JUNG或JGraphT使用的數據模型。如果我想要額外的可視化(無論是JUNG還是JGraphT),那麼我必須爲可視化工具包構建另一個數據模型。 我不知道這是一個明確的還是有效的整合。
再次感謝您的任何建議!
「圖模型的觀點」是什麼意思? – 2010-09-03 13:24:27
我的意思是圖遍歷或圖分析。 – elgcom 2010-09-06 10:58:52