2013-01-08 34 views
0

如果我們做文檔的信息可視化,跨多個文檔的圖生成通常形成一個網格。現在爲了獲得清晰的圖像,很容易用最小的數據負載形成它們,因此總結是一件好事。但是,如果文檔加載成爲 萬,那麼總結也會形成一個大網格。 我有點困惑如何清除網格。由於數據量巨大,閱讀和工作回合http://www.jerrytalton.net/research/Talton04SSMSA.report/Talton04SSMSA.pdf沒有太多幫助。清除圖的網格

如果有學員可以幫助我。

問候, SK

回答

0

你談論的是創建的文檔的圖或網絡?例如,您可以通過引用鏈接鏈接文檔的網絡,通過共享作者,出現相同的術語等等。這通常不稱爲網格問題,而是一種自動圖形佈局問題。

您需要better layout algorithms或做某種聚類和減少。還有您可以使用許多聚類算法,例如脅田&鶴見的:

  • 肯脅田和敏之鶴見。 2007.在大型社交網絡中查找社區結構:[擴展摘要]。 PROC。第16屆萬維網國際會議(WWW'07)。 1275年至1276年。 DOI = 10.1145/1242572.1242805

特別針對通過「圖表彙總」降低複雜性的一個是Navlakha et al。 2008:

  • Saket Navlakha,Rajeev Rastogi和Nisheeth Shrivastava。 2008有界誤差的圖表彙總。 PROC。 2008年ACM SIGMOD數據管理國際會議(SIGMOD '08)。 419-432。 DOI = 10.1145/1376616.1376661

您還可以看看我的最新論文,它取代了網絡代表字形在共同的重複模式:

  • 鄧恩,C. &施奈德曼,2013年B.簡化母題:改善網絡可視化風扇,連接器和派系符號的可讀性。 PROC。 2013 SIGCHI計算機系統人類因素會議(CHI'13)。 PDF

下面是減少的可能的示例圖片:

Dunne & Shneiderman's motif simplification