2013-02-10 77 views
1

我在試驗/學習彈簧數據neo4j。我有一個非常簡單的應用程序,可以存儲來自twitter的推文。請參閱下面的代碼片段。索引收集彈簧數據neo4j

​​

問題是,什麼是最好的方式來存儲哈希標籤,以便我可以快速得到他們屬於的推文?我能想到的是使用SetIn的@Indexed或實際創建一個單獨的Hashtag NodeEntity,並在它和推文之間建立關係。我找不到任何有關在NodeEntity中對集合建立索引的文檔,因此我不確定索引是在集合對象上創建還是集合中的每個字符串都建立索引。任何建議都會很好。謝謝。

+0

另請參見示例https://github.com/jexp/sdn-twitter-graph – 2013-02-20 08:11:43

回答

5

當你做一個@Indexed它被放入Neo4j的索引系統,這是Lucene。 Lucene實際上並不索引集合,而是集合的字符串表示。

至於你的數據模型,我會去創建一個HashTag節點,每個Tweet將連接到。您最終會遇到密集型節點問題以尋找更常見的哈希標記,但總而言之,您可以執行更多分析,例如使用相同的哈希標記獲取所有推文。

+0

HashTag將是您引用的'@ NodeEntity'。設置標籤;然後,SDN會相應地創建關係。 – 2013-02-20 08:11:18