2010-10-05 36 views

回答

0

Java的Lucene框架是一個高性能的文本搜索引擎。日誌文件可以處理這個,但對於傳入的請求可能會更棘手。在流式傳輸時,你需要解析它嗎?

+0

不一定......這將是很好,但不是必需的 – 2010-10-05 20:59:28

0

有很多方法來獲得,分析和解析你說的數據。

很簡單,你可以使用日誌文件中的文本,並將其導入分析SQL數據庫(讓你也看看其他請求等)。

你可以使用一個軟件服務,如谷歌Analytics(分析)。

還是我個人最喜歡的:

SQL INSERT到跟蹤表。這樣做,您可以將字符串解析爲子句 - 非常簡單地通過單詞分隔。缺點是你會錯過關鍵字短語如「紐約」(兩個字)。

該人士暗示的Lucene提供了可能導致你的夢想一個漂亮整潔的分析信息的餅,但還需要大量的工作來獲得完整的解決方案。 Lucene和Solr的整潔之處在於,他們可以使用標準庫標記化關鍵字字符串(在包含CompoundWords或CamelCaseKeywords的地方分成兩到三個單詞子句)。

從實際的做法,我覺得你最好使用一些現成的,如谷歌Analytics(分析)服務。如果你有時間和技能,在數據庫中插入一條記錄會變成非常強大的東西,隨着你添加到記錄中。

+0

有趣的建議......我不能使用谷歌分析,因爲我嘗試做局部分析。 – 2010-10-05 21:00:45

相關問題