2011-02-07 76 views
1

我必須從網頁和鏈接的其他頁面獲取所有單詞及其頻率。我必須使用任何網絡爬蟲嗎?任何簡單的開源解決方案?如何從網頁獲取所有單詞及其頻率?

+0

的[SEO分析](http://www.seoworkers.com/tools/analyzer.html)可以是對你有一些幫助。 – 2011-02-07 16:05:21

+1

解析網頁並從中收集單詞以限制爲單個答案的方式太多了。 – 2011-02-07 16:06:01

回答

1

httrack%I(創建搜索索引)選項正是這麼做的。

documentation page解釋了這個關於中途下降,對不起,沒有deeplink可用。跳轉到句子片段

仍然在測試中,該選項要求發動機

相關問題