我有一個獅身人面像搜索索引,並希望找到我的索引中最常見的單詞。 理想情況下,有按頻率排序的單詞列表。獅身人面像搜索/ MySQL找到最常用的單詞
如果使用Sphinx無法做到這一點,有沒有辦法查詢MySQL表的文本字段以獲得相同的統計數據?
我有一個獅身人面像搜索索引,並希望找到我的索引中最常見的單詞。 理想情況下,有按頻率排序的單詞列表。獅身人面像搜索/ MySQL找到最常用的單詞
如果使用Sphinx無法做到這一點,有沒有辦法查詢MySQL表的文本字段以獲得相同的統計數據?
是的。這很簡單。用索引器使用--buildstops和--buildfreqs 標誌構建它們。
indexer --config /path/to/sphinx.conf indexName --buildfreqs --buildstops freq_wordlist.txt 100000
這個例子讓你在你的獅身人面像索引中的第100000字由它的頻率排序
與使用--buildstops和--buildfreqs標誌索引建立他們。
請注意,這不是從現有索引構建,而是像索引一樣針對數據源運行,並建立詞頻。它不會影響索引本身。
如果您使用增量索引保存上次索引文檔的ID,則會讀取上次保存的ID並從此處開始工作。
看起來很簡單。謝謝。 – applechief 2012-02-12 14:29:44