2011-04-19 104 views
0

我的問題與Extract specific words from text field in mysql有點類似,但現在一樣。mysql - 使用全文搜索從文本字段中提取特定單詞

我有一個文字字段裏面有文字。用我的語言可以有很多不同的結局。我需要找到這個結局。

我使用mysql的全文搜索,但我需要有權訪問索引數據庫,其中所有字段都被「剪切」爲單詞和單詞計數。然後,我可以搜索「測試*」,我可以快速找到「測試」,「測試」,「測試」。我需要數據庫中存在的所有端點符號列表,這是我的主要目標。

因爲它是我可以得到與特定的「測試*」單詞的記錄,但我不僅需要找到字段中的發生,但以某種方式組,因此我得到的所有單詞列表示例從「測試」開始。我不需要在哪個位置記錄它們,只是一個列表,分組以便「測試」不會被寫入10次,而只會被寫入一次(也許是找到了多少次但不是必需的計數器)。

有沒有辦法從全文搜索字段中提取此信息,還是應該將所有這些字段分解爲單詞,並使索引表充滿單詞,並只做一個「like」單詞%「並按不同的結果分組?我不知道如何做到這一點,無論是在實踐中,但只是爲了指向我正確的方向,請

所以總結:我有一個文本結果,我需要找出哪些單詞是在裏面,「測試「,比如」測試「,」測試「,」測試「等等......這在英語中是沒有意義的,但用我的語言來說,它確實如此,因爲我們在不同的端點上有同樣的詞,並且有很多, ,我需要找出哪些在那裏,所以我可以做一個synonims表;-)

更新:

數據庫具有列ID(int),成分(文本)和配方(文本)。

數據中的成分與烹調不同的結局等成分:

1蛋 2雞蛋

+0

可以提供某種細節至少應數據庫結構或查詢中使用? – Harish 2011-04-19 07:12:47

回答

1

可以轉儲存在於索引的所有單詞。這也會顯示每個單詞的頻率。例如。測試使用200次,測試使用300次。

手冊爲:http://dev.mysql.com/doc/refman/5.0/en/myisam-ftdump.html

+0

這似乎是一個好主意,但是你可以將這個索引錶轉換爲除文本文件以外的東西,我需要將它作爲數據庫表,以便我可以在其上搜索單詞,並閱讀文檔,我只能找到轉儲text :-( – Jerry2 2011-04-19 10:29:20

+0

您必須將其轉儲爲文本,然後通過「LOAD DATA INFILE」導入該文本文件:http://dev.mysql.com/doc/refman/5.1/en/load-data.html – 2011-04-19 17:06:35

+0

所以沒有使用「命令行」沒有直接的mysql方式我猜... Thanx ...我看到一些問題,因爲我有我們的特殊字符的UTF8,並在導出的文本中,我得到了兩個字節的字符而不是č或š – Jerry2 2011-04-19 17:12:50

相關問題