2011-11-14 66 views
0

我有一個任務,我需要在mysql數據庫中上傳大約50個msword文檔,這不是問題。但在「管理員」中,我如何開發一個腳本,在腳本中可以找到數據庫中的字符串,並且還可以像msword那樣在文件中找到字符串?閱讀mysql和msword(搜索表單)文件中的字符串

例如,我在搜索框中找到單詞「編程」,而單詞只在文件「msword」中!

所以主要的問題是如何開發可以讀取mysql中的數據和像msword這樣的文件的搜索腳本?

我目前使用「wordpress」和「聯繫表單7」來開發上傳表單。

有人可以給我一些建議。

+0

您正在將.doc/.docx文件存儲在數據庫的BLOB字段中嗎?您將無法**以全文或標準「like」%...%''搜索的形式在這些記錄中查找單詞。 .doc文件是複合OLE文檔,.docx是一個zip文件 - 就MySQL而言,它們本質上是二進制垃圾。 –

回答

0

您不僅應該將Word文件保存爲二進制文件(不能通過MySQL搜索),還應該將Word文件中的文本解壓縮並保存爲數據庫中的TEXT文件。然後,您可以使用通配符進行搜索(即'WHERE text LIKE "%searchterm%"')並查找文件中的單詞。

但請注意,隨着文件越來越大,這將變得非常緩慢!

+0

你有任何腳本來提取Word文件中的文本並將其保存爲數據庫中的文本? – ruslyrossi

+0

確定..現在我找到了解決方案,只需安裝谷歌自定義搜索,當你想要找到字符串在pdf或word文件中使用谷歌自定義搜索..超級工作像魅力.. :) – ruslyrossi

+1

當然,但這使谷歌訪問文件,這可能不是你想要的。如果你想控制你的數據和搜索算法,請按照我的回答做! –