2015-02-10 60 views
-1

我的任務是創建一個搜索系統,幫助用戶瀏覽多個1000多頁的pdf文件。但是,這些文件首先必須放在MySQL DB上。我目前遇到的問題是如何將這些PDF文件存儲在數據庫中,並將相關的PDF標題分配給數據庫。將PDF文件存儲在MySQL服務器上智能

實施例:

在不同的表中分別在DB添加各零件/頁眉/組/分段。

這一切都必須手動輸入?記住,我們正在討論10萬頁的PDF頁面。

感謝

+1

您不想將PDF存儲在數據庫中。重新思考你的方法。 – jurgemaister 2015-02-10 08:41:11

+0

文件屬於文件系統,數據庫用於數據。如果必須,將pdf存儲在文件系統上並將路徑存儲在數據庫中。 – runDOSrun 2015-02-10 08:54:11

回答

1

你會更好地存儲在數據庫中的一些元數據,並存儲PDF文件的位置。

即所謂的 '文件' 可能有以下字段表: ID,路徑,關鍵字,類別

的路徑將是:/some/location/to/my/pdf/file.pdf

關鍵字可能是; 'pdf1,什麼是pdf,一些搜索文字'

這將允許您存儲PDF文件。

或者,您可以使用類似Google的東西 - 它們允許您使用其搜索技術。它曾經是一個'谷歌黃色框'的形式,但我相信它現在是他們的雲東西的一部分!

HTH

+0

我的問題是,這些pdf主要由外部客戶搜索,他們並不總是知道「x,y,z」他們在尋找什麼。我的搜索系統必須能夠將用戶指向他們正在尋找的相關pdf/pdf頁面的方向。這些文件也定期更新,通常每6個月或更少意味着標準的PDF鏈接幾乎沒有生存能力 – 2015-02-10 09:25:55

+0

關於不同的版本,我會建議添加另一列,版本。這樣可以確保您爲審計目的保留PDF的歷史記錄。 – 2015-02-10 09:31:34

+0

在搜索內容方面;有幾個「pdf2text」庫。但我不確定這是你想要的方法,因爲你將所有的數據存儲在數據庫中。我肯定會建議看看谷歌搜索設備:) – 2015-02-10 09:34:09

相關問題