2012-02-09 15 views
0

我正在嘗試爲每個文檔構建摘錄,作爲搜索結果返回到我的網站上。我在Linux CentOS上使用Sphinx搜索引擎和Apache Web服務器。我想使用的Sphinx API中的函數叫做BuildExcerpts。此函數要求您傳遞一個字符串數組,其中每個字符串都包含文檔內容。我應該如何加載.txt文件的內容才能在網站上投放?

我想知道什麼是實時檢索文檔內容的最佳做法,因爲我在網上提供結果。目前,這些文檔在我係統中的文本文件中,分佈在多個驅動器上。它們大約有100MM,佔用了幾太字節的空間。

我很容易打電話給file_get_contents()之類的東西,但感覺就像是錯誤的做法。我的數據庫已經很龐大(100GB +),我並不特別想將文檔內容與已存在的文檔屬性一起扔到那裏。但是,也許這是做到這一點的最佳方式。

對此提出建議?

回答

0

那麼源需要從某處獲取。如果你不想在數據庫中複製它,那麼你將需要從文件系統中獲取它。 (使用file_get_contets或類似)

雖然BuildExerpts功能確實給你一個額外的選項「load_files」

...然後獅身人面像將從文件名全部讀取數據。

您從文件中讀取時遇到了什麼問題?它太慢了嗎?如果是這樣的話,可以在前面使用一些緩存 - 也許使用memcache。

相關問題