我應該如何加載.txt文件的內容才能在網站上投放？

我正在嘗試爲每個文檔構建摘錄，作爲搜索結果返回到我的網站上。我在Linux CentOS上使用Sphinx搜索引擎和Apache Web服務器。我想使用的Sphinx API中的函數叫做BuildExcerpts。此函數要求您傳遞一個字符串數組，其中每個字符串都包含文檔內容。我應該如何加載.txt文件的內容才能在網站上投放？

我想知道什麼是實時檢索文檔內容的最佳做法，因爲我在網上提供結果。目前，這些文檔在我係統中的文本文件中，分佈在多個驅動器上。它們大約有100MM，佔用了幾太字節的空間。

我很容易打電話給file_get_contents()之類的東西，但感覺就像是錯誤的做法。我的數據庫已經很龐大（100GB +），我並不特別想將文檔內容與已存在的文檔屬性一起扔到那裏。但是，也許這是做到這一點的最佳方式。

對此提出建議？

來源

2012-02-09 T. Brian Jones

那麼源需要從某處獲取。如果你不想在數據庫中複製它，那麼你將需要從文件系統中獲取它。（使用file_get_contets或類似）

雖然BuildExerpts功能確實給你一個額外的選項「load_files」

...然後獅身人面像將從文件名全部讀取數據。

您從文件中讀取時遇到了什麼問題？它太慢了嗎？如果是這樣的話，可以在前面使用一些緩存 - 也許使用memcache。

來源

2012-02-09 14:11:55 barryhunter

我應該如何加載.txt文件的內容才能在網站上投放？

回答

相關問題