我正在嘗試爲每個文檔構建摘錄,作爲搜索結果返回到我的網站上。我在Linux CentOS上使用Sphinx搜索引擎和Apache Web服務器。我想使用的Sphinx API中的函數叫做BuildExcerpts。此函數要求您傳遞一個字符串數組,其中每個字符串都包含文檔內容。我應該如何加載.txt文件的內容才能在網站上投放?
我想知道什麼是實時檢索文檔內容的最佳做法,因爲我在網上提供結果。目前,這些文檔在我係統中的文本文件中,分佈在多個驅動器上。它們大約有100MM,佔用了幾太字節的空間。
我很容易打電話給file_get_contents()
之類的東西,但感覺就像是錯誤的做法。我的數據庫已經很龐大(100GB +),我並不特別想將文檔內容與已存在的文檔屬性一起扔到那裏。但是,也許這是做到這一點的最佳方式。
對此提出建議?