我試圖實現全文搜索時遇到了問題。對我來說,它接近像數學/統計學更多的東西。從數據庫中提取的數據是書名,所以查詢返回的分數可能具有非常接近的值(例如:9.98; 9.97; 9.78 - 這些都是非常相關的結果)或廣泛傳播(例如:9.99; 8.2; 2.1 - 前兩個是相關的,第三個是噪音)。我無法弄清楚如何操作查詢結果以刪除不相關的。標準偏差不起作用,因爲它在我的第一個例子中過濾了很好的結果,各種標準化方法將忽略相關結果或包含不相關的結果。請任何想法或想法。全文搜索分數相關性分析
謝謝。 Victor
我不知道項目的確切限制和用例,但是在製作書名搜索功能時,我想知道......您最好擔心決定什麼是相關的?用戶可以選擇較差的搜索條件,並最終得到他們真正想要的特定搜索排名列表底部的內容。另外,結果是否以分頁方式顯示?也許不值得擔心離羣值,只是允許你的分頁機制隱藏較不相關的選項,而不會完全阻止用戶找到它們。 – curtisdf 2012-07-10 18:54:27