我正在嘗試製作書籍的推薦網站。我已經抓取了一些書籍站點,並且在DB中有大約1,500萬冊單獨的書籍,其在neo4j中。neo4j中針對大型數據集的基於內容的記錄系統
現在對於一些流派,如神祕和驚悚片,至少有一百萬本書。我必須列出前20名的建議。我現在approach-
- 拿到書
- 運行相似度比較(VEC-餘弦或pearsons)
- 排序和顯示
價格昂貴,而且需要時間,不是爲好一個實時系統。我認爲通過將neo4j鏈接到傳統的數據庫並通過neo4j從該數據庫獲取最高的數據庫,可以保持每個流派的排序列表。但這也很慢(需要幾秒鐘)。有沒有更簡單,更直觀的方法來做到這一點?任何想法都會有幫助。