在Java中是否有任何開源的LSI實現?我想爲我的項目使用該庫。我已經看到jLSI,但它實現了一些其他LSI的模型。我想要一個標準模型。任何潛在的語義索引?
回答
你有沒有考慮LDA(潛伏狄利克雷分配)?我也沒有,但是我最近遇到了與LSI相同的問題(專利)。據我所知,LDA是一種相關/更強大的技術。 http://en.wikipedia.org/wiki/Latent_Dirichlet_allocation顯然有一些鏈接到開源實現。
雖然你特意要求LSI不是你。哦,值得一試...... –
谷歌搜索java LSI導致a similar question推薦SemanticVectors。在Lucene之上構建的與LSI「相似」的軟件包。我不知道它是否比jLSI實現更接近。
該線程還提到LSI獲得專利並且沒有太多的實現。所以如果你需要一個標準的實現,你可能不得不使用Java以外的語言。
我相信LSA/LSI在1989年獲得專利,這意味着專利應該已經過期。希望我們很快會看到一些不錯的開源應用程序。
S-Space Package具有LSA的開放源代碼版本,並具有對LSI文檔向量的綁定。 (這兩種方法都是在相同的術語 - 文檔矩陣上運行,除輸出外相同)。這是一種使用薄SVD的相當可擴展的方法。我用它在所有維基百科上運行LSI,沒有問題(在刪除少於5次的頻繁項目後)。正如Scott Ray所提到的,SemanticVectors軟件包也有一個很好的LSI實現,最近轉換到使用相同的薄SVD(SVDLIBJ),所以你可能會檢查出來,就好像你之前沒有。
您是否嘗試過語義向量包?
谷歌搜索NLP工具加入約jLSI意見提供這種slides我認爲這有助於...
- 1. 潛在語義索引
- 2. 用於C++的潛在語義分析/索引庫
- 3. 試圖理解潛在語義索引(LSI)
- 4. 潛在語義索引(LSI)是統計分類算法嗎?
- 5. 潛在語義分析在Python差異
- 6. 潛在語義分析概念
- 7. 概率潛在語義分析
- 8. 潛在語義分析(LSA)教程
- 9. 使用潛在語義分析sklearn
- 10. 潛在語義指數化與gensim
- 11. 語義搜索引擎
- 12. Lucene索引與語義
- 13. 找到任何言語在其索引的字符串
- 14. 我們如何確定潛在語義分析的維數?
- 15. LSA - 潛在語義分析 - 如何在PHP中進行編碼?
- 16. 潛在語義分析與顯式語義分析之間的區別
- 17. Java CompletableFuture.runAsync回覆......任何潛在風險?
- 18. 語義搜索引擎和導航器
- 19. 語義Web服務搜索引擎
- 20. 語義UI - 添加z索引下拉
- 21. 從SqlDataReader中爲INSERT語句檢索潛在的異常
- 22. Swift - 數組[任何索引]?
- 23. 爲潛在語義分析選擇適當的聚類方法
- 24. WEKA中潛在語義分析的可擴展性
- 25. 「預建」用於潛在語義分析的矩陣
- 26. 發現主題的潛在語義分析
- 27. 索引在PHP語法
- 28. 如何確定語義搜索引擎的準確性?
- 29. 潛在的潛在泄漏
- 30. 執行潛在的昂貴任務
感謝。 – Nettogrof