latent-semantic-indexing

    6熱度

    6回答

    在Java中是否有任何開源的LSI實現?我想爲我的項目使用該庫。我已經看到jLSI,但它實現了一些其他LSI的模型。我想要一個標準模型。

    0熱度

    1回答

    我想了解如何執行在LSI中執行SVD後生成的矩陣的乘法。我需要這個來進行我的研究。我想執行文檔聚類。

    2熱度

    1回答

    我想爲我正在構建的小應用程序使用潛在語義分析,但我不想自己構建矩陣。 (部分原因是我擁有的文檔不會做出非常好的培訓集合,因爲它們有點短而且多種多樣,部分原因是我剛剛購買了一臺新電腦,而且我發現它很難安裝線性代數等等我需要的庫。) 是否有任何「默認」/預先構建的LSA實現可用?例如,事我在尋找包括: 默認U,S,V的矩陣(即,如果d是從一些訓練集合中的術語的文檔矩陣,則d = USV^T是奇異值分解

    1熱度

    2回答

    目標是評估大型文本語料庫中詞語之間的語義相關性,例如。 '警察'和'犯罪'應該比'警察'和'山'有更強的語義相關性,因爲它們傾向於在相同的背景下共同發生。 我讀過的最簡單的方法是從語料庫中提取IF-IDF信息。 很多人都使用潛在語義分析來發現語義相關性。 我遇到了Lucene搜索引擎:http://lucene.apache.org/ 你認爲這是合適的提取IF-IDF? 對於技術和軟件工具(對於J