1
我第一次嘗試Gensim,現在有一個問題。我已經培訓了一個準備好文件的語料庫的LSI模型。我的問題是,如何知道新文檔是否與從文檔語料庫生成的我的模型相似。我不想知道文檔與MatrixSimilarity之類的語料庫中的每個文檔的相似性,而是知道文檔是否與我的主題/模型相似。Doc2Vec Gensim文檔和主題之間的相似性
我第一次嘗試Gensim,現在有一個問題。我已經培訓了一個準備好文件的語料庫的LSI模型。我的問題是,如何知道新文檔是否與從文檔語料庫生成的我的模型相似。我不想知道文檔與MatrixSimilarity之類的語料庫中的每個文檔的相似性,而是知道文檔是否與我的主題/模型相似。Doc2Vec Gensim文檔和主題之間的相似性
我認爲你應該對新文檔做LSI,然後計算主題之間的相似性,看看這個。 https://stats.stackexchange.com/questions/271359/using-lda-to-calculate-similarity/271368