這是我在this thread中回覆的內容。我試圖在gensim中打印LSI主題時遇到了一些棘手的結果。這是我的代碼:
try:
from gensim import corpora, models
except ImportError as err:
print err
class LSI:
def topics(self, corpus):
tfidf = models.TfidfModel(corpus)
corpus_tfidf = tfidf[corpus]
dictionary = corpora.Dictionary(corpus)
lsi = models.LsiModel(corpus_tfidf, id2word=dictionary, num_topics=5)
print lsi.show_topics()
if __name__ == '__main__':
data = '../data/data.txt'
corpus = corpora.textcorpus.TextCorpus(data)
LSI().topics(corpus)
這將以下內容輸出到控制檯。
-0.804*"(5, 1)" + -0.246*"(856, 1)" + -0.227*"(145, 1)" + ......
我希望能夠打印出像@ 2er0的主題做了over here但我得到這樣的結果。請參閱下面的內容並注意打印的第二項是一個元組,我不知道它來自哪裏。 data.txt是一個包含幾個段落的文本文件。就這些。
對此的任何想法都是太棒了!亞當
非常感謝您抽出時間來解決這個問題!我們現在很好... – aeupinhere 2013-03-12 02:58:46