2016-06-11 58 views
1

我從指定20個主題的文本體訓練了一個模型,但是當我在新文檔上運行推理器時,它僅輸出10個主題權重。這是我使用的命令:關於從訓練模型推斷主題權重 - MALLET

  1. 斌/槌導入文件--input /data/research/bazaarvoice/data/review_nouns.txt --output /data/research/bazaarvoice/data/review_nouns_mallet.mallet --keep序列--use - 管 - 從/data/research/bazaarvoice/data/ques_mallet.mallet

  2. 斌/槌火車主題\ --input /數據/科研/ Bazaarvoice的/數據/ ques_mallet .mallet \ --num-topics 20 \ --output-topic-keys /data/research/bazaarvoice/data/ques_train_keys.txt \

  3. bin/mallet infer-topics \ --input /data/research/bazaarvoice/data/review_nouns_mallet.mallet \ --inferencer-filename /data/research/bazaarvoice/data/ques_train_mallet_topics.txt \ --output- DOC課題/data/research/bazaarvoice/data/review_new_topics.txt

你能不能讓我知道我做錯了什麼?

+1

步驟2當然還包括output-model命令,它輸出文件ques_train_mallet_topics.txt(用作推理器中的訓練模型) –

回答

1

--num-topics 20添加到infer-topics調用。