2016-11-05 43 views
1

我想使用--use-ngrams true選項運行木槌,但似乎無法使其工作。如何在木槌中使用--use-ngrams

bin\mallet import-file --input ovary.txt --output ovary2.mallet --keep-sequence-bigrams --remove-stopwords 

bin\mallet train-topics --input ovary2.mallet --output-topic-keys ovary_keys2_2.txt --use-ngrams true --num-topics 15 

但我發現了這個錯誤:

Unrecognized option 4: --use-ngrams

+0

您使用的是哪種版本的木槌?最新版本不支持n-grams屬性。 n-grams屬性已從最新版本中刪除。在給出輸出之前,現在的木槌版本使用內置的n-gram特徵。因此,請使用最新版本或讓我知道您使用的版本。 – eshb

回答

0

在槌2.0.8版可以使用:

bin\mallet import-file --input ovary.txt --output ovary2.mallet --keep-sequence-bigrams --remove-stopwords --gram-sizes 1,2 

bin\mallet train-topics --input ovary2.mallet --output-topic-keys ovary_keys2_2.txt --num-topics 15 

您的查看可用的選項爲:

bin\mallet import-file --help 

bin\mallet train-topics --help