2
NGRAM使用像R下面的命令就可以讓你期望的ngram的級別執行:範圍R中
myDfm <- dfm(txt, ngrams = 2, ignoredFeatures = stopwords("english"))
是否可以給出像NGRAM一個範圍(1 ,3)?
實施例的代碼在python:
vectorizer = TfidVectorizer(stop_words=stop_words, use_idf=True, ngram=range(1, 3))