1
我想使用wordnet
lemmatizer到lemmatize詞語a
WORDNET Lemmatizer對於R
> a<-c("He saw a see-saw on a sea shore", "she is feeling cold")
> a
[1] "He saw a see-saw on a sea shore" "she is feeling cold"
我轉換a
成語料庫和做預處理步驟(例如停用詞去除,詞形還原等)
> a <- Corpus(VectorSource(a))
我想做的詞形歸併在下面的方式,
> filter <- getTermFilter("ExactMatchFilter", a, TRUE)
> terms <- getIndexTerms("NOUN", 1, filter)
> sapply(terms, getLemma)
但我得到這個錯誤
> filter <- getTermFilter("ExactMatchFilter", a, TRUE)
Error in .jnew(paste("com.nexagis.jawbone.filter", type, sep = "."), word, :
java.lang.NoSuchMethodError: <init>
我的想法是lemmatize整個語料,而不是一個字,怎麼能實現呢?
不完全確信,使用R與共發現或任何NLP設施進行交互,但我希望在這裏做的是使用RPY到完成R業務並將NLTK用於WordNet /詞形化的東西。授予此作品,除非你的代碼由於某種原因必須在R中。 – dmn 2013-02-25 20:27:54