2016-01-22 89 views
0

目標: 我有一個包含很多單詞的文檔。我需要弄清楚哪些單詞有拼寫錯誤。如何檢查Wordnet數據庫中是否存在單詞

我已經爲此安裝了WordNet 3.0。

通過下面的命令,我可以檢查wordnet是否確實存在於wordnet數據庫中,但這需要我指定POS,即NOUN,PRONOUN等。我可能不知道事先

filter <- getTermFilter("ExactMatchFilter", "car", TRUE) 
terms <- getIndexTerms("NOUN", 5, filter) 

請讓我知道一個方法來解決R中我的問題

回答

0

一種方法:

library(wordnet) 
inWordnet <- function(w, pos = c("ADJECTIVE", "ADVERB", "NOUN", "VERB")) { 
    for (x in pos) { 
    filter <- getTermFilter("ExactMatchFilter", w, TRUE) 
    terms <- getIndexTerms(x, 5, filter) 
    if (!is.null(terms)) return(TRUE) 
    } 
    return(FALSE) 
} 
inWordnet("car") 
# [1] TRUE 

或矢量:

vInWordnet <- Vectorize(inWordnet, vectorize.args = c("w", "pos")) 
vInWordnet(c("car", "asdas")) 
# car asdas 
# TRUE FALSE 
相關問題