1
的removeCommonTerms功能發現here爲TM封裝,使得R:使用Quanteda軟件包刪除通用條款?
removeCommonTerms <- function (x, pct)
{
stopifnot(inherits(x, c("DocumentTermMatrix", "TermDocumentMatrix")),
is.numeric(pct), pct > 0, pct < 1)
m <- if (inherits(x, "DocumentTermMatrix"))
t(x)
else x
t <- table(m$i) < m$ncol * (pct)
termIndex <- as.numeric(names(t[t]))
if (inherits(x, "DocumentTermMatrix"))
x[, termIndex]
else x[termIndex, ]
}
現在我想與Quanteda包中取出過的常用術語。在創建文檔特徵矩陣或文檔特徵矩陣之前,我可以執行此刪除操作。
如何刪除R中Quanteda軟件包的常見術語?