qdap

    1熱度

    1回答

    qdap :: mgsub採用以下參數: mgsub(x, pattern, replacement) 在庫(TM)胼變換可以內content_transformer()包裹非TM功能,例如 corpus <- tm_map(corpus, content_transformer(tolower)) 下面是一些拼寫混亂的文本數據幀: df <- data.frame( id = 1

    1熱度

    1回答

    我一直在尋找這樣一個問題: R: gsub, pattern = vector and replacement = vector 我想要一個簡單的例子,我無法得到它工作。 testList <- c("apple", "orange", "banana1", "apple4", "orange 8", "banana 10") repl <- c("apple", "orange", "ban

    0熱度

    1回答

    對於qdap來說,這是相當新穎的,但我不確定此功能是否存在,但具有如下所述的功能會很棒。 我的初始數據集。 ID Keywords 1 112 mills, open heart surgery, great, great job 2 Ausie, open, heart out 3 opened, heartily, 56mg)_job, orders12 4 ord

    1熱度

    1回答

    我在R中使用qdap包進行拼寫檢查。我運行下面的代碼,並給出了這樣的 which_misspelled("I use a 50Gb broadband connection") > 4 5 >"gb" "broadband" 的話有道理,但對於這些修正是irrelevant.Is存在任何選項,我們可以給我們的自定義單詞列表,此功能不過濾的輸出?

    1熱度

    2回答

    替換值的字符串值我有了像 string<-c('lib1_Rstudio_case1','lib2_Rstudio_case1and2','lib5_python_notthe correct_language','lib3_Jupyter_really_good','lib1_spyder_nice','lib1_R_the_core') replacement<-c('Rstudio

    0熱度

    1回答

    我正在使用RStudio,並有一個發音變量和一個帶有音節計數的音節變量。每個包含「T恤」的話語都需要一個音節。 (自動qdap syllable_sum給了「T恤」它1(它需要2))。 一個例子:黃色t恤有3個(它需要4個音節)。 我不想寫所有我嘗試過的,沒有奏效的東西。 我已經找到這個例子,但不適用於我可以使用的R。

    0熱度

    1回答

    new數據集 "1" "A.Kejriwal Sena" "2" "Bhanwarlal Sharma" "3" "Millennium Post" "4" "" "5" "Mushkil hai Zindagi" "6" "" "7" "niraj" "8" "" "9" "Dharmender Malik" "10" "S. M. Malik" "11" "Hocalwir

    2熱度

    1回答

    我有一些文本數據的DF,例如, words <- data.frame(terms = c("qhick brown fox", "tom dick harry", "cats dgs", "qhick black fox")) 我已經能夠基於包含拼寫錯誤的任何行子集: library(qdap) words[check

    -1熱度

    1回答

    我是R新手。 我有一張表,裏面有一些我想從參考表中更新的缺失數據。 樣品數據表: df1=data.frame(id=c(1:5),dob=as.Date(c("1/1/2001" ,"2/2/2002",NA,NA,NA),"%m/%d/%Y"),other_data=paste0("data",seq(1:5))) 樣品查找表: bd_ref<-data.frame(id=c(1

    0熱度

    2回答

    替換數據幀一定的價值,我有兩個數據框: df1 <- data.frame(id = c("LABEL1", "LABEL2", "LABEL3", "LABEL4", "LABEL5", "LABEL6"),matrix(1:60,6,10)) df1[c(4:6), c(2:4)] = NA df2 = data.frame(id = c("LABEL3", "LABEL4", "LAB