qdap

1熱度

1回答

在tm :: content_transformer（）的上下文中，我將如何使用mgsub？

qdap :: mgsub採用以下參數： mgsub(x, pattern, replacement) 在庫（TM）胼變換可以內content_transformer()包裹非TM功能，例如 corpus <- tm_map(corpus, content_transformer(tolower)) 下面是一些拼寫混亂的文本數據幀： df <- data.frame( id = 1

1熱度

1回答

似乎無法得到量化GSUB與圖書館「qdap」和mgsub工作

我一直在尋找這樣一個問題： R: gsub, pattern = vector and replacement = vector 我想要一個簡單的例子，我無法得到它工作。 testList <- c("apple", "orange", "banana1", "apple4", "orange 8", "banana 10") repl <- c("apple", "orange", "ban

0熱度

1回答

使用all_words生成的文字替換文字中的單詞

對於qdap來說，這是相當新穎的，但我不確定此功能是否存在，但具有如下所述的功能會很棒。我的初始數據集。 ID Keywords 1 112 mills, open heart surgery, great, great job 2 Ausie, open, heart out 3 opened, heartily, 56mg)_job, orders12 4 ord

1熱度

1回答

R中包'qdap'中的自定義單詞

我在R中使用qdap包進行拼寫檢查。我運行下面的代碼，並給出了這樣的 which_misspelled("I use a 50Gb broadband connection") > 4 5 >"gb" "broadband" 的話有道理，但對於這些修正是irrelevant.Is存在任何選項，我們可以給我們的自定義單詞列表，此功能不過濾的輸出？

1熱度

2回答

在查找列表中的R

替換值的字符串值我有了像 string<-c('lib1_Rstudio_case1','lib2_Rstudio_case1and2','lib5_python_notthe correct_language','lib3_Jupyter_really_good','lib1_spyder_nice','lib1_R_the_core') replacement<-c('Rstudio

0熱度

1回答

RStudio - 根據另一個內容中的內容更改變量

我正在使用RStudio，並有一個發音變量和一個帶有音節計數的音節變量。每個包含「T恤」的話語都需要一個音節。（自動qdap syllable_sum給了「T恤」它1（它需要2））。一個例子：黃色t恤有3個（它需要4個音節）。我不想寫所有我嘗試過的，沒有奏效的東西。我已經找到這個例子，但不適用於我可以使用的R。

0熱度

1回答

R中name2sex函數的錯誤？

new數據集 "1" "A.Kejriwal Sena" "2" "Bhanwarlal Sharma" "3" "Millennium Post" "4" "" "5" "Mushkil hai Zindagi" "6" "" "7" "niraj" "8" "" "9" "Dharmender Malik" "10" "S. M. Malik" "11" "Hocalwir

2熱度

1回答

基於頻率表的子集/過濾器

我有一些文本數據的DF，例如， words <- data.frame(terms = c("qhick brown fox", "tom dick harry", "cats dgs", "qhick black fox")) 我已經能夠基於包含拼寫錯誤的任何行子集： library(qdap) words[check

-1熱度

1回答

r查找函數返回負日期

我是R新手。我有一張表，裏面有一些我想從參考表中更新的缺失數據。樣品數據表： df1=data.frame(id=c(1:5),dob=as.Date(c("1/1/2001" ,"2/2/2002",NA,NA,NA),"%m/%d/%Y"),other_data=paste0("data",seq(1:5))) 樣品查找表： bd_ref<-data.frame(id=c(1

0熱度

2回答

從另一個數據幀

替換數據幀一定的價值，我有兩個數據框： df1 <- data.frame(id = c("LABEL1", "LABEL2", "LABEL3", "LABEL4", "LABEL5", "LABEL6"),matrix(1:60,6,10)) df1[c(4:6), c(2:4)] = NA df2 = data.frame(id = c("LABEL3", "LABEL4", "LAB