data-manipulation

1熱度

3回答

我正在處理來自不同來源的關於同一事物的巨大Excel表格。消息來源報告並記錄信息的方式不同。因此，例如，一個人會將位置寫爲「Khurais」，而另一個會將其寫爲「Khorais」。由於這兩個文件都包含重要信息，我想將它們合併到一個Excel表中，以便我可以更輕鬆地處理它們。因此，如果您有任何您認爲有益的建議或工具，請在此分享。 P.s. excel表單中的單詞是阿拉伯詞的翻譯。

1熱度

2回答

R中

換上多串相同的文本這裏是我的樣本數據： root <- c("how to manage xxx","how to run xxx","how to operate xxx") type <- c("resturant","grocery store","retail store") 我想，在「類型」每個字符串替換XXX。現在我正在使用gsub函數，但它一次只能替換一個查詢。 kw <- g

1熱度

1回答

基於預定義桶的百分比垃圾箱

我有一系列數字，我想知道數據的每個桶中落入的數字的百分比。 df['cuts']具有10,20和50的值。具體來說，我想series的％是在[0-10], (10-20] and (20-50] bin中，這應該附加到df數據幀。我寫了下面的代碼。我絕對認爲它可以是即興創作的。任何幫助表示讚賞。 bin_cuts = [-1] + list(df['cuts'].values) out = p

0熱度

1回答

操縱基於另一列

我有一個數據幀（如下所示）列的值： df <- read.table(header = TRUE, text = "STUD_ID MEAS VALUE 1 LVEF(M-M) 69 1 LVEF(2D) 66 2 LVEF(2D) 36 2 LVEF(2D) 72 2 IVSD 63

2熱度

4回答

採用相同的標準在許多列計算新列

我有類似下面的一個數據幀，除了我有17個變量（如Var1和Var2），而不是2 df <- read.table(header = TRUE, text = "STUD_ID Var1 Var2 1 0 0 1 0 1 2 1 2 3 3 0", stringsAsFactors = FALSE

1熱度

3回答

訪問多級屬性及其屬性的完整路徑

我目前正在努力解決JavaScript問題。我想通過傳入原始對象以及一組路徑到我想要的屬性來返回多級屬性以及其中包含的每個變量。舉例來說，如果我有以下對象： obj = { product: { candidate: { id: 10, reference: "test", count: 4, steps: 10 }

1熱度

1回答

兩個數據重複測試

如果我有2個數據有一些相同的列名，我想檢查不同的觀測值，我該怎麼辦？這裏是我的樣本數據： # dt1 ID Name ColA ColB 2 Peter 1 2 4 Freda 50 4 5 Jean 8 10 # dt2 ID Name ColA ColB ColC ColD 1 Roger 1 2 400 2 Peter 1 2 500 2000 3 Tin

1熱度

2回答

保留基於其他列的觀察

此問題是從here的擴展。如果我的數據有一個名爲Remark柱： ID Name Type Date Amount Remark 1 AAAA First 2009/7/20 100 Not want 1 AAAA First 2010/2/3 200 want ya 2 BBBB First 2015/3/10 250 2 CCC Second 2009/2/

3熱度

1回答

蟒蛇 - 逗號分隔字符串列的二進制編碼

有人可以幫我看起來像下面的例子從這裏去一個數據的二進制編碼： df = pd.DataFrame({'_id': [1,2,3], 'test': ['one,two,three', 'one,two', 'two']}) print(df) _id test 0 1 one,two,three 1 2 one,two 2 3 two 到這裏：

1熱度

1回答

在r函數中子集 - 總是返回所選變量的第一個因子

我想在我編寫的函數中使用子集數據，但我一直遇到同樣的問題，即子集數據是我想要的。樣本數據： n = c(2, 3, 5) QID = c("aa", "bb", "cc") b = c(TRUE, FALSE, TRUE) df = data.frame(n, QID, b) df$QID = as.character(df$QID) str(df) 'data.frame': 3