要回答你的第一個問題:
你可以用條件過濾您的數據幀。 R中選擇特定的rows
或columns
的通用代碼結構是這樣的:
假設你的數據幀對象被稱爲df
。
df <- data.frame(date = c("24 aug", "19 Aug", "15 july", "31 aug", "10 Aug", "12 Aug"),
customer_id = c(1000003007, 1000008006, 1000008006, 1000008006, 1000009009, 1000010004),
Category = c("A", "B"))
df[rows, columns]
您可以使用數字調用行和列在數據框中的位置。
df[1, ]
date customer_id Category
1 24 aug 1000003007 A
將選擇第一行和所有列。
df[, 1]
[1] 24 aug 19 Aug 15 july 31 aug 10 Aug 12 Aug
Levels: 10 Aug 12 Aug 15 july 19 Aug 24 aug 31 aug
將選擇所有行,但僅選擇第一列。您還可以通過他們的名字選擇列:
df[, "customer_id"]
[1] 1000003007 1000008006 1000008006 1000008006 1000009009 1000010004
將選擇所有的行,但僅列customer_id
。這也可以通過df$customer_id
完成。
要使用行條件選擇,你的逗號前插入一個條件進入空間:
df[df$Category == "A",]
date customer_id Category
1 24 aug 1000003007 A
3 15 july 1000008006 A
5 10 Aug 1000009009 A
將選擇所有列,但僅滿足以下條件:column "Category" is equal to "A"
行。
我無法回答第二個問題,因爲您的數據示例不包含df$Category == "Both"
的行。
來源
2017-09-26 07:30:05
LAP
在您的問題中添加輸入數據和期望的輸出。 – Santosh
添加樣本數據圖像。請幫助 – Mreenal
添加輸入數據幀的'dput'或'structure'。也是所需的輸出。 – Santosh