我從R中導出它並在Excel中手動添加Segment列後,有一些看起來像這樣的原始數據。根據其他三列中的值設置R列中的值
原始數據拉昇到Excel
我想寫R中的代碼,將添加段我。
數據說明......
ID: Random distinct numbers
flag: Yes or No
Period: 0-12 Mths or 12-24 Mths
Spend Group: High, Medium or Low
規則...
Flag = Yes
Period = 0-12 Mths
Spend Group = High
Then Segment = G01
Flag = Yes
Period = 0-12 Mths
Spend Group = Medium
Then Segment = G02
Flag = Yes
Period = 0-12 Mths
Spend Group = Low
Then Segment = G03
Flag = Yes
Period = 12-24 Mths
Spend Group = High
Then Segment = G04
...依此類推,直至所有的變量已經佔到
我想要的代碼在每次處理數據時識別差異,例如,該標誌不總是爲「是」或「否」。有時,每行都爲「是」。
我的完整數據集摘要如下圖所示。
彙總數據
你將如何開始R中的代碼呢?
首先,你希望將其保存爲CSV,然後將其讀入R作爲與數據幀'''DF < - read.csv( 「C:/Users/you/path_to_file/file.csv」)'''。之後,我建議閱讀關於R的教程。這是您要學習的第一件事情之一 – rsoren
Thanks @rsoren。我已經擁有了R中的所有數據,這是處理的最後一步。我不想輸入規則,因爲可能會有比上面顯示的更多的變量。理想情況下,我想爲每個條件創建矢量或類似的東西,並將它們用作規則的主幹,例如flag < - c(「Yes」,「No」),recency < - c(「0-12 Mths 「,」12-24 Mths「)等。你能推薦一個教程。 –
你嘗試過什麼嗎?一個用戶陣營可能會建議使用'dplyr'管道,而另一些陣營則會使用'data.table'示例進行反擊。它也可以在R中直接進行,可能使用'ifelse'或其他基於向量的操作。首先,如果我們有一些數據可以使用,那麼製作一些東西就簡單多了,而且我不傾向於從圖像中轉錄。在[help/mcve](https://stackoverflow.com/help/mcve)和[一個受歡迎的q/a](https://stackoverflow.com/a/5963610/3358272)上編寫好的問題有很好的建議。 。 – r2evans