2017-09-25 84 views
-1

我已經上傳csv文件在R使用import。文件包含2列標籤和相應的文本/描述到從不同的新聞報道中提取的標籤。它有更多的2k行和標籤重複。標籤是文本形式。將數字分配給r中的分類變量

我需要將這些數據映射到數值(商業,娛樂,政治,運動,科技)(0,1,2,3,4)上傳文件後。任何人都可以幫助我。我很新R編程

+0

也許'as.factor'?我不確定我是否理解你的問題。 – Therkel

回答

0

假設您的類別是字符類型,您可以使用factor()函數枚舉它們,並減去1以使其從零開始。

df <- data.frame(category = c("business", "entertainment", "business", "sport"), 
        descr = c("one", "two", "three", "four")) 
df$number <- as.numeric(factor(df$category)) -1 

這導致:

 category descr number 
1  business one  0 
2 entertainment two  1 
3  business three  0 
4   sport four  2 
+0

謝謝。我會更清楚的問題。我的csv文件數據是類似於 col1 col2 娛樂'回擊'節目爲朋友明星朋友扮演主角.. 政治從每日電訊報說,他會比賽... ... - .. 像2k加上行重複娛樂,政治,體育etc.I已導入文件在虛擬 虛擬< - read.csv(「文件路徑」) 內部文件'虛擬'我需要分配數值(業務,娛樂,政治,體育,科技)(0,1,2,3,4),所以我可以繪製一個圖。 – user8669762