我已經上傳csv
文件在R使用import
。文件包含2列標籤和相應的文本/描述到從不同的新聞報道中提取的標籤。它有更多的2k行和標籤重複。標籤是文本形式。將數字分配給r中的分類變量
我需要將這些數據映射到數值(商業,娛樂,政治,運動,科技)(0,1,2,3,4)上傳文件後。任何人都可以幫助我。我很新R編程
我已經上傳csv
文件在R使用import
。文件包含2列標籤和相應的文本/描述到從不同的新聞報道中提取的標籤。它有更多的2k行和標籤重複。標籤是文本形式。將數字分配給r中的分類變量
我需要將這些數據映射到數值(商業,娛樂,政治,運動,科技)(0,1,2,3,4)上傳文件後。任何人都可以幫助我。我很新R編程
假設您的類別是字符類型,您可以使用factor()
函數枚舉它們,並減去1以使其從零開始。
df <- data.frame(category = c("business", "entertainment", "business", "sport"),
descr = c("one", "two", "three", "four"))
df$number <- as.numeric(factor(df$category)) -1
這導致:
category descr number
1 business one 0
2 entertainment two 1
3 business three 0
4 sport four 2
謝謝。我會更清楚的問題。我的csv文件數據是類似於 col1 col2 娛樂'回擊'節目爲朋友明星朋友扮演主角.. 政治從每日電訊報說,他會比賽... ... - .. 像2k加上行重複娛樂,政治,體育etc.I已導入文件在虛擬 虛擬< - read.csv(「文件路徑」) 內部文件'虛擬'我需要分配數值(業務,娛樂,政治,體育,科技)(0,1,2,3,4),所以我可以繪製一個圖。 – user8669762
也許'as.factor'?我不確定我是否理解你的問題。 – Therkel