2014-02-25 55 views
1

新到R: 我有4個coloumns 「賬戶號碼」, 「說明」, 「estimatedprice」, 「negotiatedprice」 CSV文件In R從CSV文件中刪除「,:/」等標記?

我想要清理的描述和刪除等,#* [痕跡?! }]}';: 我該怎麼做?

我正在寫下面的代碼,但輸出表不工作。

positivefiles <- read.csv('E:/Sanj/text/Second/positive files.csv') 
sf <-positivefiles 
df <- gsub("[?.;!¡¿·,']/", "", sf) 

當我這樣做時,df被存儲爲值而不是csv文件。

我想清潔csv文件描述無標記。

請幫我對這個 謝謝。

+1

write.csv(df,「yourCSVname.csv」)會將df導出爲CSV –

+1

Fyi,'[:punct:]'將查找所有標點符號。比編寫所有標點符號容易一點。 –

+0

謝謝史蒂夫它確實導出爲CSV在我的目錄,但它僅包含數字 我的數據是 Accountnumbe說明EstPrice NegPrice 12334這是小,訂單:50 45 當我導出CSV它給了我一些隨機數 – Sanjeev

回答

1

您需要爲gsub指定您希望修改的sf列。

嘗試:

df <- sf 
df$description <- gsub("[?.;!¡¿·,']/", "", df$description) 

您可能需要調整您的語句來匹配正確的字符集,你要刪除。

+0

謝謝,這一個工程,但它沒有其他列如accountnumber,Estdol,Netdol 'df $ CLAIM_DESCRIPTION < - gsub(「[?。;!',:;'/ *#@ $]」,「」,df $ CLAIM_DESCRIPTION) write.csv(df $ CLAIM_DESCRIPTION,「stack.csv」)' – Sanjeev

+0

我終於知道了謝謝。 – Sanjeev

1

以防萬一某人在尋找最終代碼/遇到類似問題。

positivefiles <- read.csv('E:/Sanj/text/Second/positive files.csv') 
sf <-positivefiles 
df <- sf 
df$DESCRIPTION <- gsub("[[:punct:]]","",df$DESCRIPTION) 
write.csv(df,"cool.csv) 

詞典: Cool.csv是存儲在目錄中我最終輸出文件

說明是我的列只需要修改的一個。

謝謝大家的意見。