0
我無法得到這個工作。我想用一個csv文件的第一個字段替換所有的兩個字符發生,並且附加了一個X
,並且刪除了空格。例如,SA
和SA
應映射到新文件中的SAX
。下面是我試圖與sed
(從幫助通過前面一個問題)如何使用轉義字符構建一個system()函數調用sed?
system(paste("sed ","'" ,' s/^GG/GGX/g; s/^GG\\s/GGX/g; s/^GP/GPX/g;
s/^GP\\s/GPX/g; s/^FG/FGX/g; s/^FG\\s/FGX/g; s/^SA/SAX/g; s/^SA\\s/SAX/g;
s/^TP/TPX/g; s/^TP\\s/TPX/g ',"'",' ./data/concat_csv.2 >
./data/concatenated_csv.2 ',sep=''))
我嘗試使用sQuote()
功能,但是這仍然沒有幫助。該文件有問題由read.csv處理,因爲某些字段中存在錯誤,因爲某些行上的分隔符太多而分隔符不足。
我可以嘗試閱讀和編輯文件,但我不知道如何做到這一點作爲一個流媒體過程。
我真的只想使用system()
調用來編輯文件的第一個字段。該文件大約30GB。
請定義「太大」和「太複雜」。 R有處理大文件的軟件包,並且'read.table'或'scan'有大量的過濾器。 –
謝謝,編輯了這個問題。 – Yoda