我的CSV文件有一個像檢查正是第N個符號由逗號
start_time,end_time,link
1407233497,1407233514,http://s.youtube.com/stream_204?event=streamingstats&fmt=n
1407233498,1407233515,http://s.youtube.com/stream_204?event=cenjreaecnjcd
mingstats&fmt=n
1407233499,1407233516,http://s.youtube.com/stream_204?event=weedwcecd
有些時候鏈接包含新線列,我想刪除它們。我怎樣才能做到這一點從這樣最後輸出的新行變爲:
1407233497,1407233514,http://s.youtube.com/stream_204?event=streamingstats&fmt=n
1407233498,1407233515,http://s.youtube.com/stream_204?event=cenjreaecnjcdmingstats&fmt=n
1407233499,1407233516,http://s.youtube.com/stream_204?event=weedwcecd
我這個AWK一個班輪建議:
awk '{printf "%s%s", (NR>1&&/^[0-9]{10}/?"\n":""),$0}END{print ""}' file
它的偉大工程,但可能它會檢查第10個符號是否逗號更快?
換行字符可能只是內部鏈接和鏈接不能包含逗號
我會很感激的幫助
我猜測你所擁有的'awk'會比需要計數''的''更快,以獲得新的行。這裏每行只有兩個','。 – Jotne 2014-08-31 10:18:37
所以你有一個awk工作程序,你想要什麼,一個更快的?如果這是一個性能優化問題,則應包括樣本輸入,當前時間和目標時間。 – 2014-08-31 10:20:12
@hash你的意思是在鏈接部分可能有多個換行符? – 2014-08-31 10:20:18