2012-03-22 107 views
0

我有一個逗號分隔的數據集。但是我的格式有點問題。我想要的一切是在形式X,X,X僅替換特定行上的逗號

下面是我的數據集的樣本:

995970,16779453 
995971,16828069 
995972, 
995973,16828069 
995974,16827226 

正如你所看到的,我的大多數數據集是正確的格式,但我有那些單身份號碼的逗號也(我的數據是在窗體ID#,連接#)。我將如何去除那些單身份證號碼上的逗號?我似乎無法用文本編輯器弄清楚。有什麼建議麼?

編輯:我可以使用某種正則表達式來僅從具有指定長度的那些ID中移除它嗎?

編輯2:好的我想出了使用一些正則表達式,感謝所有的幫助!

+0

上的數 「長度」?你的意思是什麼?字符串長度?流浪的逗號造成了什麼樣的麻煩? – 2012-03-22 17:17:23

回答

0

在六人會做這樣的事情

:%s/,$// 

這意味着

(進入行模式命令)

(上試該命令每行)

小號(替補)

,$

(空替換文本)

有時候,你需要像/, *$/(在一行的末尾匹配逗號)匹配一個逗號,後跟0個或多個尾隨空格。你可以通過各種不同的方式在窗口上獲得vi;一種方法是install Cygwin.

0

您可以在Notepad++中選擇正則表達式模式,並使用以下正則表達式,$進行查找和替換。將替換字段留空。

0

隨着sed命令:

sed 's/, *//' < FILE 

或就地(需要GNU SED):

sed -ie 's/, *//' FILE