2013-01-08 82 views
1

我有這種格式的文本文件:正則表達式多符

('1', '2', '3', '4', '5'); 
('a', 'b', 'c', 'd', 'e'); 

等等

我從每個想行第三,並在''

我的文字的第四個條目文件有125k行,所以它是很大的。

謝謝

+0

那你想用它做什麼?替換後該線應該是什麼樣子? –

+0

在最好的情況下,行應該像上面的例子那樣: 3:4 c:d – user1114653

+1

這看起來像一個AWK問題。 http://gnuwin32.sourceforge.net/packages/gawk.htm < - AWK實用程序,由gnome。那麼它應該是'gawk「{FS = \」','\「; printf(\」%s:%s \「,$ 3,$ 4);}」your_input_file' – FrankieTheKneeMan

回答

2
^.*?,.*?,(.*?),(.*?),.* 

將讓你的第三和第四場在\ 1 \ 2(假設沒有逗號引號之間會出現,你想不被視爲分隔符,或類似的東西)。

當你的榜樣來看,隨着\1,\2更換,最終的結果是:

'3', '4' 
'c', 'd' 
+0

非常感謝youuu我現在明白了但我有第二個問題,我的所有線路都以blabla開頭。我可以突出顯示或找到任何不以blabla開頭的行嗎? – user1114653

+0

你可以用空白行替換'^ blabla。*',這樣可以消除你不想找到的東西。要明確地找到任何不以「blabla」開頭的內容,我相信你需要一個前瞻,我不認爲Notepad ++支持。 – femtoRgon