2014-01-10 23 views
0

我想知道我怎麼能具體合併使用正則表達式中的記事本線++,有例外以字符開始線「>」合併線與正則表達式,與例外的某些行

,用於: enter image description here

我希望能夠連接2,3,4; 6,7,8;和10,11,12;但不是1,5或9.在記事本++中,我可以選擇要加入的行,並使用擴展查找/替換(查找:「\ r \ n」;替換:「」)加入選擇內的線。但是,我有超過11,626行需要加入忽略帶有「>」的行,所以手動這樣做不是一種選擇。

*注意:上圖顯示每個條目具有相同的行數,但情況並非總是如此。

編輯:請求了一些實際的代碼,最初沒有發佈,因爲「>」將文本格式化爲代碼塊。每個代碼snipplet前加入語錄所以 「>」 的現身:

> Boechera_canadensus AACGACTCTCGGCAACGGATATCTCGGCTCTCGCATCGATGAAGAACGTAGCGAAATGCGATACTTGGTG TGAATTGCAGAATCCCGTGAACCATCGAGTCTTTGAACGCAAGTTGCGCCCCAAGCCTTTCGGCCGAGGG CACGTCTGCCTGGGTGTCAC
> Carex_pellita AATATGACTCTCGGCAACGGATATCTCGGCTCTCGCATCGATGAAGAACGTAGCGAAATGCGATACGTGG TGTGAATTGCAGAATCCCGTGAACCATCGAGTCTTTGAACGCAAGTTGCGCCCGAGGGACCCTCCCGAGG GCACGCCTGCCTCATGGGCGTTAGAA
> Carex_lacustris AATATGACTCTCGGCAACGGATATC TCGGCTCTCGCATCGATGAAGAACGTAGCGAAATGCGATACGTGG TGTGAATTGCAGAATCCCGTGAACCATCGAGTCTTTGAACGCAAGTTGCGCCCGAGGGACCCTCCCGAGG GCACGCCTGCCTCATGGGCGTTAGAA

+0

請,給我們的樣品線,而不是一個圖像,然後我們就可以輕鬆地測試我們的複製/粘貼的解決方案。 – Toto

+0

問題是我複製/粘貼時無法顯示「>」,因爲它是用於區分代碼塊的相同字符。 – user1301593

+0

你可能實際上是用一個領先的\來逃避''',看到我對你的問題的編輯:) –

回答

1

這應該爲你工作:

enter image description here

工作示例:

(^[^>].*?)\n(?!>) 

,則與第一捕獲組$1替換http://regex101.com/r/yZ4nT0

解釋:

  • 我們符合所有線路無法啓動與>,使用非貪婪匹配每個字符.*?
  • 我們包裹在一個捕捉,但不包括\n(新線)
  • 使用負向預覽(?!>)我們確保我們只捕獲不在另一個之前的行>
+0

嗯,似乎不適合我的數據。我會用附加的鏈接工作示例來調整。感謝那! – user1301593

0

您可以使用此:

find: (?<=[ACTG])\r?\n(?=[ACTG]) 
replace: nothing