所以最後(經過幾天的調試)我發現了一個問題。它根本不在正則表達式中:/。它接縫,我修剪ekstra空白與正則表達式無法識別「 n」?
intput= Regex.Replace(input, "\\s+", " ");
所以所有新的行被替換爲「」。笨!主持人,請刪除這個如果不需要!
我有正則表達式的標化一些文本,它看起來像這樣:
"(?<html>Ç)|
(?<number>\\d+(?:[.]\\d+)?(?=[][ \f\n\r\t\v!?.,():;\"'„Ç]|$))|
(?<other>(?:[^][Ç \f\n\r\t\v!?.,():;\"'„A-Za-zčćšđžČĆŠĐŽäöÖü][^ Ç\f\n\r\t\vA-Za-zčćšđžČĆŠĐŽäöÖü]*)?[^][ Ç\f\n\r\t\v!?.,():;\"'„A-Za-zčćšđžČĆŠĐŽäöÖü](?=[][!?.,():;\"'„]*(?:$|[ Ç\f\n\r\t\v])))|
(?<word>(?:[^][ Ç\f\n\r\t\v!?.,():;\"'„][^ Ç\f\n\r\t\v]*)?[^][ Ç\f\n\r\t\v!?.,():;\"'„])|
(?<punctuation>[][ \f\n\r\t\v!?.,():;\"'„])"
問題是這一部分:(?<punctuation>[][ \f\n\r\t\v!?.,():;\"'„])
。所以當我用輸入"\n\n"
來解析文本時,它是按照標點符號進行分組的:" "," "
- 換言之,空間和空間......我不知道爲什麼?
不是您的行級別的正則表達式,例如,在Perl中? – bertolami 2009-12-14 11:08:21
對不起......這不是很清楚......它將換行變成空格嗎?你想要它分組標點符號嗎?而當我在這個時候,你一直在寫什麼? – Kobi 2009-12-14 11:27:56
這是否也發生在RegexOptions.Multiline選項打開和關閉? – 2009-12-14 11:33:47