這是我目前使用的正則表達式:[^\s][\.,\?!:][\w]
。 我需要檢查每個標點後面是否有空格,例如[.,!:?]
。 但我有一個問題,文件的,我籤的類型是*.sgm
,所以那裏有一定的標記,是這樣的:C#.NET正則表達式在標點符號後尋找空格
<at.cit><at.cit>> </at.cit> <case.cit><lit> </lit></case.cit>
例如:
<ptext>Text.Text<at.cit>Text</at.cit></ptext>
所以我需要只匹配"t.T"
,因爲我們在這段時間後需要一個空格。但我的正則表達式會發現"t.T"
和"t.c"
和"t.c"
。我如何消除這些標籤?
感謝您的幫助。
這看起來非常類似於(X)HTML,這意味着正則表達式不是一個好的解決方案。 – 2012-07-27 03:26:07
你解析XML還是HTML?如果是這樣,那就已經有解析器了。另外,不要使用HTML的正則表達式。 – 2012-07-27 03:26:35
你會讓人生氣 - 詢問如何用正則表達式解析HTML,XHTML或XML – 2012-07-27 03:32:59