我正在使用VB .NET編寫一個程序,該文件將從sup文本文件中獲取單詞並計算每個單詞出現的次數。我正在使用這個正則表達式: -.NET正則表達式在文本中查找實際文字
parser As New Regex("\w+")
它給了我幾乎100%正確的單詞。除了當我有像
「Ms Word的應用程序文件名是word.exe」。或者「這是一個C#語句If(a> b?1,0)?」
在這種情況下,我得到[單詞& exe]和[如果a,b,1和0]爲單獨的單詞。這將是很好的(我的目的),我收到word.exe和(如果(a> b?1,0)作爲單詞
我猜\ w +尋找空白,句子終止標點符號和其他標點符號標記以確定一個單詞
我想要一個類似的正則表達式,如果標點符號不是單詞的結尾,那麼它不會打破標點符號的單詞,我認爲單詞的結尾可以由一個尾隨的WhiteSpace,句子終止標點符號(你可能會想到其他人),如果你可以給VB.NET建議一些正則表達式9),這將是很大的幫助。
謝謝。
剛剛閱讀和發揮 – kenny 2010-04-19 19:54:32