我只對正則表達式有一些基本的瞭解。我的意圖是捕捉word文檔中的每一個單詞,爲此我設計了這個正則表達式。我的單詞文件由數字寫成像Rs.1,00,000/- 還包含像57.58寫的小數。它還將包含對由F.No.245/12-445/235編寫的文件的引用,而不以空格分隔。正則表達式來清除由空格分隔的文本文件中的所有單詞
這幾乎是成功的,下面的正則表達式
(Rs\.)?((\d{1,2}[\,])?)+(\d{3}\/\-)|([']?[\(]?[A-Za-z0-9][']?[-]?[?]?[!]?[:]?[-]?[.]?[/]?[\.]?[\(]?[\)]?[\(]?[\)]?[\/]?)+
爲了從Word文檔捕獲我剪的話,並粘貼到一個文本文件,這是受然後通過C#程序讀取。我的問題是,我從來不希望出現在詞尾的句點或點。如果結尾的詞後面跟着感嘆號或問號,這一切都可以。當我測試它時,它從文本文件中捕獲了13150個單詞,而單詞文檔顯示有13158個單詞。
不用你什麼,只是匹配非空白字符,如'\ S +'正則表達式? – sp00m
哦。非常感謝你。我調整了你的回覆。我剛剛嘗試過([A-z0-9,。/ - : - ;?] +),並發現它非常好。我將在後面更詳細地檢查它,因爲我現在身體很不舒服。 – Unnikrishnan
哦。非常感謝你。我調整了你的回覆。我剛剛嘗試過([']?[A-z0-9,。/ - : - ;?'] +),並發現它非常好。我將在後面更詳細地檢查它,因爲我現在身體很不舒服。 Unnikrishnan – Unnikrishnan