我目前正在爲基於正則表達式匹配C#人類的語言很簡單的詞彙analiser,和我目前所面臨specifing一個正則表達式的問題可以匹配目標語言中的每個可能的標點符號,而另一個可以匹配每種空格的符號。在Stack Overflow和另一個站點搜索這裏之後,我發現我可以分別使用正則表達式\p{P}
作爲標點,使用\p{Z}
作爲空格,並且在從文本文件中讀取時它可以工作。問題是,在最終的程序中,需要從SQL數據庫中讀取記錄並使用這個詞法分析器處理它們,我不知道數據庫中記錄的編碼是什麼。這在這種情況下會成爲問題嗎?提到的正則表達式能夠匹配輸入的每個標點符號和空白字符,而不管它們的編碼是什麼?
非常感謝。
你使用的是什麼數據庫? – Amirshk 2010-11-20 18:40:01
SQL Server 2008. – Miguel 2010-11-20 19:24:43