我有一個正則表達式([[email protected]\/,':\w]*[\w])*
它匹配文本中的所有單詞(包括像IBM這樣間斷的單詞),但是我想讓它排除下劃線,我似乎無法弄清楚如何去做。 。我嘗試添加^[_]
(例如(^[_][[email protected]\/,':\w]*[\w])*
),但它只是將所有單詞分解爲字母。我想保留匹配的單詞,但我不想在單詞中包含下劃線,也不希望單詞完全由下劃線組成。正則表達式忽略下劃線
什麼是正確的方法來做到這一點?
P.S.
- 我的應用程序是用C#編寫的(如果這有什麼區別)。
- 我無法使用A-Za-z0-9,因爲無論語言(可能是中文,俄文,日文,德文,英文),我必須匹配單詞。
更新
這裏有一個例子: 「I.B.M應該被解析爲一個字w_o_r_d俄羅斯應太:мплексисторическихсобытий。」
的比賽應該是:
I.B.M.
should
be
parsed
as
one
word
Russian
should
work
too
мплекс
исторических
событий
注意w_o_r_d
不應該得到匹配。
'^ [_]'應該是[[^ _]'。前者將在字符串的開頭匹配'_'(或者如果多行)。 – climbage 2011-03-30 23:56:58
@climbage,肯定有助於忽略下劃線,但這些單詞中的下劃線仍然存在。 – Kiril 2011-03-31 00:07:10