我想將句子拆分爲單詞和特殊字符。我使用正則表達式如下:獲取包括連字符在內的各種令牌的正則表達式
@"((\b[^\s]+\b)((?<=\.\w).)?)
但它只返回的話,而不是特殊字符,例如空格分隔的連字符或冒號。
理想的情況下,對於句子: 「眼下」
她大聲喊道,雙手在空氣中飄動 - 在幾聲歡呼聲中 - 大約兩分鐘時間裏 。
我應該得到:
Right now she shouted and hands fluttered in the air - amid a few cheers - for about two minutes
'!'在哪裏? –
不僅僅是單個的令牌,也不是直接與單詞相關的字符。 – aceBox