我一直在閱讀,搜索和試用不同的方式來寫正則表達式,如p {L},[az]和\ w但我似乎無法得到結果我在之後。正則表達式的單詞連接字符和下劃線同時保持標點符號
問題
我做了充分的句子,標點符號,這我通過陣列使用以下pre_match,它在保持詞和標點符號行之有效解析的數組。
preg_match_all('/(\w+|[.;?!,:])/', $match, $matches)
不過,我現在有這樣的話:
- 字另一個字
- more_words_like_these
,我希望能夠保持完整性(連接)這些詞,但我目前的preg_match將它們分解成單獨的單詞。
我試過
preg_match_all('/(p{L}-p{L}+|[.;?!,:])/', $match, $matches)
和;
preg_match_all('/((?i)^[\p{L}0-9_-]+|[.;?!,:])/', $match, $matches)
,我從here
發現,但不能得到實現這一理想的結果:
Array ([0] A, [1] word, [2] like_this, [3] connected, [4] ; ,[5] with-relevant-punctuation)
理想我想能也佔了特殊字符作爲其中的一些話可能有口音
你試過'[\ W上。 ;,:?!] +'? – ClasG
它輸入'一個like_this連接;與相關標點符號「或」一個詞like_this連接;與相關標點符號(注意';'之前的空格)? –
......或甚至'\ S'可以做到這一點 - 'preg_match_all('/(\ S +)/',$ match,$ matches)' – ClasG