2017-07-10 49 views
-1

我有一個字符串,如正則表達式 - 如何有muliple underscoes字符串

Cantos1#1_Q17070600080_TCR_GD_NORMAL_CONTROL_GD+_06072017173426.pdf 

我正則表達式是

^Cantos1#\d+_([Q0-9]+)_([A-Z_0-9]+).*\.pdf 

我需要捕捉 Q17070600080和 TCR_GD。 代替TCR_GD,它可以是任何東西,例如TCR_GD或MEMB等等。 這可能嗎?

+0

'_NORMAL_'會一直在嗎? – anubhava

回答

0

如果您建議使用下劃線作爲分隔符,並且還強調分隔值,那麼不會這樣做,因爲正如您所說的「代替TCR_GD,它可以是任何東西」。正則表達式(或者就此而言,人類正在閱讀您的字符串)無法事先了解所有可能的分隔值,因此無法區分這兩種情況。