我想抓住字符串內的羅馬數字(80以下的數字就夠了)。我在How do you match only valid roman numerals with a regular expression?找到了很好的基礎。問題是:它處理整個字符串。我還沒有找到一個解決方案,如何檢測字符串內的羅馬數字,因爲沒有強制性的,每個組都可以是可選的。到目前爲止,我想是這樣的:如何捕捉字符串內的羅馬數字?
my $x = ' some text I-LXIII iv more ';
if ( $x =~ s/\b(
(
(XC|XL|L?X{0,3}) # first group 10-90
|
(IX|IV|V?I{0,3}) # second group 1-9
)+
)
\b/>$1</xgi) { # mark every occurrence
say $x;
}
__END__
><some>< ><text>< ><>I<><-><>LXIII<>< ><>iv<>< ><more><
desired output:
some text >I<->LXIII< >iv< more
所以,這一個自理捕獲單詞邊界太大,因爲所有的組是可選的。如何完成它?如何使這兩組中的一組成爲強制性的,而無法確定哪一組是強制性的?其他迎接羅馬人的方法也受到歡迎。
一般來說,說了''或'B'或'ab',但不是沒有,你可以做'(A | B | AB)'或' (ab?| b)',但是你不會避免重複。 –
問題:'a'或'b'本身由4個可選塊組成。涵蓋所有這些組合看起來非常瘋狂。 –
啊對了,我明白你的意思了。 Perl支持向前看嗎?你可以在比賽開始時(邊界之後)添加前瞻:'(?= [IVXLDCM])' –