使用下面的字符串在python可選括號中的正則表達式
1 - GENERAL 1
1.1 RELATED DOCUMENTS 1
1.2 SUMMARY 1
1.3 DEFINITIONS 1
1.4 INFORMATIONAL SUBMITTALS 2
1.5 GENERAL COORDINATION PROCEDURES 2
1.6 COORDINATION DRAWINGS 3
1.7 REQUESTS FOR INFORMATION (RFIs) 4
1.8 PROJECT MEETINGS 6
我試圖創建一個REGIT表達把3組的部分,標題和頁碼。到目前爲止,我有
(\d)(\.|\d|\s|-)+\s+([^a-z]+?)\s+\d
它可以處理除(RFIs)以外的所有情況。我怎樣才能抓住這個呢? 注:有時字符串可能包含我不想要的小寫字母小節。這就是爲什麼[^ a-z]存在。此外,RFI可能並不總是括號中的文字。
更新:
END OF SECTION
Project No. 151219.00 012500 - 1 of 3 Substitution Procedures
Rev. 0, 07/23/15
Issued for Construction
顯示使其變得複雜的其他字符串(子部分,RFI)等的一些示例)。 –
看起來像一個更簡單的「數字,其次是任何東西,後面是數字」是你真正需要的。 –
's \ * [1-9 \。] * \ s * [AZ] az [(\)\ - \ s] + [AZ^az \(\)\ - ] \ s * [0-9] *' – CaffeineAddiction