我試圖分裂一個字符串可能看起來像這樣的:正則表達式分割字符串在特定字紋
International Bank for Reconstruction & Development (NAICS: 928120; SIC: 6081) World Bank (NAICS: 928120; SIC: 6081)
這個
International Bank for Reconstruction & Development World Bank
或任何這樣的:
International Bank for Reconstruction & Development International Bank for Reconstruction & Development (SIC: 6081) International Bank for Reconstruction & Development (NAICS: 928120)
分成這個
International Bank for Reconstruction & Development
可能有任何數量的匹配。
我已經嘗試了幾件事情,用反面的人物類不起作用:
[^\(NAICS: (\d+);\)]+
我使用C#正則表達式。
什麼是你想給它*分割成*?你希望每個例子有什麼結果? – ruakh 2012-03-28 22:32:52
每個「名字」進入它自己的比賽。所以國際復興開發銀行(NAICS:928120; SIC:6081)世界銀行(NAICS:928120; SIC:6081)匹配這組比賽{國際復興開發銀行,世界銀行} – 2012-03-28 22:45:05
一個字符類不)匹配*單個字符*,而不是*字符序列*。這個'[^ \(NAICS:(\ d +); \)] +'與這個[[^()+:; ACINS \ d] +' – Tomalak 2012-03-28 22:45:46