2014-04-04 57 views
1

我有一個文本,我需要得到的地板數字或文本。該文本可以格式化爲2種方式:正則表達式來獲取文本的特定部分

(道路名稱)(路號),(樓層)。 (側面)

Roadname 36, 4. tv. 

Roadname 36, st. tv. 

所不同的是在地板可以被研磨級或數字。

我使用Xpath來抓取網站地址,並且只需要一個正則表達式模式就可以獲得樓層數字/文本。

**編輯

\S*(?=\.) 

似乎做它

+0

你的正則表達式失敗的地方在哪裏? – Robin

+3

請注意,如果用空格分隔字符串,答案總是第三個結果。 –

+0

我也想說,沒有真正需要RegEx。 – tenub

回答

1

一個可能的方法就是採用這種模式:

/,\s*(\S*)/ 

...那將捕捉非空白的任何序列符號後面的逗號。

Demo

的另一種方法(如果這是要被處理的唯一的文本)被捕獲的點前面的符號的第一序列:

/\S*(?=\.)/ 

在這種情況下使用的捕獲組不是必需的,但是該正則表達式的風味應該支持lookaheads AND roadname不應該包含點。

最後,你可以用空格分隔你的字符串,並把結果數組的第三個元素 - 但如果道路名中有空白的話就會失敗。

+0

\ S *(?= \。)它似乎在伎倆,謝謝你 – Helmer

相關問題