2015-06-29 70 views
0

我試圖用我所有的國家城市和州(在這裏稱爲departamentos)製作一個json文件。我從來沒有發現一個完整的清單,但現在我繼維基百科的用戶在這個環節上榜:使用RegEx獲取字符串的特定部分

https://es.wikipedia.org/wiki/Anexo:Municipios_de_Colombia

我已經複製並粘貼在文檔中的所有文本,使得一個新行每個城市像這樣:

亞科皮ES UNApoblaciónŸMUNICIPIO德爾阿雅去昆迪納馬卡

目前我能夠選擇使用正則表達式的城市,這樣的表達:

/.+?(?= ES)/

它需要一切從行開始到那裏會見「ES」的第一次,這是一個普通的慣例每個維基百科頁面中的行。

現在我想實現的是使用同一行正則表達式,也得到可以是最後或最後兩個單詞的狀態。我認爲可以通過選擇「de」之後的任何內容來達到。但我卡住了。

任何幫助將不勝感激,也許世界各地的其他人可以開始製作json文件出維基百科。

回答

1

這似乎適用於至少以A開頭的城市。我沒有測試所有這些。

/^(.*?) es.*de (.*)$/gm 

在這裏玩。 https://regex101.com/r/yJ3gK7/1(這個空格是從wiki上粘貼的,在這裏應該不是很重要。)

+0

這正是我需要的,像魅力一樣的作品。將實現它,輸出json並從中獲得主要內容。我希望這也適用於其他國家。謝謝你timoh! – marcovega

相關問題