我試圖用我所有的國家城市和州(在這裏稱爲departamentos)製作一個json文件。我從來沒有發現一個完整的清單,但現在我繼維基百科的用戶在這個環節上榜:使用RegEx獲取字符串的特定部分
https://es.wikipedia.org/wiki/Anexo:Municipios_de_Colombia
我已經複製並粘貼在文檔中的所有文本,使得一個新行每個城市像這樣:
亞科皮ES UNApoblaciónŸMUNICIPIO德爾阿雅去昆迪納馬卡
目前我能夠選擇使用正則表達式的城市,這樣的表達:
個/.+?(?= ES)/
它需要一切從行開始到那裏會見「ES」的第一次,這是一個普通的慣例每個維基百科頁面中的行。
現在我想實現的是使用同一行正則表達式,也得到可以是最後或最後兩個單詞的狀態。我認爲可以通過選擇「de」之後的任何內容來達到。但我卡住了。
任何幫助將不勝感激,也許世界各地的其他人可以開始製作json文件出維基百科。
這正是我需要的,像魅力一樣的作品。將實現它,輸出json並從中獲得主要內容。我希望這也適用於其他國家。謝謝你timoh! – marcovega