我正在尋找提取維基百科文章的位置信息。 如果文章使用coord模板,它顯示爲名稱爲Coord或coord的模板標籤,這相當簡單。但是,較舊的文章可能會使用不同的語法,通過這些語法,他們可以將座標放入信息框而不使用座標模板。很容易提取座標,但更難以獲取位置的上下文。從Wikipedia XML轉儲提取座標+ Zoomlevel
一些文章簡化了細分參數,其中一些具有coordinate_type參數,但到目前爲止我還沒有找到確定相應地圖的縮放級別的好方法。
任何人都可以幫忙嗎?
我正在尋找提取維基百科文章的位置信息。 如果文章使用coord模板,它顯示爲名稱爲Coord或coord的模板標籤,這相當簡單。但是,較舊的文章可能會使用不同的語法,通過這些語法,他們可以將座標放入信息框而不使用座標模板。很容易提取座標,但更難以獲取位置的上下文。從Wikipedia XML轉儲提取座標+ Zoomlevel
一些文章簡化了細分參數,其中一些具有coordinate_type參數,但到目前爲止我還沒有找到確定相應地圖的縮放級別的好方法。
任何人都可以幫忙嗎?
所以我的解決方案如下:
首先檢查座標模板。這是最可靠的。請注意,您只應檢查具有display:title的模板。
如果找不到Coord模板,則應使用舊的latd Lat_d lat_degrees參數。
對於縮放級別,請嘗試查找Coord模板中的類型或可包含尺寸,比例和類型以及填充的coordinates_type參數。
如果不是,則需要解析來自其他來源的zoomLevel。 我做了人口和麪積參數,檢查infoboxes。
當第一次詢問這個問題時,不確定維基百科API是否存在。但是,目前您可以查詢維基百科的API文章的座標。例如:
不確定地圖縮放級別,但...
回答我的問題:有沒有簡單的方法。 – nambrot