2011-06-28 56 views
0

我正在尋找提取維基百科文章的位置信息。 如果文章使用coord模板,它顯示爲名稱爲Coord或coord的模板標籤,這相當簡單。但是,較舊的文章可能會使用不同的語法,通過這些語法,他們可以將座標放入信息框而不使用座標模板。很容易提取座標,但更難以獲取位置的上下文。從Wikipedia XML轉儲提取座標+ Zoomlevel

一些文章簡化了細分參數,其中一些具有coordinate_type參數,但到目前爲止我還沒有找到確定相應地圖的縮放級別的好方法。

任何人都可以幫忙嗎?

+0

回答我的問題:有沒有簡單的方法。 – nambrot

回答

1

所以我的解決方案如下:

首先檢查座標模板。這是最可靠的。請注意,您只應檢查具有display:title的模板。

如果找不到Coord模板,則應使用舊的latd Lat_d lat_degrees參數。

對於縮放級別,請嘗試查找Coord模板中的類型或可包含尺寸,比例和類型以及填充的coordinates_type參數。

如果不是,則需要解析來自其他來源的zoomLevel。 我做了人口和麪積參數,檢查infoboxes。