2016-12-05 24 views
0

我試圖建立一個基於距離混合城市郊區環境中其他特徵的地理空間特徵的預測模型,例如,辦公大樓位於基於距離最近的道路,屋苑和購物區。我有一組特徵位置,但這些區塊在某些區域並不是均勻分散在一些區域,它們非常稀疏而其他區域非常密集。使用決策樹來預測某個地點是否存在學校,我需要一個正面和反面案例的訓練集。我應該如何創建這樣的案例樣本?地理空間機器學習的人口抽樣

回答

1

你會需要以下格式的數據:

nearestRoadhousingEstateshoppingDistrict,...,schoolPresent

nearestRoad將是一個realNumberhousingEstateshoppingDistrict將二元變量(我猜)。你看看谷歌地圖嗎?他們是否提供了一個API來讓你查詢特定的(經緯度)座標?如果他們這樣做,那麼您可以生成如下的數據集:

假設學校存在座標(x,y)。然後做一個半徑爲5英里的gridsearch以獲得每個特徵的精確值。因此,例如,您可能會在座標(x+1, y+2)處找到一個購物區,因此該特性將等於1。

這可能很乏味,但如果這樣的API存在,那絕對有可能。