我最近掀起了一個script從Twitter的流媒體API捕獲大量geo data。我正在尋找一些方法來創建一個模型來表示世界上任何給定經緯度點的地理「活動」,並將這些數據用作訓練輸入。地理數據的曲線擬合
我正在考慮將所有lat \ lng的四捨五入取整到小數點後兩位,並創建一個所有位置出現的2-d直方圖。因此,用於訓練我的模型的輸入是:
x = lat - input
y = lng - input
z = location weight - observed output [normalized between 0.0 and 1.0]
我想創建24種型號(1每小時)的事實,社交網絡活動是依賴於一天中的時間進行建模。這也將簡化爲3-d而不是4-d。
問題:
- 什麼是曲線擬合上述問題的最好方法是什麼?
- 是否有一個現有的庫,我可以使用輸入x,y,z並吐出一個最佳擬合 迴歸方程?我熟悉Ruby,Python,Java或Scala。 示例代碼將不勝感激。
我很困惑。你的自變量是什麼? – Gian 2013-05-07 04:50:59
您提出的許多方面都與[Twitter中的事件檢測]有關(http://scholar.google.com/scholar?hl=zh-CN&q=event+detection+in+twitter&btnG=&as_sdt=1%2C44&as_sdtp=)(請參閱Google學術搜索);我敢打賭,你將最終建立世界人口密度的模型(見[你在哪裏你](圖1)(http://infolab.cse.tamu.edu/static/papers/cikm1184c-cheng.pdf )),所以再次,您可能想要查看事件檢測或其他用途來做一些更有趣的事情。 (P.S.,我最近做了一些Twitter [位置相關的工作](https://github.com/bwbaugh/inferhotspot)) – 2013-05-07 04:59:15
@Gian'lat'和'lng'是產生'重量'的獨立變量。 f(lat,lng)=重量 – PhilYoussef 2013-05-07 05:37:55