我認爲R對此會有好處......但我是一個完全的新手。我有一組英國郵政編碼(例如「CB2 8UR」)和一個將每個郵政編碼映射到OS網格座標的單獨表格。雙方開始爲CSV:如何繪製郵政編碼和他們的'質量中心'
file1:
"pcd"
"CB2 8UR"
"TE3 5LJ"
file2:
"pcd","col2","col3","oseast1m","osnrth1m","col6",...
...
"CB2 8UR","?","?",9823,2034,"?"
...
真正的文件1有一千個左右的項目,而真正的文件2有幾十萬(約20列)。這裏file2唯一的一點是將郵政編碼轉換爲UK OS網格座標。目前,我認爲我可以將這些座標視爲在二維平面上。
任務是獲取每個郵編的'質量中心'以及郵政編碼的熱圖表示的地圖。
我沒有使用qplot()+ stat_bin2d()管理來繪製file2的數據(即所有的英國郵政編碼)作爲二進制位:
m <- qplot(xlab="Longitude",ylab="Latitude",main="Postcode heatmap",geom="blank",x=pcd$oseast1m,y=pcd$osnrth1m,data=pcd) + stat_bin2d(bins =200,aes(fill = log1p(..count..)))
其中PCD是從file2的讀取data.frame。
所以:
如何合併文件1和文件只映射文件1中的代碼,但file2中使用COORDS?
如何計算併爲質心添加一個標記?
如果我想標記一些特殊的郵政編碼,所以他們的「質量」高於正常水平,那麼這很容易嗎?
非常感謝您的幫助。