2016-08-03 131 views
1

我最近開始使用一個巨大的數據集,提供醫療急救 服務。我有cca 25.000空間點的事件。點模式相似性和比較

我在尋找書籍和互聯網已經有相當長的一段時間了,對於如何去做以及如何去做,我越來越感到困惑。

當然,這些觀點非常集中。我爲它計算了K,L和G函數 ,他們確認了嚴重的聚類。

我也有人口點數據集 - 每個公民都有一個點,它與事件數據集(發生在人身上的事件類似,因此這兩個數據集之間有強大的關聯)聚類在一起。

我想比較這兩個數據集來弄清楚,如果他們是類似的 分佈式。我想知道,如果有地方,那裏有更多 事件,與人口相比。換句話說,我想用人口數據集來解釋強度,然後確定事件數據集是否與該強度相對應。假設是,事件應隨機地出現在人口中。

我想獲得一個地區的情節,如果事件是隨機發生在人們身上的事件多於或少於預期的事件,

你會如何處理R?

我應該用Kest還是Kinhom來計算K函數? 我看了描述,但仍不明白它們之間的基本區別 。

我試過使用Kcross,但正如我所知,使用的兩個數據集之一 應該是CSR - 完全空間隨機。 我還發現Kcross.inhom,我應該使用那一個用於我的數據?

如何獲得有關人口事件偏差的情節(圖片)?

我希望我問清楚。

非常感謝您抽出寶貴時間閱讀我的問題和 如果您能回答我的任何問題,更要感謝您。

此致敬禮!

耶爾內伊

回答

2

我沒有時間來回答充滿了你的問題,但這裏有一些指針。免責聲明:我是spatstat包和Spatial Point Patterns: Methodology and Applications with R的書的合着者,所以我傾向於使用這些(我真的相信這些是你的問題的最佳工具)。

概念性問題:您的學習區域有多大?將點數分佈在區域內的任何地方,還是限於路網?是否有意義?

現在我會假設我們可以假設他們分佈在任何地方。

一個簡單的方法是使用density.ppp來估計人口密度,然後使用ppm將人口密度作爲強度的事件擬合泊松模型。這可能是一個合理的空模型,如果這符合數據,那麼基本上可以說,事件發生時「在控制不均勻的人口密度時,在空間中是完全隨機的」。更多信息density.pppppm分別在1的章節6和9中,當然還有spatstat幫助文件。

如果使用K/L/G/F/J-函數等彙總統計信息,則應始終使用inhom版本考慮人口密度。這包括在1的第7章中。

另外,如果將所有點與具有兩種類型(背景和事件)的標記點模式相結合,可能會發現相對風險(relrisk)。請參閱1的第14章。

不幸的是,只有1的章節3,7和9可免費下載樣章,但我希望您可以在您的圖書館訪問它,或者可以購買它。

+0

謝謝你的回答,它幫助了我很多:)我應該使用kppm而不是ppm嗎? – JerT

+1

如果你用'ppm'擬合一個非均勻泊松模型,並確定數據點比那個模型解釋的聚類更多,那麼你確實可以使用'kppm'(或者添加'interaction = AreaInter(R)',其中'R'是一些交互範圍 - 見本書第13章)。 –

+0

我很抱歉打擾你,但我有關於ppm的其他問題。我計算了我的人口密度,但在讀完spatstat幫助後,我不知道如何使用計算出來的密度。如果我使用它作爲協變量並且擬合事件ppp,則繪圖函數返回那裏沒有任何繪圖 - 平坦的表面。 這是好的:fit = ppm(inc_ppp,〜dens_pop) – JerT