我正在生成〜300k個數據點的散點圖,並且存在問題,因爲它在某些地方過於擁擠,導致沒有結構可見 - 所以我有一個想法!繪製散點圖最密集區域的輪廓
我想讓該圖爲最密集的部分生成一個等值線圖,並使用scatter()
數據點留下密度較小的區域。
所以我試圖單獨計算每個數據點的最近鄰距離,然後當這個距離達到一個特定的值時,繪製一個輪廓並填充它,然後當它達到一個更大的值時)只是做分散...
我一直在嘗試和失敗了幾天,我不知道傳統的等高線圖將在這種情況下工作。
我會提供代碼,但它很雜亂,可能會混淆這個問題。它的計算密集程度如此之高,它可能會讓我的電腦死機!
謝謝大家提前!
p.s.我一直在尋找和尋找答案!我相信它甚至不可能實現所有結果!
編輯:所以這個想法是看看哪些特定點位於300k樣本的結構中。這是一個示例圖,我的觀點分散在三個差異中。顏色。
我將嘗試從我的數據中隨機採樣1000個數據點並將其上傳爲文本文件。 乾杯堆垛機。 :)
編輯:嘿, 這裏有一些示例數據1000行 - 只有兩列[X,Y]
(或[g-i,i]
從上圖)空間分隔。謝謝你們! the data
根據如何擁擠這些值是,你很可能通過只是做'散射(X,Y,α-= 0.1)'或一些合適的小值逗一些結構出來。要做你的建議,我會建立一個核心密度估計(見'scipy.stats.kde')。 – chthonicdaemon
爲什麼不使用二維直方圖來顯示數據? –
@FriskyGrub您可以提供與您的實際數據具有相同類型/形狀/等的隨機數據 - 您並不總是需要首先發布生成真實數據的複雜步驟。使我們更容易提供對您有用的答案。 – YXD