2014-01-20 42 views
0

該數據是財務數據,列中爲OHLC值。熊貓:對於確定概率的最小X

   Open  High  Low  Close 
Date           
2013-10-20 1.36825 1.38315 1.36502 1.38029 
2013-10-27 1.38072 1.38167 1.34793 1.34858 
2013-11-03 1.34874 1.35466 1.32941 1.33664 
2013-11-10 1.33549 1.35045 1.33439 1.34950 
.... 

我正在尋找的答案以下問題:

什麼是最小的數字X爲其中(至少)N%的大型數據集的數字爲等於或大於大X

對於我們使用高列的N = 60的數據,問題將是:對於哪些(至少)60列的高列項等於或大於X,最小數X是多少?

我知道如何計算標準偏差,平均值和其餘的大熊貓,但我的統計理解是相當差,讓我繼續下去。如果你知道的話,也請指出我的論文/教程。

謝謝。

+2

聽起來像您正在尋找[分位數](http://pandas.pydata.org/pandas-docs /dev/generated/pandas.DataFrame.quantile.html) – haki

+0

謝謝,我想這就是我正在尋找的!我不明白爲什麼這個問題被否決了。 – schiorean

回答

0

爲了完整起見,即使問題已在上述@haki的評論中基本解決,假設您的數據位於DataFrame data中。如果您正在尋找25%的觀測到的高價格的較高價格,您可以使用

data['High'].quantile(q=0.25)