所以我有一個5列的數據框,其中有9031個觀察值。列的每個記錄都是列中所有值的百分位數。查找5列數據幀的最高閾值以獲得n條記錄
我的目標是找到適用於所有五列的最高百分比閾值以獲得n條記錄。
例如,假設我的目標是將數據框中的記錄數減少到1000條記錄,爲了獲得1000條記錄,我需要應用於所有5列的最高閾值是多少?
Variance_Five_Metrics$Zips medium medium.1 medium.2 medium.3 medium.4
1 00501 0.8395527 0.8671243 0.9894807 0.6567379 0.45875318
2 00544 0.8075518 0.8687853 0.9883734 0.6345920 0.45100210
3 01432 0.6124460 0.2460414 0.9701030 0.9103089 0.17107740
4 01434 0.7869560 0.3000775 0.9268077 0.8760935 0.11859152
5 01450 0.6642675 0.2451556 0.9919167 0.9585871 0.09600266
因此,讓我們說上述如果我的數據幀的前五個記錄(的9031記錄)。如果我想將我的df縮小到1000條記錄,那麼我需要將所有5列的截斷點應用於所有5列,以便精確地獲得1000條記錄,其中所有5列的值都低於此截止點?
我可能沒有解釋這是很好的,但我會很感激的任何指導
感謝
對此深感抱歉,我編輯我的問題,其中包括前五個記錄我的數據幀的。 – mangodreamz
謝謝,現在看起來好多了。 – akrun
您的意思是所有5列的截止點必須相同,或者每個柱子的截止值是相同的? –