我想對列中的數據進行迭代排序以提取N個最大值。R - 對列中的最大值進行排序和子設置
我的數據是建立在第一和第二列中,包含職業職稱和代碼,其餘所有列包含比較值(在這種情況下,必須事先計算每個城市的位置商數)對於各個城市的職業:
*occ_code city1 ... city300*
occ1 5 ... 7
occ2 20 ... 22
. . . .
. . . .
occ800 20 ... 25
對於每一個城市,我想最大的值進行排序,選擇由他們各自的職業頭銜和稱號相匹配的最大值的一個子集。我認爲這將是相對平凡的,但...
編輯澄清:我想結束與分類的數據子集進行分析。
occ_code city1
occ200 10
occ90 8
occ20 2
occ95 1.5
同時我希望能夠重複列明智的(所以我試過很多的順序排序命令通過直接調用列:數據[,2];只是爲了能夠運行在整個數據集相同的分析功能。
我一直在plyr搞亂在過去的3天,我覺得我的數據集的設置是不利於PLYER是如何打算使用。
你能澄清一下這個問題嗎?這將有助於給我們一個例子,以較小的數據框爲輸入,並提供一個您想要提取的輸出示例。 – chrisamiller 2010-07-23 06:57:13
是的,這很難找出你想要的東西。 – John 2010-07-23 07:13:52
首先,我想獲得一個包含兩列數據的子集:列「city1」的10個最大值列表,與它們各自的「occ_codes」(來自第一列)相匹配。 這將是一個簡單的排序說excel,只有我需要重複操作300次* 10年的數據。 – AzadA 2010-07-23 07:55:15