我正在尋找一種方法將數據幀拆分成相同大小(基本上每個組中的行數基本相同)的組,其組的平均數幾乎相等。將數據拆分成等義的組
User Data
1 5.0
2 4.5
3 3.5
4 6.0
5 7.0
6 6.5
7 5.5
8 6.2
9 5.7
10 5.9
這非常類似於this request然而,這僅將數據分成2組。
我的實際數據集包含75-150行的任何地方,我需要將它分成5-10組相同均值和相當大小的組。
我在Google上研究過Stack Exchange在過去的幾天裏,我只是沒有太多的運氣。任何指導都會很棒。
在此先感謝!
更多細節:
也許我需要提供一些更多的細節,下面我已經包含了真正的數據集。我們是一家運輸公司,這個數據集有Driver ID,Miles,Gallons提供。我一直在做的是將數據讀入R,添加和MPG列,像這樣:
data <- read.csv('filename')
data$MPG <- data$Miles/data$Gallons
然後我嘗試以下兩個提供答案。阿倫的想法給了我幾乎相同的團體規模(每組9名成員,10組),但平均數的變化很大,從6.615 - 7.093,這對我來說是一個變化太大的開始。托馬斯的想法變得稍微有些緊張,但團隊規模與6-13名成員不同。
我們要做的是改善車隊MPG,並且我們將以團隊爲基礎的比賽來完成這個任務,所以我需要隨機地將車隊隨同他們一起從相同的團隊MPG開始。
也許這有助於並可以引導我們走向正確的方向?我試圖用我的編程語言來做這件事,但它每次都會鎖定計算機,所以我認爲R可能能夠更好地處理數據。
再次感謝!
我認爲這與[**分區問題**](http://en.wikipedia.org/wiki/Partition_problem)有關,以防您感興趣。 – Arun
感謝您的回覆,您向我提供了一個可用於我生成的數據集的解決方案。 – dcmoody