我正在編寫一個代碼來對數據進行分類,並獲得平均值和標準偏差。這裏是我的數據的例子。對數據進行分類,計算每個類別的平均值和標準差
3917 1 -0.662261 25.148 22.9354 68.8076
3918 1 12.7649 18.7451 7.68473 69.0063
3919 1 -9.56836 -23.3265 -61.953 68.8357
3920 1 11.6292 31.6525 -29.3697 69.1372
3921 2 26.4837 -66.7897 12.0257 69.2282
3922 1 -9.81652 14.3788 9.38343 69.1217
3923 2 39.931 -88.1879 109.498 69.1604
3924 1 4.5502 3.53887 -6.59604 69.486
3925 2 13.6801 -24.6628 -5.7568 69.9398
3926 1 -10.5635 7.05517 -8.82785 70.2263
正如你所看到的,有6列。我正在考慮三步計算。
根據第6列對這些數字進行分類。第6列由0〜n的浮點數組成。我希望生成n個部分(或子矩陣,或其他),如0〜1,1〜2,2〜3 .... n-1〜n。最後一個數字應該是最後一個數據的數字,因爲我希望能夠創建部分。例如,如果最後一個數字是121.2513,最後一部分應該是120〜121以包含該數據。
將列1〜5的所有其他數字重新分配給基於第6列的相應子部分。如果在特定部分中沒有編號,則將其打印爲0.將會有n個小節。每個小節中的元素數量將是隨機的。
得到每個子段的第3,第4和第5列的平均值和標準偏差,並將輸入文件寫入輸入文件中,第'小節中的元素數,小節的開始數以及第3小節的平均值和標準差,第4列和第5列'
我正在嘗試使用多個for循環,但它變得太複雜,並且會出錯。有沒有其他簡單的方法來分類數據,與每個子部分一起玩,並用Python打印出來?另外,我的for循環根本不起作用。任何簡單的示例建議使用這些數據?
請編輯您的文章以包括您的* for循環根本不工作* ...部分 –
您是否在使用[numpy](http://www.numpy.org)?如果不是,你有沒有理由不能?它使得這種代碼變得簡單很多(與scipy和/或pandas一起),並避免了所有顯式循環,使得你無法正確使用。 – abarnert
你可以發佈你迄今爲止寫的代碼嗎? – scohe001