我想要一個1.8mB的txt文件。之後有幾個標題行,所有的空間分隔數據。我可以使用熊貓來關閉數據。我想要處理的數據是:Python:大熊貓是否正確?
1)刪除非必要數據。即前1675行,大致我想刪除和最後的3-10行,每天都有所不同,我也想刪除。我可以刪除第一行,種類。這個想法現在的主要問題是確定1675指針位置在哪裏。使用類似
df = df[df.year > 1978]
只有當我嘗試
dataf = df[df.year > 1978]
它只是給我的東西我會於第一線純副本移動最初的「指針」,以1675。它仍然保持指向同一個1675起始點的指針。它不會讓我訪問任何第一排1675行,但他們顯然仍然存在。
df.year[0]
它返回錯誤提示行0不存在。我必須出去尋找第一個可讀行是什麼......而不是將行刪除並將新指針移動到0,它只是將指針移動到1675,並且不允許訪問低於那。我仍然沒有找到一種方法可以通過編程來確定最後一行的編號,通過shell很容易,但我需要通過該程序來完成,因此我可以設置點2的循環。
2)我希望能夠取得數據的平均值,'x'日移動平均值,並在計算了移動平均值後用新數據創建新列。我想我可以使用Series語句創建新的列......我想......我還沒有嘗試過,因爲我還沒有得到這個目標。
3)畢竟這和一些更多的數學,我希望能夠用自制圖形圖表數據。我認爲這應該很容易,一旦我完成了一切。我已經創建了示例圖形,並且一旦有數據處理,就可以繪製圖形上的點/線。
熊貓是該項目的正確庫,還是應該嘗試使用別的東西?到目前爲止,我做的研究越多...我越感到失落,因爲我一直努力的每一件事都讓我更加深入,但同時又讓我更加深入。在類似的東西中,當我想要在數據塊上進行數學運算時,看到了使用其他東西時所提及的內容。他們沒有任何跡象表明他使用了什麼。
這聽起來像大熊貓將真正幫助,但此刻我們不能幫助,因爲有太多的部分這個問題,並沒有如... –