我想從csv文件讀入熊貓數據框。然後我想對這個數據幀做一些操作。我想在不同的功能(理想情況下在一個單獨的文件中)做到這一點。如何在功能之間解析熊貓數據框
import pandas as pd
def read_text(file):
df = pd.read_csv(file,skipinitialspace=True, sep=";", encoding = "ISO-8859-1")
return [df]
file = "/path/file.txt"
content = pd.DataFrame()
content = read_text(file)
現在,文件的閱讀工作正常。但「內容」似乎不再是一個數據框。至少,如果我嘗試像例如print (content.value)
似乎沒有這個選項。 我以後想要做的是:
- 發送數據幀的功能,以消除重複和返回數據幀
- 利用這一新的數據幀,並刪除某些條目並再次返回該數據幀
- 做更多的事情數據幀
理想情況下,這些函數將在一個單獨的文件中。但我會在稍後處理這件事。現在,如果我能夠來回解析這些數據幀,這將非常有幫助。
通用警告:'file'是一個Python關鍵字,_not reserved_,所以使用它作爲一個變量名,尤其是在文件範圍內,是有可能的原因問題下來像使用' file_name'或者其他的東西。 –
是的,這是首先想到的,當試圖創建一個例子 - 沒有考慮副作用。 – SLglider