2016-12-02 69 views
1

我想從csv文件讀入熊貓數據框。然後我想對這個數據幀做一些操作。我想在不同的功能(理想情況下在一個單獨的文件中)做到這一點。如何在功能之間解析熊貓數據框

import pandas as pd 

def read_text(file): 
    df = pd.read_csv(file,skipinitialspace=True, sep=";", encoding = "ISO-8859-1") 
    return [df] 


file = "/path/file.txt" 
content = pd.DataFrame() 
content = read_text(file) 

現在,文件的閱讀工作正常。但「內容」似乎不再是一個數據框。至少,如果我嘗試像例如print (content.value)似乎沒有這個選項。 我以後想要做的是:

  1. 發送數據幀的功能,以消除重複和返回數據幀
  2. 利用這一新的數據幀,並刪除某些條目並再次返回該數據幀
  3. 做更多的事情數據幀

理想情況下,這些函數將在一個單獨的文件中。但我會在稍後處理這件事。現在,如果我能夠來回解析這些數據幀,這將非常有幫助。

+0

通用警告:'file'是一個Python關鍵字,_not reserved_,所以使用它作爲一個變量名,尤其是在文件範圍內,是有可能的原因問題下來像使用' file_name'或者其他的東西。 –

+0

是的,這是首先想到的,當試圖創建一個例子 - 沒有考慮副作用。 – SLglider

回答

1

您正在返回[df],這是一個單一數據框的列表。您應該修改您的代碼如下:

import pandas as pd 

def read_text(file): 
    df = pd.read_csv(file,skipinitialspace=True, sep=";", encoding = "ISO-8859-1") 
    return df 


file = "/path/file.txt" 
content = read_text(file) 
+1

謝謝,這結束了幾個小時的搜索和嘗試。 – SLglider

+0

沒問題。有時候,正是在你鼻子下面的小事情,出於某種原因,你看不到它們! –