我有一個非常模塊化的代碼庫,其中包含許多函數。其中一些函數產生相當大的數據幀,我使用to_csv()保存到磁盤,然後直接將數據幀返回到調用函數。返回數據幀vs寫入磁盤並從磁盤讀取csv的效率
編輯更好地說明問題,使用從@ ysearka的回答樣本功能
這是我目前在做什麼:
def my_func(some_input):
#df = something(some_input)
return dataframe
df = my_func(my_input)
另一種方法,我認爲是來讀取文件磁盤寫操作之後的通話功能已經完成:
def my_func(some_input):
#df = something(some_input)
df.to_csv('my_file_name.csv')
df = pd.read_csv('my_file_name.csv')
我的問題是:哪以上是實現這一目標的更有效方法嗎?
- 返回數據框來調用函數?
- 寫入完成後,從調用函數中的磁盤讀取文件。
你能解釋你想達到什麼嗎?一個小環境會有所幫助。 –
我編輯了我的答案,但由於我們不知道你在數據框之後想要做什麼,所以我不能做得更好。 – ysearka