2017-04-04 92 views
0

我正在分析python中MySql數據庫中的數據。我查詢數據庫大約200,000行數據,然後使用Pandas在python中進行分析。我會經常對相同的數據做很多迭代,改變不同的變量,參數等等。每次運行程序時,我都會查詢遠程數據庫(大約10秒查詢),然後在程序結束時放棄查詢結果。我想將最後一個查詢的結果保存在本地文件中,然後在每次運行程序時查看查詢是否相同,然後使用保存的結果。我想我可以將熊貓數據框寫入csv,但有沒有更好/更簡單/更快的方法來做到這一點?存儲MySql查詢結果以便更快地重用

+0

200K並不是很多數據。迭代*總是*慢,這就是爲什麼它不用於查詢,報告或分析數據。由設計良好的應用程序生成的數據庫報告*在處理之前不會將所有數據加載到內存中。可以創建適當的查詢和索引,以便在不進行迭代的情況下返回所需的結果,也可以創建單獨的報告數據庫,其模式適合分析,例如星型模式 –

+0

聽起來像是一個很好的計劃。將其寫入本地文件然後讀取該文件。想不到更容易。 – RobertB

+0

@RobertB其實很糟糕,速度很慢。爲什麼在內存中迭代時,如果您的數據庫可以比不使用任何優化訪問的迭代更快地執行基於集合的操作?在10秒內,數據庫應該產生* final *結果。它只有20萬行 –

回答