我使用三個數據幀來分析順序數字數據 - 基本上是及時捕獲數字數據。有8欄和360k條目。我創建了三個相同的數據框 - 一個是原始數據,第二個是用於分析的「便箋式」,第三個數據框包含分析結果。這運行真的很慢。我想知道是否有辦法讓分析運行更快?如果不是三個單獨的8列數據框而是一個大的24列數據框,它會更快嗎?使數據幀分析更快
Q
使數據幀分析更快
0
A
回答
1
使用cProfile和lineprof來計算出花費的時間。
要得到別人的幫助,發表您的真正的代碼,你的真實個人資料的結果。
優化是一個經驗過程。人們的小技巧往往適得其反。
0
最有可能也不要緊,因爲熊貓商店每列分別反正(數據幀是系列的集合)。但是,通過使用單個幀,您可能會獲得更好的數據局部性(所有數據在內存中相鄰),所以值得嘗試。檢查這個經驗。
0
重新讀這篇文章我意識到我可以更清楚。我一直在用寫的語句,如:
dm.iloc[p,XCol] = dh.iloc[x,XCol]
一個數據幀(DH)的單個細胞轉移到不同的行中的第二數據幀(DM)的。它運行得非常緩慢,但我需要對這個特定的文件進行排序,並且我只是在性能上生活。
根據Michael Heydt的「Learning Pandas」第146頁,「.iat」比從數據框提取(或寫入)標量值的「.iloc」要快。我試了一下,它的工作原理。使用我的原始300k行文件,使用「.iloc」運行時間爲13小時(!),使用「.iat」的相同數據文件在大約5分鐘內運行。
淨 - 這是更快: dm.iat [P,XCOL] = dh.iat [X,XCOL]
相關問題
- 1. 分析Spark中數據幀
- 2. 按時間比較分析2個數據幀的分析
- 3. 加快數據幀匹配
- 4. 數據幀到datatable r.net快
- 5. 如何快速分析postgres數據庫
- 6. 使用分層索引更改數據幀中的數據
- 7. 拆分數據幀
- 8. 解析熊貓數據幀
- 9. 使用另一個數據幀中的行更新數據幀
- 10. 分裂數據,使其更快,更方便
- 11. 將數據幀拆分成更小的數據幀並將大數據幀推送給所有執行者?
- 12. matplotlib - 更快的幀速率?
- 13. 快速解析數據
- 14. 分組數據幀,並使用應用
- 15. 熊貓數據框分配不更新數據幀
- 16. 刪除比數據幀第95百分更大的數據
- 17. 執行這些數據幀操作的更快方法?
- 18. 尋找更快的方式來迭代熊貓數據幀
- 19. 更快速地比較數據幀中的行
- 20. pythhon數據幀過濾條件:任何更快的方法
- 21. 快捷方式轉化數據幀
- 22. 查詢數據幀的最快方法
- 23. 加快應用功能與數據幀
- 24. 分割數據幀由指數在另一個數據幀
- 25. 熊貓分層數據幀
- 26. 與plyr分割數據幀
- 27. 按列拆分數據幀
- 28. 如何分配數據幀?
- 29. 分割數據幀的行
- 30. 拆分數據幀dataframes
這取決於。我建議你嘗試和衡量。 – Goyo