1
想象一下,您正在處理大量數據集,並將其分發到一堆CSV文件中。您打開一個IPython筆記本並瀏覽內容,進行一些轉換,重新排序和清理數據。如何在使用IPython筆記本時管理複雜性?
然後你開始做一些數據實驗,創建更多的筆記本,並最終發現自己堆滿了一堆不同的筆記本,這些筆記本中埋有數據轉換管道。
如何以這樣的方式組織數據探索/變換/學習 - 從 - 它的過程,即:
- 複雜性不吹,逐步提高;
- 保持您的代碼庫可管理和可導航;
- 能夠重現和調整數據轉換管道嗎?