我有一個包含9列(「|」作爲分隔符)的呼叫詳細記錄(CDR)的大文件(3 * 10^7行)。每行是具有以下屬性的通信實例:用戶拆分大文件
Date|Time|Duration|Caller|Receiver|serviceType|junk|cellReceiver|cellCaller|CallerLAC
我需要根據用戶將此文件拆分爲更小的塊。因此,無論用戶是呼叫者還是接收者(即,如果A稱爲B,則該行應該出現在兩個文件中,即用戶A的文件和用戶B的文件中),每個文件將是用戶的全部通信。
什麼是最有效的方法? (我正在使用OS X Yosemite)。
任何特定的語言/平臺? – Anonymous
最好使用終端(在MAC上)或Python。我將編輯問題以包含此內容。 – amaatouq
系統上簡單的解決方案有多慢,即使用csv模塊迭代文件。將遇到的每行添加到兩個文件(cdr_user_A.txt&cdr_user_B.txt) –