2
我的目標是根據條件有效地計算文件中字符串出現的次數。根據條件有效地計算文件中字符串的出現次數
我在輸入csv文件中有大約45k記錄。我需要將它們全部讀取並創建一個新文件,該文件描述了原始文件中特定時間段內字符串出現的次數。
輸入文件:
Timestamp Field
7/13/2013 10:30 ABC
7/13/2013 11:30 ABC
7/13/2013 10:34 ABC
7/13/2013 10:15 CDE
7/13/2013 10:00 ABC
7/13/2013 10:14 CDE
7/13/2013 12:30 ABC
7/13/2013 00:30 ABC
7/13/2013 07:30 CDE
主要目標是到一個特定的時隙內計算領域出現。
的輸出我期待的是:
Slots ABC CDE
7/13/2013 00:01-03:00 1 0
7/13/2013 03:01-06:00 0 0
7/13/2013 06:01-09:00 0 1
7/13/2013 09:01-12:00 4 2
7/13/2013 12:01-15:00 1 0
7/13/2013 15:01-18:00 0 0
7/13/2013 18:01-21:00 0 0
7/13/2013 21:01-24:00 0 0
我寫了一個強力的代碼,做我的工作,但它需要大量的時間來完成。 我正在尋找一個高效的代碼來完成這項任務。
我有一個單獨的數據框,其中包含時間段(day_hour)和字段名稱(field_data)。我的蠻力方法是使用兩個for循環在兩個數據框的所有記錄中進行搜索並相應地計算出現次數。
請指導我,如果我可以使用像table()
這樣的功能或在這種情況下可以提供幫助的東西。
非常感謝。這正是我想要的。 :)答案的前三行簡直就是需要的,我不知道如何正確使用它們。你給了我如何去做的確切方式。再次感謝:) – N2M
當我最近熟悉一些數據時,您的答案令人鼓舞。謝謝。 – Puriney