表結構包括:SQL不同用戶ID
User_ID , User_Type , Time_Period (integer)
---------------------------------
12345 , 1 , 201501
12346 , 1 , 201501
12347 , 2 , 201501
12345 , 1 , 201502
12346 , 2 , 201502
隨着時間的推移,
- 獨特User_IDs可以離開USER_TYPE完全
- 新User_IDs可以以任何TIME_PERIOD加入
- User_IDs可以遷移到每個Time_Period中的其他User_Types。
我需要編寫代碼來理解用戶在用戶類型的穩定性超過12個週期,例如,不同User_IDs的70%在USER_TYPE 1停留在週期201501到201512
輸出應該是一個列表由不同User_IDs的計數誰超過12個時間段保持在同一USER_TYPE,和獨特的User_IDs總數在同一時間段
User_Type , Count Distinct Same User_IDs , Count Distinct Total User_IDs
---------------------------------------------------------------------
1 , 146,023 , 201,501
2 , 46,124 , 147,234
3 , 27,500 , 87,954
第二列的USER_TYPE這是我第一次發貼,所以請讓我知道如果你需要更多的細節,並提前致謝
由於每個時間段,編輯 - User_ID可以多次出現在表格中,但每個時段只能出現一次。
編輯你的問題,並提供你想要達到理想的效果。 'Time_Period'的數據類型是什麼?每個月每個用戶是否有一行? –