我有一個數據庫,其中包含許多人(可能)一次運行一個服務的多個訂閱,以及每個事件在訂閱期間的事務數據。我正在嘗試創建一個變量來計算用戶在給定交易時間內當前有效訂閱的數量。併發訂閱計數
一個例子來說明,我的數據存在於形式:
person | subscription | obs_date | sub_start_date | sub_end_date | num_concurrent_subs
--------------------------------------------------------------------------------------
1 | 1 | 09/01/10 | 09/01/10 | 09/01/11 | 1
1 | 1 | 10/01/10 | 09/01/10 | 09/01/11 | 2
1 | 1 | 11/01/10 | 09/01/10 | 09/01/11 | 2
1 | 2 | 10/01/10 | 10/01/10 | 09/01/11 | 2
1 | 2 | 11/01/10 | 10/01/10 | 09/01/11 | 2
1 | 3 | 11/01/14 | 09/01/14 | . | 1
1 | 3 | 11/01/16 | 09/01/14 | . | 1
1 | 4 | 11/01/15 | 10/01/15 | 11/01/15 | 3
1 | 5 | 11/01/15 | 10/01/15 | 11/01/15 | 3
等等等等每個人。我想要像上面那樣生成num_concurrent_subs
。
也就是說,對於每個人,請查看每個觀察結果並查找它落入sub_start_date
到sub_end_date
範圍內的訂閱次數。
我讀過Stata的count
函數,並相信我接近解決方案,但我不確定如何在不同的訂閱中檢查它。
嚴格'計數'是一個命令,而不是一個函數。在Stata中,命令和函數是不同類型的野獸。 –