我有PostgreSQL數據庫中約1萬個事件是這種格式:在巨大的事件流中發現差距?
id | stream_id | timestamp
----------+-----------------+-----------------
1 | 7 | ....
2 | 8 | ....
有大約50,000獨特的流。
我需要找到所有事件之間的任何兩個事件之間的時間超過一定的時間段。換句話說,我需要在一定時間內找到沒有事件的事件對。
例如:
a b c d e f g h i j k
| | | | | | | | | | |
\____2 mins____/
在這種情況下,我想找到對(F,G),因爲這些是直接圍繞間隙的事件。
我不在乎查詢是否緩慢,即100萬條記錄,如果需要一個小時左右就沒有問題。但是,數據集將保持增長,所以希望如果速度緩慢的話,它可以保持穩定。
我也有MongoDB中的數據。
執行此查詢的最佳方式是什麼?
事件是由單個時間點(而不是時間跨度)定義的嗎? –
你想要每個流?換句話說,差距在屬於單一流的事件之間? – Patrick
@MOehm是的,單個時間點 – MikeC8