0
我碰到一個問題就來了,我無法找到一個優雅的方式來解決它......Django的ORM合併數據
我們有監控音頻輸入,並嘗試分配基於聲學指紋匹配的應用程序。
應用程序每隔幾秒獲取一個樣本,然後執行查找並將時間戳結果存儲在數據庫中。
指紋並不總是準確的,所以發生「錯誤」項目被分配。因此,數據看起來類似:
timestamp foreign_id my comment
--------------------------------------------------
12:00:00 17
12:00:10 17
12:00:20 17
12:00:30 17
12:00:40 723 wrong match
12:00:50 17
12:01:00 17
12:01:10 17
12:01:20 None no match
12:01:30 17
12:01:40 18
12:01:50 18
12:02:00 18
12:02:10 18
12:02:20 18
12:02:30 992 wrong match
12:02:40 18
12:02:50 18
所以我在尋找一種方式來定期「清理」數據。
任何人都可以想象一個很好的方式來實現這一目標嗎?在給出的示例中 - 外部ID的的條目應該被校正爲等。並且 - 如果可能的話 - 帶有關於應該將來回多少條目考慮在內的閾值。
不知道我的問題是否足夠清楚,但任何輸入歡迎!