Django的ORM合併數據

我碰到一個問題就來了，我無法找到一個優雅的方式來解決它......Django的ORM合併數據

我們有監控音頻輸入，並嘗試分配基於聲學指紋匹配的應用程序。

應用程序每隔幾秒獲取一個樣本，然後執行查找並將時間戳結果存儲在數據庫中。

指紋並不總是準確的，所以發生「錯誤」項目被分配。因此，數據看起來類似：

timestamp foreign_id  my comment 
-------------------------------------------------- 
12:00:00   17 
12:00:10   17 
12:00:20   17 
12:00:30   17 
12:00:40   723  wrong match 
12:00:50   17 
12:01:00   17 
12:01:10   17 
12:01:20   None  no match 
12:01:30   17 
12:01:40   18 
12:01:50   18 
12:02:00   18 
12:02:10   18 
12:02:20   18 
12:02:30   992  wrong match 
12:02:40   18 
12:02:50   18

所以我在尋找一種方式來定期「清理」數據。

任何人都可以想象一個很好的方式來實現這一目標嗎？在給出的示例中 - 外部ID的的條目應該被校正爲等。並且 - 如果可能的話 - 帶有關於應該將來回多少條目考慮在內的閾值。

不知道我的問題是否足夠清楚，但任何輸入歡迎！

來源

2013-06-18 ohrstrom

檢查一個外部ID在數據庫中多次，然後檢查這些時間是否靠近在一起？

爲什麼不在使用數據時忽略'不良'數據呢？

來源

2013-06-18 15:54:14 Siecje

Django的ORM合併數據

回答

相關問題