我有一個數據庫存儲從多個站點獲取並通過各個站點API收集的產品的詳細信息。當我調用提要時,詳細信息存儲在數據庫表中。如何識別從多個Feed中收集的重複項目並將其鏈接到數據庫中
我遇到的問題是,由於賣家在許多網站上列出了完全相同的產品,我最終在數據庫中出現重複項目,然後當我在網頁上顯示它們時,出現很多重複項目。
問題是該物品沒有任何明顯的唯一標識符,它具有物品(其中可能有很多物品)的具體詳細信息,然後是賣家描述的物品。
我想讓項目顯示一次,然後給用戶詳細列出項目在哪裏列出。
我該如何識別進來的重複數據,而不會放慢整個數據庫?那麼我怎麼也會從所有副本中挑選一個廣告,然後存儲廣告展示的其他網站。
感謝您的任何幫助。
可能正確執行Object#equal(Object)和java.util.Set成爲你的朋友。 – 2010-11-25 10:27:23
Plz.can你澄清你使用哪個數據庫..因爲它會取決於數據庫。我認爲你需要避免重複記錄的表...我是否正確? – 2010-11-25 11:03:00