我有一套500萬字符串。這些目前存儲在單個列MySQL表中。我的應用程序必須執行查找並檢查給定的字符串是否在集合中。這當然可以使用HashSet(使用Java)完成。但是,與其構建定製解決方案,我想知道是否有任何現有的,廣泛使用的,經過驗證的解決方案來實現這一點?這似乎是一種常見的情況。該解決方案應該是可擴展的(該集合可能增加超過5百萬),具有故障轉移(可能是分佈式的)並且在大量請求下運行良好。有什麼建議麼?快速,可伸縮的字符串查找
更新:我的應用程序還可以查詢以檢查給定的字符串集是否存在於全局(500萬個)集中。
也許我不明白你的意思是「執行查找」和「檢查給定的字符串是否在集合中」 - 是不是這只是SQL選擇語句的用途?故障轉移和縮放也或多或少是正常的RDBMS功能。 – Sorpigal 2010-09-29 11:20:44
嘗試用於快速字符串查找。它們比hashtables/hashset更有效率,並且速度並不慢。 – leppie 2010-09-29 11:23:47
@Sorpigal:是的,但正常的RDBMS查詢速度不夠快。我還用確切的場景更新了我的問題。希望清除它。 – talonx 2010-09-29 11:50:46