2015-01-16 50 views
0

在我的數據庫中,我有一個包含大約10列和1000萬行以上的表。一列最多包含1000個字符。現在我需要做搜索者,比如'%cat%dog%'。我不想做任何複雜的事情。但是當我在紅移中運行時,需要大約1秒 - 10秒才能根據我所做的結果給出結果。有沒有其他的選擇,我可以存儲這些數據(如索引文件),以便我可以在不到200毫秒的時間內得到結果。我正在研究Lucine,我不那麼確信。有沒有人知道任何提供該功能的服務?如何從10Million +數據量的行中搜索字符串

+0

Solr/Lucene是要走的路。或者,如果您想嘗試不同的東西,請嘗試http://crate.io/ - 將Lucene作爲索引器打包。 – Marcel

回答

0

Google BigQuery可能是您的一個選擇。您可以使用REGEXP_MATCH,它允許您使用正則表達式來選擇記錄而不是LIKE '%something%'。詳情請參閱the query reference