2011-10-11 84 views
0

使用PostgreSQL時,您可以在使用全文搜索時將URL分割爲幾個不同的詞位。例如:Sphinx如何處理URL

SELECT to_tsvector('http://www.example.com/dir/page.html'); 
           to_tsvector         
-------------------------------------------------------------------------- 
'/dir/page.html':3 'www.example.com':2 'www.example.com/dir/page.html':1 
(1 row) 

你可以看到的PostgreSQL已經打破了http://www.example.com/dir/page.html到URL(www.example.com/dir/page.html),主機(www.example.com)和url_path(/dir/page.html)。這很方便,因爲它可以讓你快速搜索www.example.com

在這樣的背景下,SphinxSearch如何處理索引URL?它的行爲與PostgreSQL類似嗎?它將URL拆分爲多個部分,以便輕鬆搜索?

回答

0

它真的只是打破了使用charset_table裏

沒有上市所以通常任何charactors源文本。和/只是算作分隔符,這樣一個url就可以被字母組搜索 - 有用地與短語運算符