如果您以前使用過indeed.com,您可能會知道,對於您所尋找的關鍵字,只要在屏幕左側顯示多個搜索優化選項,就會返回傳統搜索結果。如何創建像搜索一樣的truth.com?
例如,搜索關鍵字「設計師」,細化選項是:
Salary Estimate
$40,000+ (45982)
$60,000+ (29795)
$80,000+ (15966)
$100,000+ (6896)
$120,000+ (2828)
Title
Floral Design Specialist (945)
Hair Stylist (817)
GRAPHIC DESIGNER (630)
Hourly Associates/Co-managers (589)
Web designer (584)
more »
Company
Kelly Services (1862)
Unlisted Company (1133)
CyberCoders Engineering (1058)
Michaels Arts & Crafts (947)
ULTA (818)
Elance (767)
Location
New York, NY (2960)
San Francisco, CA (1633)
Chicago, IL (1184)
Houston, TX (1057)
Seattle, WA (1025)
more »
Job Type
Full-time (45687)
Part-time (2196)
Contract (8204)
Internship (720)
Temporary (1093)
它是如何這麼快就收集統計信息(如作業的數量提供了每個薪金範圍)。看起來精簡選項是實時創建的,因爲次要關鍵字的加載速度也很快。
是否有特定的SQL技術來創建此功能?或者在網上有一本手冊解釋這背後的技術?
關於使用倒排索引和非規範化文檔存儲的以前的答案很好。我們的下一個技術講座(http://engineering.indeed.com/talks/machine-learning-at-indeed-scaling-decision-trees/)將更多地談論在建築決策的背景下倒排索引的力量機器學習的樹。我們使用這種ML方法進行結果排名。談話結束後,我會在這裏跟進幻燈片和視頻的鏈接。 – youknowjack 2014-02-19 18:37:50