-2

我的應用程序是一個幫助(用戶援助系統)就像在線MSDN。但唯一的導航方式是通過SEARCH。要麼搜索很好,要麼我的系統已經死機。全文搜索sql服務器(其中stackoverflow被拒絕)

我在尋找第三方搜索引擎,可以連接到數據庫並提供 開箱即用全文搜索。 我已經研究過sql server 2008 ifts,lucene.net api,sql lite fts4,但是他們都缺乏谷歌那樣的結果排名。

他們不期待像谷歌,但我需要最好的排名搜索引擎產品。

任何建議或經驗?

也許我不應該去第三方搜索引擎,並使用Lucene.NET或SQL Server 2008 FTS 但我怎麼能建立用戶提供的搜索查詢好名次..喜歡

「我該怎麼辦上傳excel文件在XYZ界面「等。

+1

你是指什麼意思*哪個stackoverflow被拒絕*?另外請注意,短信說*(em,sth)*是阻止人們幫助你的好方法。 –

+0

我想他是指這篇文章http://blog.stackoverflow.com/2011/01/stack-overflow-search-now-81-less-crappy/ –

+0

感謝您的注意。列文 –

回答

3

我的簡短回答令人沮喪:即使對於」好的「解決方案,您也無法自己找到。

如果你想好名次:

  1. 讓您的網站友好的搜索引擎(不 一定意味着你必須將其對外公開,​​公正,確保 搜索引擎理解的URL。 )
  2. 谷歌支付做(尋找谷歌應用程序)

正如你所說,搜索引擎必須做兩件事情至少。第一個是索引,即根據查詢的關鍵字從數據庫中查找文檔。第二個是排名,它對所有文檔進行排序並突出顯示最相關的文檔。

排名是搜索引擎優秀的關鍵因素之一。這並不奇怪,排名很難。

爲了讓大家知道它有多困難,以您的問題中的句子爲例(例如,「我怎樣才能在XYZ界面中上傳Excel文件」)。搜索引擎必須回答至少兩個問題才能獲得良好結果:

  1. 哪個關鍵字最重要?例如,XYZ可能比「如何」和「可以」更重要。

  2. 這個詞的可能含義是什麼? 「Excel」可以是microsoft excel或Xcel energy(公司名稱excel)

在計算機科學中有一個專門討論這個問題的領域。如果您想獲得更多證據,請快速瀏覽ACM WWW。

有一件事更令人沮喪的是,獲得「好的」解決方案將會很困難。高層次的觀點是電腦對英語一無所知,他必須閱讀很多才能學會如何對文件進行排名。「很多」意味着很多工作 - 例如,許多教科書都建議基於TF/IDF對文檔進行排名,但對這些值進行合理裁減需要對數百萬個網頁進行爬網。

總結:

  1. 排名是很難的。
  2. 因此,您將無法找到任何免費的開箱即用解決方案,並且Google和Microsoft保持其排名算法的專有性並不奇怪。
  3. 如果您想在大型數據庫中對文檔進行排名,請獲取搜索引擎。
0

退房新特性,SQL Server 2012中的語義搜索: http://msdn.microsoft.com/en-us/library/gg492075%28v=sql.110%29.aspx這不會是一個銀彈,但可能會爲您提供「開箱即用」的方法。

+0

我已經詳細檢查了。語義搜索很棒。但是,將SQL Server(許可證成本)用於靜態內容存儲及其管理的成本很高,並且不能很好地擴展。 –