2013-04-24 81 views
4

我需要在我正在構建的網站中爲客戶創建服務檯,並且我喜歡StackOverflow發現類似問題的方式。有沒有人知道該網站使用什麼算法,並且你能提供任何可以找到的參考資料?StackOverflow使用什麼算法來尋找類似的問題?

+1

相關問題與答案http:// stackoverflow。COM /問題/ 891772 /計算器相關疑問的算法 – Tyler 2013-04-24 15:56:19

回答

5

還有就是Machine Learning整個分支稱爲clustering(一類unsupervised learning)與這種類型的問題涉及。

該問題成爲羣集的一部分,並且同一羣集中的其他問題(可能按距離爲similarity measure的順序)顯示爲類似的問題。

有各種features,它可以使用聚類,其中一些可以是:

  • 標籤
  • 詞在文本標題
  • 詞語(較低重量比航向)
  • 鏈接到其他問題/網頁。

等等。

在這些類型的問題中可能會使用其他制定的功能,使用像text summarization,sentiment analysis等技術。哪些功能對哪個問題有好處取決於問題。

,你在行動中看到這些算法的其他領域包括:

  • 的Youtube
  • 維基百科
  • IMDB

和列表無窮延續。

那麼你可以對你的問題做些什麼?

有沒有人的答案。這一切都取決於您的數據和目標查詢。但仍然,您可以

  • 瞭解feature engineering方面的machine learning
  • 瞭解有關clustering

(有這些許多的在線課程。)

或者

  • 服務誰知道這東西的人。
1

大部分似乎都是標籤上的加權匹配,也許是標題上的match()或equivilent全文加權搜索。

它可能得到它的細節元某處或FAQ