3

我的表弟創建了語義搜索引擎,他聲稱他的搜索引擎是最準確的。如何確定語義搜索引擎的準確性?

我見過很多語義搜索引擎,他們看起來都一樣對我來說,因爲它們不是設計給您根據您鍵入的關鍵字結果。

所以,如果你正在創建一個語義搜索引擎,如何確定其結果的準確性?

+1

給100人看看他們對結果的滿意度嗎? – sarnold

+0

@sarnold是有一個比較科學的方法來確定,如果你有一個很好的履帶... – Lynob

+0

我問的是技術方面,而不是如果人們喜歡還是不喜歡 – Lynob

回答

2

其實sarnold的建議並不遙遠。

什麼,你通常會做的是採取一大堆的人,並讓他們嘗試了一堆標準查詢。或者,如果你想讓實驗更公平,你可以讓每個用戶選擇自己的查詢,以避免任何偏見(因爲你可以選擇標準查詢,你知道你的引擎擅長回答)。

對於每個查詢的用戶會期待通過前10個左右的結果,並說他們是否認爲每一個結果是相關或不(你可能需要有用戶評分的規模,而不是僅僅是/否)。

然後對於每個查詢,您可以計算準確性分數,具體取決於您如何設置實驗Precision and Recall可能是最合適的措施,儘管這些措施依賴於您可能不一定有的已知預期答案。計算簡單的百分比準確度可能更簡單也更合適。

要確定您的搜索引擎是否比你的競爭對手你有相同的人對這些搜索引擎以相同的方式得分執行相同的查詢更好。完成這些後,您可以計算並比較搜索引擎的分數與您自己的分數。

+0

,吸,我期待一些數學,概率,等等。 ..我不敢相信你可以依靠人們的意見,統計數據很糟糕......如果我在2搜索引擎搜索引擎上輸入'obama in iraq',就會顯示'奧巴馬做出撤軍決定',另一個會顯示'奧巴馬管理部門在伊拉克犯了什麼錯誤......'那些人的區別是什麼...... – Lynob

+0

那麼精確度和召回率是合適的數學,但他們首先依靠你有一個預期的答案來計算它們。如果你沒有這個,那麼你只能做一個用戶意見調查 – RobV