2017-01-16 77 views
1

我正在使用滑動窗口算法在DBpedia中搜索URI。輸入關鍵字字符串後,我將它們分成小羣集,然後在DBpedia上搜索。滑動窗口算法:使用SPARQL在DBpedia中搜索精確實體

實施例:

關鍵字:Actor of the film titanic

=>將它們分開成: Actor of theActor ofActorof the filmof theof,​​the moviethefilm titanicmovietitanic

問題:我如何搜索確切的使用SPARQL包含名爲關鍵字(以上分析過的短語)的實體?

非常感謝。

+0

我注意到,你正在做的事情超過*分裂*原始的搜索詞 - 因爲你有'電影'和'泰坦尼克號'(大寫'T')在你的分離的集合中,但是這些不會出現在原版的。這使得你的問題比第一次出現更大 - 並重新發明了更多的車輪。 – TallTed

回答

1
  1. 有這麼多的問題回答出系統現在鏈接數據和對DBpedia的評價 - 我不明白你爲什麼要推倒重來。

  2. SPARQL查詢通過使用什麼?您可以匹配rdfs:label的值,例如

    SELECT DISTINCT ?s WHERE {?s rdfs:label "KEYWORD"@en .}

但最QA系統使用基於Lucene或類似物預先計算的全文索引。至少,這就是我們在QA項目中做到的。

+0

非常感謝。我使用以下查詢: SELECT distinct?s WHERE { ?s rdfs:label「+ searchText +」@ en。「 ?s foaf:name」+ searchText +「@ en。」 ?s foaf:givenName 「+ searchText +」@ en。「 ... } –