2013-03-30 159 views
1

DBpedia名稱是否有任何標準或慣例?我的意思是,例如,United Kingdom有一個名爲United_Kingdom的資源。但我看到,有一個下劃線和每個單詞都被大寫的事實並不成立。例如,拿University_of_Manchester;如果您在「of」中鍵入它爲University_Of_Manchester且大寫字母「O」,那麼您將無法獲得資源。是否有必要在適當的情況下進行篩選以獲取資源名稱,因爲我們可能希望使所有字母都爲小寫字母,在空格中具有下劃線並僅進行查詢,因爲在SPARQL中進行篩選需要一些時間。DBpedia資源名稱標準

有什麼建議嗎?我剛開始學習DBpedia,所以我可能會錯過一些東西。

+0

答案適合您的需求嗎?如果確實如此,您可以[接受它](http://meta.stackexchange.com/a/5235/225437)讓其他人知道它適合您。如果沒有,請讓我們知道爲什麼,以便它可以改進! –

+0

很好,謝謝 – Noor

回答

2

DBpedia編碼維基百科中可用的信息,其命名約定基於維基百科文章的名稱。該DBpedia的wiki頁面,The DBpedia Data Set說,中科3. Denoting or Naming 「Things」

在DBpedia的數據集中的每個事情是由形式http://dbpedia.org/resource/Name,其中名稱來源於一個去的可參考IRI-或基於URI引用標註源Wikipedia文章的URL,格式爲http://en.wikipedia.org/wiki/Name。因此,每個DBpedia實體都直接與Wikipedia文章相關聯。每個DBpedia實體名稱都解析爲面向描述的Web文檔(或Web資源)。

直到DBpedia 3.6版本,我們只使用英文維基百科的文章名稱,但自從DBpedia 3.7版本以來,我們還提供包含IRI的國際化數據集,如http://xx.dbpedia.org/resource/Name,其中xx是維基百科語言代碼,名稱取自源URL,http://xx.wikipedia.org/wiki/Name

因此,由於維基百科的文章是University of Manchester,不University Of Manchester的DBpedia的資源是http://dbpedia.org/page/University_of_Manchester,而不是http://dbpedia.org/page/University_Of_Manchester