2013-03-21 59 views
0

我想獲得不同語言的主要新聞網站的列表。有沒有提供RDF格式大部分主要網站詳細信息的提供商?聯機新聞網站的RDF數據

+0

RSS 1.0是純粹的RDF,所以你可以尋找那些提供場所。否則,你可以嘗試在http://sindice.com上搜索與新聞有關的類或屬性。我的猜測是,紐約時報會出現,因爲他們涉及的rNews詞彙表可以用於微數據或HTML中的RDFa以標記文章等。 – 2013-03-21 14:06:03

+0

等待,您要求提供一套關於新聞機構的三元組。 .. – 2013-03-21 17:52:38

+0

@ BenCompanjen,是的,我試圖找出所有(或我們得到的)新聞網站。我正在構建一個應用程序,我想知道哪一個是新聞網站。如果它是新聞網站,那麼我必須禁用頁面的緩存。所以如果我有我的新聞領域,那麼我不會緩存這些新聞網站的所有頁面。 – vinod 2013-04-09 15:12:51

回答

1

DBpedia包含來自Wikipedia的信息,並具有SPARQL端點。維基百科中有一些相關類別可能會幫助您找到所需的信息。例如,我們可以選擇各個新聞網站,並得到302個結果:

SELECT * WHERE { 
    ?newsSite dcterms:subject category:News_websites . 
} 

SPARQL results

這是一個有點難以可靠地走出其它信息,因爲有些信息可能不可用的頁面,或者相同的信息可能出現在具有不同屬性的不同頁面上。例如,一些這些頁面的記錄自己的新聞網站與dbpprop:web

SELECT * WHERE { 
    ?newsSite dcterms:subject category:News_websites . 
    OPTIONAL { ?newsSite dbpprop:web ?web } 
} 

SPARQL results

其他人使用dbpprop:website。您可以將之前的查詢中的dbpprop:web替換爲dbpprop:web|dbpprop:website,儘管在DBpedia端點上運行速度稍慢。你可以更詳細,用這個代替:

SELECT ?newsSite ?web WHERE { 
    ?newsSite dcterms:subject category:News_websites . 
    OPTIONAL { 
    { ?newsSite dbpprop:web ?web } 
    UNION 
    { ?newsSite dbpprop:website ?web } 

    } 
} 

SPARQL results

這仍然只得到網站爲這些頁面屈指可數。有些更用dbpprop:url,因此,我們有以下幾點:

SELECT ?newsSite ?web WHERE { 
    ?newsSite dcterms:subject category:News_websites . 
    OPTIONAL { 
    { ?newsSite dbpprop:web ?web } 
    UNION 
    { ?newsSite dbpprop:website ?web } 
    UNION 
    { ?newsSite dbpprop:url ?web } 
    } 
} 

SPARQL results

+0

非常感謝你。我會用這個。 – vinod 2013-06-05 07:16:14