2013-05-18 19 views
6

我曾經通過使用一些正則表達式解析導出來從導出的維基百科文章中檢索中介語鏈接。從導出的維基百科文章中檢索中介語鏈接?

WikiData project的第1階段,這些鏈接已移至Wikidata上的單獨頁面。

例如,文章Ore Mountains在導出時不再有語言鏈接。語言鏈接現在在Q4198

如何導出語言鏈接?

+0

阿西莫夫,如果答案解鎖你的情況,請驗證它。 (如果它是我的,它將成爲我的第一個驗證答案) – Hugolpz

回答

1

我改變了使用導出到API。你可以檢索與財產 「langlinks」,像這樣的interwikilanguage鏈接:

http://en.wikipedia.org/w/api.php?action=query&titles=Ore%20Mountains&prop=langlinks

+2

據我瞭解,[這將很快停止工作,並且在此之後的一段時間,如果向查詢添加參數,它將再次開始工作](http: //osdir.com/ml/general/2013-04/msg48570.html)。 – svick

+0

這將繼續工作,但隨着維基數據的發展,所有的維基數據將從維基百科移除,並移至維基數據。階段1應該已經從維基百科中刪除了大部分。 – Hugolpz

+0

使用答案中顯示的答案檢索正確的鏈接。由於問題中的頁面之間的鏈接已經移動到wikidata,我想這是獲取鏈接的正確方法。 – Asimov

5

您現在鼓勵使用維基數據API:http://wikidata.org/w/api.php

對於your case, use props=labels。這個網址是自我解釋:

http://www.wikidata.org/w/api.php?action=wbgetentities&sites=enwiki&titles=Ore%20Mountains&languages=cs|de|es|fr|it|pl|pt|ru&props=labels&format=xml 
+0

這有效,但對於某些語言,即使文章不存在於維基百科上,我也會得到結果。有沒有辦法解決這個問題? –

+0

你能舉個例子嗎? – Hugolpz

+0

事實上,維基百科鏈接是附加鏈接,而不是標籤。例如嘗試使用「Giancarlo Magalli」而不是「Ore Mountains」的網址,即使只有意大利語可用,您也會擁有多種語言 –