2012-11-20 26 views
1

我有一個維基百科文章列表(我自己的歷史記錄在我的瀏覽器中)。我想繪製維基百科上我的訪問樹,通過爲每個內部維基百科超鏈接畫一條線。爲了獲得好的結果,我想用文章的名稱來表示每個節點,並且對於文章中至少有一個圖像的文章,提取從文章中提取的圖像。有沒有可以用作維基百科文章代表的圖像?

哪個圖片是最佳人選?我注意到有時候會有一個名爲thumbimage的圖像,但情況並非總是如此。

+0

相關,接近重複:http://stackoverflow.com/questions/12147886/how-can-i-get-the-principal-image-from-mediawiki-api –

回答

0

我已經嘗試從特定頁面抓取相關圖片的類似經歷。在我的情況下,我使用了og:image屬性。

你可以閱讀更多關於它在這裏:http://ogp.me/

+0

維基百科不會用og裝飾它的頁面:元數據 – alecail

1

退房的DBpedia的圖像數據集:

http://wiki.dbpedia.org/Downloads38#h227-1

他們選擇的代表圖像的許多文章。他們並沒有經常更新(最新的數據來自2012年6月,我認爲,在我寫的4個月前),但他們做得非常好,如果您需要更多的電流,他們可以使用他們的代碼解析自己數據。

0

另一種方法是使用HTML或wikimedia標記將圖片自己分析出頁面。我建議把信息框圖像,如果有的話,並失敗,頁面上的第一個圖像。

相關問題