我試圖從維基百科頁面中提取內部鏈接。這是我正在使用的查詢如何從維基百科頁面的最新版本獲取內部鏈接?
/w/api.php?action=query&prop=links&format=xml&plnamespace=0&pllimit=max&titles=pageTitle
但是,結果並不反映維基頁面上的內容。以一個隨機文章here爲例。此頁面上只有十幾個鏈接。但是,當我作出查詢時,
/w/api.php?action=query&prop=links&format=xml&plnamespace=0&pllimit=max&titles=Von_Mises%E2%80%93Fisher_distribution
我找回了187個鏈接。我猜這個API可能有一個包含所有修改的頁面的所有鏈接的數據庫。是這樣嗎?我如何才能從最後一次修訂中獲得鏈接?
難道是你忘了導航盒中的鏈接?從我可以看到API回覆的所有鏈接都在頁面中。你能舉一個不應該在那裏的鏈接的例子嗎? – leo
+1。你說得對,利奧。不幸的是,這個API不允許我指定頁面的哪一部分從( – chepukha