似乎Wikipedia API的鏈接定義與URL不同?我正在嘗試使用API返回特定wiki頁面中的所有網址。如何獲取Wikipedia頁面中的所有URL
我一直玩this query,我發現從this page發電機和重定向。
似乎Wikipedia API的鏈接定義與URL不同?我正在嘗試使用API返回特定wiki頁面中的所有網址。如何獲取Wikipedia頁面中的所有URL
我一直玩this query,我發現從this page發電機和重定向。
我不知道爲什麼你完全困惑(這將有助於解釋這一點),但我確信查詢不是你想要的。它在頁面「標題」(titles=Title
)上鍊接(generator=links
)的頁面上列出鏈接(prop=links
)。它還只列出鏈接第一頁上的第一頁鏈接(頁面大小爲微小的默認值10)。
如果你想在頁面上「標題」的所有環節:
prop=links
,你不想發電機。pllimit=max
增加限制最大可能(pl
是「前綴」爲links
)query-continue
元素給出的值去結果的第二個(下面的)頁面。所以,在第一頁的查詢是:
http://en.wikipedia.org/w/api.php?action=query&titles=Title&prop=links&pllimit=max
而第二(在這種情況下,最終)頁:
另一件事這可能會讓你感到困惑,因爲links
只返回內部鏈接(對其他維基百科頁面)。要獲得外部鏈接,請使用prop=extlinks
。您也可以將兩者合併爲一個查詢:
http://en.wikipedia.org/w/api.php?action=query&titles=Title&prop=links|extlinks
感謝您的回答!我認爲我很困惑,因爲我沒有想到調整查詢限制(愚蠢的我..),所以它只顯示前幾個。此外,鏈接文本和頁面上出現的文本通常是不同的,所以我無法驗證這些鏈接是否確實是頁面上的鏈接......(有些人,有些人並非如此我感到困惑,因爲我真的得到了什麼..)再次感謝! – gchao 2013-02-14 22:59:03