我一直在嘗試瞭解過去2天的MediaWiki文檔,我無法弄清楚如何通過MediaWiki API檢索維基百科文章的第一段。檢索維基百科文章的第一段
難道有人指着我正確的方向嗎?
我即將呼籲file_get_contents,但我確信有一個「更乾淨」的解決方案。
我一直在嘗試瞭解過去2天的MediaWiki文檔,我無法弄清楚如何通過MediaWiki API檢索維基百科文章的第一段。檢索維基百科文章的第一段
難道有人指着我正確的方向嗎?
我即將呼籲file_get_contents,但我確信有一個「更乾淨」的解決方案。
不要試圖使用原始API,而不是使用客戶端的包裝。這裏有一個長長的清單以供選擇,所有的PHP:
http://en.wikipedia.org/wiki/Wikipedia:PHP_bot_framework_table
file_get_contents非常乾淨,您將獲得HTML代碼。 然後,您可以使用DOMDocument解析html代碼。 DOMDocument作爲JavaScript,你可以在div中獲取所有<p>
的例子。 或搶第一個。
例如:
$html = file_get_contents('the url');
$dom = new DomDocument();
@$dom->loadHTML($html);
$p = $dom->getElementsByTagName('p')->item(0)->nodeValue;
你想他們的[沙箱(http://en.wikipedia.org/wiki/Special:ApiSandbox)? – yoavmatchulsky 2012-02-22 12:03:51
再次查看它後,您不需要API即可查看該頁面並獲取第一段。 – yoavmatchulsky 2012-02-22 12:09:30