2013-04-27 30 views
-1

維基百科的HTML標籤是否有一個通用格式?即除了基礎知識(頭,身體,身體等)之外,是否有特定的標籤來分隔每個信息塊?例如,引言可能有標籤<p>,而部分1,2,3可能有標籤<s1>, <s2>, <s3>維基百科的HTML結構

我需要能夠獲得按部分區分的內容。另外,我沒有使用維基百科api來獲取這個信息,只有Python。

+4

爲什麼你不使用API​​? – Blender 2013-04-27 04:13:43

回答

3

作爲維基百科上的和停用的編輯器,編輯不傾向於使用<p>標籤,更不用說許多HTML標籤。事實上,他們遵循their own set of rules

MediaWiki幾乎是HTML的替代品,但一些HTML標籤確實有效(即<span>用於着色文本等)。此外,部分不是用HTML完成的。比較:

HTML:<h2>A header</h2>

鏈接到MediaWiki:==A header==

如果你想從每個頭的內容,則肯定要用到他們的API。以下是通過API編輯頁面的鏈接:http://www.mediawiki.org/wiki/API:Edit