在joksnet的程序here的幫助下,我設法獲取了我正在尋找的純文本維基百科文章。使用python製作(希望簡單)的wiki解析器
文本返回包括標題Wiki標記,因此,例如,在Albert Einstein article的部分被這樣的返回:
==Biography==
===Early life and education===
blah blah blah
我真的很想做的是飼料檢索到的文本到斜體功能和包裝所有的頂級部分大膽HTML標籤和第二級段,像這樣:
<b>Biography</b>
<i>Early life and education</i>
blah blah blah
但我怕我不知道如何甚至開始,至少在沒有做該功能危險幼稚。我需要使用正則表達式嗎? 任何建議非常感謝。
PS對不起,如果「解析」是一個字太強,我想在這裏做什麼。
爲什麼讓另一個解析器?你不能只是[從API獲取HTML](https://www.mediawiki.org/wiki/API:Parsing_wikitext),並用JavaScript/CSS改變/設置h2和h3標籤? – Nemo