2013-08-31 37 views
0

我正在尋找轉儲(xml格式,包含模板)的解決方案,每篇文章在過去一小時內如何編輯。將近期更改的文章導出到xml轉儲

我開始使用的是用於Firefox的imacro。獲取文章列表現在很好。目前我有文章名稱,其中包括空格或德語變音。

e.g.Eidgen%C3%B6ssische_Konstruktionswerkst%C3%A4tte_K%2BW_C-35

我怎麼能i轉換到 「真實」 的文章的名字呢?

回答

1

您看到的標題被編碼以用於URL。您的編程語言應該提供解碼這些的標準方法,例如PHP中的「urldecode」,JavaScript中的「decodeURIComponent」,Python中的「urllib2.quote」等。

但是,如果您通過MediaWiki API獲取更改頁面的標題,則根本不需要執行此操作。例如,查看此維基百科的查詢:https://de.wikipedia.org/w/api.php?action=query&list=recentchanges&format=xml

+0

thx。此刻imacros沒有urldecode。我找到了一個外部解決方案標題被保存(已編碼)在標題中,該標題歸屬於最近更改的頁面上的所有鏈接。 – ozz

+0

使用api只能在較新的Wiki上運行,因爲它沒有被禁用。所以我更喜歡一個通用解決方案最大的問題是,xml必須重新使用導入程序。 – ozz