2011-12-05 74 views
5

是否有任何.Net庫解析我通過mediawiki API檢索的頁面?一個標準的mediawiki解析器可以爲純數據提供標題和數據,但是我寧願選擇一個特別適合wiktionary的,可以給我什麼類型的單詞和所有定義的單詞。解析維基文庫

我不想爲此編寫我自己的解析器。有什麼建議麼?

+1

您從API中消耗哪種輸出格式?目前有9個可供選擇... –

+0

@Alex有大量的例子,從這裏開始:http://www.mediawiki.org/wiki/API:Parsing_wikitext –

+0

我不知道任何API或客戶端庫這將以結構化格式提供維基數據(與HTML或原始維基文本相對)。然後再次,我也沒有看太多。 –

回答

2

如果以JSON的形式獲得輸出,則可以使用許多選項,既可以內置到.NET中,也可以在框架本身外部使用。

如果用XML獲得輸出,那麼.NET框架內部和框架外部都有強大的XML操作類。

您將必須更具體 - 提供格式和一些示例輸出。

+1

我使用這個:http://en.wiktionary.org/w/api .php?action = query&prop = revisions&rvprop = content&titles =它與維基代碼一起出現,您將輸入到mediawiki中以製作頁面的代碼相同。 – Bananable

1

dbnary項目以RDF格式提供來自維基詞典的解析信息。

如果您希望進一步處理某些內容,我提供從dbnary數據生成的SQLite和TEI文件,作爲我的WikDict項目的一部分,網址爲download.wikdict.com

這並沒有真正回答.net庫的問題,但我相信你會很容易地找到讀取XML(TEI),SQLite或RDF的庫。