是否有任何.Net庫解析我通過mediawiki API檢索的頁面?一個標準的mediawiki解析器可以爲純數據提供標題和數據,但是我寧願選擇一個特別適合wiktionary的,可以給我什麼類型的單詞和所有定義的單詞。解析維基文庫
我不想爲此編寫我自己的解析器。有什麼建議麼?
是否有任何.Net庫解析我通過mediawiki API檢索的頁面?一個標準的mediawiki解析器可以爲純數據提供標題和數據,但是我寧願選擇一個特別適合wiktionary的,可以給我什麼類型的單詞和所有定義的單詞。解析維基文庫
我不想爲此編寫我自己的解析器。有什麼建議麼?
如果以JSON的形式獲得輸出,則可以使用許多選項,既可以內置到.NET中,也可以在框架本身外部使用。
如果用XML獲得輸出,那麼.NET框架內部和框架外部都有強大的XML操作類。
您將必須更具體 - 提供格式和一些示例輸出。
我使用這個:http://en.wiktionary.org/w/api .php?action = query&prop = revisions&rvprop = content&titles =它與維基代碼一起出現,您將輸入到mediawiki中以製作頁面的代碼相同。 – Bananable
dbnary項目以RDF格式提供來自維基詞典的解析信息。
如果您希望進一步處理某些內容,我提供從dbnary數據生成的SQLite和TEI文件,作爲我的WikDict項目的一部分,網址爲download.wikdict.com。
這並沒有真正回答.net庫的問題,但我相信你會很容易地找到讀取XML(TEI),SQLite或RDF的庫。
您從API中消耗哪種輸出格式?目前有9個可供選擇... –
@Alex有大量的例子,從這裏開始:http://www.mediawiki.org/wiki/API:Parsing_wikitext –
我不知道任何API或客戶端庫這將以結構化格式提供維基數據(與HTML或原始維基文本相對)。然後再次,我也沒有看太多。 –