2015-01-14 67 views
0

我是一個新的在web開發,並有一個從維基百科獲取數據的問題。我正在製作一個個人網絡應用程序,以跟蹤過去的UFC事件。我找不到包含活動詳細信息和結果的開放源代碼API。然而,維基百科下面的表格有很多我需要的信息:http://en.wikipedia.org/wiki/List_of_UFC_events 我已經看到了幾個關於如何從維基表中獲取信息並使用谷歌電子表格或其他軟件(如openrefine)將其格式化爲.csv格式的教程。但是,我也希望每個事件的wikipage(戰鬥結果,獲獎者,獲獎者,海報圖片等)的信息,並且每個事件的自己的wiki頁都列在上面提到的表格中。我想知道,提取這些信息最簡單的方法是什麼?從wiki表格中提取數據以及從該表格到JSON的鏈接的最佳方式是什麼?

回答

0

您可以使用nokogiri寶石來刪除網頁

相關問題