2016-12-14 68 views
-1

我想從維基百科頁上的列表(https://en.wikipedia.org/wiki/List_of_hub_airports)創建一個美國樞紐機場的表使用R.我是新的網絡抓取,所以對此的任何幫助或建議將不勝感激。我試圖從每個美國州的信息中得到類似於下面的表格。R-Scraping維基百科列表到表

Example of airport hub table

謝謝!

+0

這個問題很廣泛。提取數據和解析本身就是一個項目。請不要要求某人爲你完成你的工作。這不是一個代碼寫入服務。如果您想在項目的某一方面提出一般性建議,請特別注意您的問題。 –

+0

如果您只是在尋找有關機場位置的信息,則可能需要考慮以下問題並回答:http://stackoverflow.com/questions/37572731/using-an-api-to-calculate-distance-between-two-機場兩列內 – Dave2e

+0

這是[經驗豐富的R用戶會很樂意爲你做的] [(https://www.r-users.com/) –

回答

0

雖然整個項目將是一個挑戰,但這裏是拉開美國數據的開始。

library(rvest) 
site <- "https://en.wikipedia.org/wiki/List_of_hub_airports" 
txt <- read_html(site) %>% 
    html_nodes("#mw-content-text :nth-child(1)") %>% 
    html_text() 
usatext <- txt[1866:2329]