2017-02-22 17 views
0

因此,有時我需要從網上獲取一些數據,將其組織成一個數據框,並浪費大量時間手動完成。我一直在試圖弄清楚如何優化這個過程,並且我嘗試了一些R的方法,但是無法做到這一點,我認爲可以有一個更簡單的方法來做到這一點,任何人都可以幫助我出去了嗎?無法找出如何處理此練習#R刮#提取網頁數據

虛構的鍛鍊:

這裏是由大陸上市國家的網頁:https://simple.wikipedia.org/wiki/List_of_countries_by_continents

每個國家的名字也導致其他網頁的鏈接(具體每個國家,例如https://simple.wikipedia.org/wiki/Angola)。

我希望作爲最終結果來獲得觀測值(行)=列出的國家數量和4個變量(colums)作爲ID =國家名稱,Continent = Continent屬於的數據框,Language = Official語言(來自各國的特定網頁)和人口=最近的人口數量(來自各國的具體網頁)。

爲了能夠達到最終的數據幀,我應該在R中遵循哪些步驟?

回答