我試圖下載以下網址到一個R數據框:從url下載xls文件到數據框(Rcurl)?
http://www.fantasypros.com/nfl/rankings/qb.php/?export=xls
(這是公共頁面上的「導出」鏈接:http://www.fantasypros.com/nfl/rankings/qb.php/)
但是,我不知道如何「解析」數據?我也希望自動執行此操作並每週執行一次,因此有關如何將此操作構建到每週訪問工作流程的任何想法都將不勝感激!一直谷歌搜索和現在幾個小時淘計算器無濟於事... :-)
謝謝
賈斯汀
嘗試代碼:
getURL("http://www.fantasypros.com/nfl/rankings/qb.php?export=xls")
這只是給我一個像這樣開始的字符串:
[1] "FantasyPros.com \t \nWeek 8 - QB Rankings \t \nExpert Consensus Rankings (ECR) \t \n\n Rank \t Player Name \tTeam \t Matchup \tBest Rank \t Worst Rank \t Ave Rank \t Std Dev \t\n1\tPeyton Manning\tDEN\t vs. WAS\t1\t5\t1.2105263157895\t0.58877509625419\t\t\n2\tDrew Brees\tNO\t vs. BUF\t1\t7\t2.6287878787879\t1.0899353819483\t\t\n3\tA...
*我也忘了補充一點,我還需要考慮排除xls文件的前4行(第5行=列標題) – hianalytics