所以「RetailSales2014」包含貨幣價值。我知道我需要刪除逗號來執行統計分析,但我是否也需要刪除前導'$'符號?如果我這樣做,我將如何刪除它們?如何獲得「RetailSales2014」列的統計信息?
# Load packages
庫( 「XML」) 庫( 「RCurl」)
指定URL
網址< - 「https://nrf.com/2015/top100-table」
下載URL的內容
url_content < - getURL(url)
解析HTML/XML內容以產生表示HTML/XML樹的R結構
DOC < - htmlParse(url_content)
表< - readHTMLTable(DOC)
轉換的第三元件列表中的數據幀
retailer_df < - data.frame(表)
屬性(retailer_df)
分重命名retailer_df列
colnames(retailer_df)< - C( 「等級」, 「公司」, 「總部」, 「RetailSales2014」, 「USASalesGrowth」, 「WorldwideRetailSales」, 「USAPercentageOfWorldwideSales」, 「Stores2014」 , 「保增長」)
摘要(retailer_df)
寫零售商的數據爲csv文件的工作目錄下
write.csv(retailer_df,文件= 「top100retailers2015.csv」)
工作正常!我們的教授將教我們如何在本週晚些時候這樣做,但我想在理解數字轉換方面取得先機。 – user6794408
等等...我幫你做了功課嗎? SMH。 – AidanGawronski
否。該作業已使用我提供的代碼完成。其中一個問題是「顯示數據集的彙總統計數據,您是否獲得RetailSales2014變量的最小,中位數,平均值和最大值?爲什麼?將答案放在下面的框中。」這是確切的措辭。我不是作弊,坦率地說,我認爲這個社區對試圖學習R的學生不是很歡迎.... – user6794408