我在嘗試下載以下網站的完整源代碼: http://www.carnegiehall.org/Students/。在R中使用htmlParse()時缺少網站源代碼
我想提取的信息是以下部分:
卡內基音樂廳呈獻
週四,2013年3月28日| 7:30 PM
勞倫斯·布朗利
馬丁·卡茨
·贊克廳
查看源文件顯示的代碼文本以下塊:
<div class="info-col">
<div class="up-lic">Carnegie Hall Presents</div>
<div class="date">Thursday, March 28, 2013 | 7:30 PM</div>
<div class="clearfix"></div>
<div class="title color">
<a href="/Calendar/2013/3/28/0730/PM/Lawrence-Brownlee-Martin-Katz/">Lawrence Brownlee<BR>Martin Katz</a>
</div>
<div class="clearfix"></div>
<div class="location"> Zankel Hall</div>
<div class="clearfix"></div>
<br />
一個缺少當我在R中運行以下內容時:
htmlParse(getURL("http://www.carnegiehall.org/Students", .opts = curlOptions(followlocation=TRUE)), asText = TRUE)
任何人都可以告訴我我做錯了什麼嗎?