我試圖用R.應堅持HTML文檔到磁盤
str_url <- "https://www.holidayhouses.co.nz/Browse/List.aspx?page=1"
read_html_test1 <- xml2::read_html(str_url)
xml2::write_xml(read_html_test1, "testwrite.html")
read_html <- xml2::read_html("testwrite.html")
約300 HTML對象保存到磁盤上,而這最終將大約300單獨的文件保存到磁盤。理想情況下,我希望將單個R對象保存到包含這300個文檔的磁盤。
由於某種原因,在保存之前將每個文檔轉換爲文本不起作用。例如,下面將產品的一些怪異(無益)錯誤:
str_html <- as.character(read_html_test1)
xml2::read_html(str_html)
如果我嘗試使用的xml2::read_html()
輸出它是一個指向一個C的結構,因此,這將不會持續到磁盤。
任何建議讓黑客做這項工作......?
把它們放在一個列表,然後使用'saveRDS'? – alistaire
無法使用@alistaire。 saveRDS創建的對象不包含數據...只是一些指向c對象的指針。 :( – markthekoala