0
A
回答
1
對於刮削部分這裏是一些起動碼。
library(XML)
rootUri <- "http://donttreadonme.co.uk"
doc <- htmlParse(paste0(rootUri, "/rubinius/index.html"))
links <- xpathSApply(doc, "//a/@href")
links <- grep("rubinius/2014", links, value = TRUE)
links <- gsub("..", "", links, fixed = TRUE)
messages <- lapply(links[1:5], function(l) {
doc <- htmlParse(paste0(rootUri, l))
readHTMLTable(doc, which = 1, header = FALSE)
})
messages <- do.call(rbind, messages)
## V1 V2
## href.1 00:33:57 travis-ci
## href.2 05:04:23 travis-ci
## href.3 05:27:44 travis-ci
## href.4 10:00:59 yorickpeterse
## href.5 13:23:36 yorickpeterse
## href.6 13:23:53 yorickpeterse
## V3
## href.1 [travis-ci] rubinius/rubinius/master (fcc5b8c - Brian Shirai): The build passed.
## href.2 [travis-ci] rubinius/rubinius/master (901a6bc - Brian Shirai): The build was broken.
## href.3 [travis-ci] rubinius/rubinius/master (5cffe7b - Brian Shirai): The build was fixed.
## href.4 morning
## href.5 oh what the fuck RubyGems, why do you need the ext builder during runtime?
## href.6 this better not be because I forgot --rubygems ignore
相關問題
- 1. 文本挖掘庫或語言庫?
- 2. 將R用於文本挖掘Reuters-21578
- 3. 文本挖掘單個文本文檔
- 4. [R文本挖掘包:允許把新的文件到現有的語料庫
- 5. 新聞文章和標題的免費文本挖掘語料庫
- 6. 將兩列文本文檔轉換爲單行文本挖掘
- 7. R - 文本挖掘 - 導入語料庫並保存文檔名稱矩陣中的文件名
- 8. 帶r庫的文本挖掘stringdist
- 9. 用於MPI的數據挖掘庫
- 10. 文本挖掘中的R
- 11. R文本挖掘 - 處理複數
- 12. 中文文本挖掘
- 13. 的Oracle SQL導航數據挖掘文本挖掘
- 14. 文字挖掘MS Word文檔?
- 15. [R文本挖掘問題
- 16. stemDocument [R文本挖掘
- 17. 文本挖掘:在Python
- 18. 如何使用文本挖掘進行文檔分析?
- 19. 音頻挖掘和語音處理
- 20. 挖掘維基百科映射文本挖掘關係
- 21. R採用量化的文本挖掘
- 22. 用於文本處理(文本挖掘,信息檢索,自然語言處理)的Python或Java
- 23. Apriori算法挖掘XML文檔
- 24. 從CSV文件中獲取R文本挖掘文檔
- 25. PHP - 文本挖掘緩慢過程的文本預處理
- 26. hadoop的數據挖掘庫
- 27. 文本挖掘庫或算法來檢索所需的文本?
- 28. 文本挖掘,事實抽取,使用.Net的語義分析
- 29. 使用R的阿拉伯語文本挖掘
- 30. R數據挖掘語法