我是XPath新手,但我可以看到它有多強大。我正在查看此link的源代碼,並且只是想從以下兩頁中提取內容和用戶名,爲簡單起見,它們位於源代碼的頂部附近。使用XML包的R內的XPath
CONTENT = 「[文字] Simburgur的Live 流[在線]戰爭機器3」
<div class="username">Simburgur</div>
這裏爲R內我的代碼:
doc <- htmlParse("http://forums.epicgames.com/archive/index.php/t-672775.html")
xpathSApply(doc, "//head/meta[@name=\"description\"]")
返回
[[1]]
<meta name="description" content="[Archive] Simburgur's Live Stream [Offline] Gears of War 3" />
很顯然,在這個例子中,我所需要的只是內容引用內部的東西=但是卡住了,似乎無法讓我的表達式返回我想要的字符串。
我重複一遍。我是XPath新手。 :)
好問題,+1。看到我的答案是兩個簡短有效的解決方案。 :) – 2011-02-02 04:19:36