我有一個Ruby/Rails應用程序,並試圖屏幕刮一頁來獲取一些數據。這裏的HTML是什麼樣子:如何解析HTML頁面中的特定javascript變量?
<html>
<head>
...
</head>
<body>
<h1>Blah</h1>
<script type="text/javascript" language="JavaScript">
var foo = "abc";
var bar = {interesting_json_here};
var baz = "xyz";
</script>
Other uninteresting content and tags here
</body>
</html>
我不關心什麼除了欄的內容。
如何獲得酒吧,然後遍歷它來解析json酒吧的內容?
它「依賴」 - 你能給出一個json的樣本 - 儘量貼近現實。如果bar包含在一行中,並且僅在頁面中出現一次,那麼您可能很懶,並使用正則表達式來提取它。因爲替代方法 - 使用DOM提取JavaScript塊然後解析Javascript更困難。 – 2012-02-16 00:05:18