2
我想解析一些HTML文檔,似乎Racket的html和xml庫不能很好地處理這個問題。例如,這裏是一個HTML文檔:Racket中的HTML解析問題
<!DOCTYPE html>
<html>
<head>
<meta charset="utf-8" />
<title>Test</title>
<script>
var k = "<scr";
</script>
</head>
<body>
</body>
</html>
無論read-html
也不read-xml
可以解析此。他們認爲var k = "<scr"
中的<scr
是開標籤的一部分。
那麼,有沒有更好的方法來做到這一點?
根據http://planet.racket-lang.org/package-source/neil/html-parsing.plt/2/0/planet-docs/doc/index.html,HtmlPrag已經過時。 [html-parsing](http://planet.racket-lang.org/display.ss?package=html-parsing.plt&owner=neil)似乎工作。 – EFanZh
@FanZh對不起,我感到困惑。我通過同一作者鏈接到該軟件包的更新版本更新了我的答案。 –