1
在網頁上使用xmlstarlet時,我大部分時間都面臨實體引用錯誤。 這使得它從網頁中提取無用。xmlstarlet解析器錯誤:實體'*'未定義
爲HTML頁面沒有良好的XML(有一些選項來處理HTML也?) 我將它們轉換與
tidy -asxhtml
到XHTML,這裏整齊放聲明
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
然後用xmlstarlet處理後
curl http://www.xfree86.org/current/index.html | tidy -asxhtml | \
xmlstarlet sel --net -T -t -m hr -v . -
it throw always s ame error
-:13: parser error : Entity 'reg' not defined
<h1>Documentation for XFree86® version 4.8.0</h1>
有沒有人知道如何讓xmlsttarlet知道實體引用文件。
更正了-asxml,-asxhtml選項的不匹配。 – Sharad 2011-03-17 08:18:50