我的RSS的理解 「HTML逃脫」 是這樣的:RSS逃脫HTML
HTML:
1 < 3
變(RSS):
1 &lt; 3
這樣的話,應該此:
<img src="http://somehost/someimage?a=foo&b=bar" />
成爲:
<img src="http://somehost/someimage?a=foo&amp;b=bar" />
(注意&amp;
如果是的話,這是無效的RSS?
<description>
...
<img src="http://d.yimg.com/a/p/ap/20110309/capt.f6...02-0.jpg?x=91&y=130&q=85&sig=6oI7fIgN0izc9olfgY56vw--" />
</description>
(此外,是一個事實,即關閉>不逃脫壞?)
上述<描述的是我有>的問題是,一旦你解碼第一實體層(XML)到達<描述>標記的內容時,您會得到一個長的CDATA,它應該是HTML。問題是<img>只有一個&
,這是一個無效的實體。對於上面的大塊,我得到類似<img src="....?x=1&y=2" />
,這是不合法的HTML。
我只是看着闖入RSS的糟糕的HTML,或者我在這裏錯過了什麼?
''是無效的,但瀏覽器可以處理它,所以它是非常有可能的原始的HTML沒有正確逃生的SRC屬性中的&符號。非轉義的'>'當然不是一件好事,但是再次,也許飼料讀者不會窒息它。這兩件事情都做得不好,但可以在寬容的客戶中工作。 – 2011-03-09 20:32:24
這大部分是我的想法......我試圖讓頁面在http://validator.w3.org/ – Thanatos 2011-03-09 20:44:49