0
我有兩個問題:)RSS解析器+ unicode的解碼(蟒蛇)
我的IRC bot的,我在延長勞動。它應該檢查rss是否有新內容併發布到頻道。我正在使用feedparser。我發現的唯一方法是將每個新內容存儲到文件中,每隔幾分鐘下載rss內容並將其與文件中的內容進行匹配,這在我看來有點奇怪。有沒有簡單的方法來檢查rss中是否有新內容? Thx
當我將內容保存到文件時,有時某些部分由unicode(捷克語中的特殊字符)編碼 - u「xxx」。但我想將它們保存爲utf8文件。我該怎麼做?
2.嗯,這正是我正在做的,但結果是SecurityWorld.cz:AVGpÅedstavilsvábezpeÄnostnÃÅÅÅ¡enver vez 2013而不是SecurityWorld.cz:AVGpředstavilsvábezpečnostnířešeníve verzi 2013這是正確的版本我得到,當我例如打印它。 – user1505497
@ user1505497:文件中的數據是UTF-8,您正在嘗試將其讀作latin1。編寫數據的python代碼工作,它是失敗的文件的*加載*。 –
latin1?當我嘗試編碼到latin1我得到UnicodeEncodeError:'拉丁-1'編解碼器不能編碼字符u'\ u0159'在位置23:序號不在範圍(256)。那麼我真的很困惑所有這些編碼.. – user1505497