在使用硒時,剛纔我解析selenium的輸出getPageSource()
方法時出錯。 使用具有硒火狐驅動火狐=Selenium Web驅動程序getPageSource()錯誤的包含轉義值的屬性和值
<meta name="news_keywords" content="devo max,independence vote,no campaign,referendum,scotland \"no\" vote,scotland independence,scotland powers,scotland referendum,scotland vote,scottish referendum" />
getPageSource()方法結果的網頁源代碼的實際元標記=
<meta referendum"="" vote,scottish="" referendum,scotland="" powers,scotland="" independence,scotland="" vote,scotland="" no\"="" content="devo max,independence vote,no campaign,referendum,scotland \" name="news_keywords" />
它非常荒謬和創建的HTML輸出的進一步的處理的問題。 任何建議或幫助或解決方法?
任何方式得到它的事情應該是這樣的來源是什麼?我的意思是正確的方式? – 2014-09-23 07:30:01