1
美麗的湯似乎無法正常工作(對我來說),如果HTML包含Unicode的ASCII超過128.什麼合適的解碼編碼應該用於此?通過美麗的湯解析HTML與Unicode的問題
raw = open('index.html').read()
BeautifulSoup.BeautifulSoup(raw)
錯誤
...stacktrace...
UnicodeEncodeError: 'ascii' codec can't encode character u'\xe9' in position 8094: ordinal not in range(128)
如果您不能使用** print **語句,您將如何解決此問題? (在這裏看到更多:http://stackoverflow.com/questions/7769745/python-convert-and-save-unicode-string-to-a-list) –
你不需要,這是整個點。當您在控制檯中輸出時,這只是一個問題。 –