-1
我有這樣的代碼(警告:對URL內容僅供大人!)爲什麼我會得到'UnicodeEncodeError'?
# Encoding: UTF-8
import re
import requests
# import chardet
html = requests.get('http://klonedaset.org/news.php?sid=51854&bn=luRsF2aAa6eV63nU71Jm&ad=0&ref=&pt=&cookie=null&cls=null').text
text = re.findall('target=_blank id=.*?>(.*?)</a>', html)[0]
# print chardet.detect(text) return this "{'confidence': 0.9599621544520228, 'encoding': 'windows-1251'}"
open('file12.txt', 'a').write(text)
而且我得到的最後一行這個錯誤(其中我在文件中寫入)
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-2: ordinal not in range(128)
我想這樣做
html = html.decode(windows-1251').encode('UTF-8')
但它不起作用。我必須用UTF-8寫入文件!
此外,網址很奇怪,它會產生一個破損的頁面。 –
meh ..我只是得到高風險的網站被鉻封鎖......但我想我會解決他看到的問題 –
我不會阻止本網站或不,但你可以看到一個圖片和文本在Windows-1251 。另外,親愛的喬蘭,進入文件寫這樣的想法「Ñûíîñïîëüçîâàëëñÿïüÿíûìæåëàíèåììàòåðè!」 :( –