我基本上有以下代碼:如何處理fileinput中無效的utf8?
def main():
for filename in fileinput.input():
filename = filename.strip()
process_file(filename)
的腳本採用文件名作爲其輸入的新行分隔的列表。但是,某些文件名稱包含無效的utf8,這會導致fileinput.input()
崩潰。我讀過surrogateescape
錯誤處理程序,我認爲這是我想要的,但我不知道如何爲fileinput設置錯誤處理程序。
總之:我如何得到fileinput
來處理無效的Unicode?