我最近開始了作爲ETL開發人員的工作,並且作爲練習的一部分,我從包含原始數據的文本文件中提取數據。我的原始數據如圖所示。 My Raw Data使用python將分隔符添加到文本文件
現在我想爲我的數據文件添加分隔符。基本上在每行之後,我想添加一個逗號(,
)。我在Python中的代碼看起來像這樣。
with open ('new_locations.txt', 'w') as output:
with open('locations.txt', 'r') as input:
for line in input:
new_line = line+','
output.write(new_line)
其中new_locations.txt
是輸出文本文件,locations.txt
是原始數據。
但是,它一直拋出錯誤。
UnicodeDecodeError: 'charmap' codec can't decode byte 0x81 in position 3724: character maps to
我究竟在哪裏出錯?
Note: The characters in raw data are not all ASCII characters. Some are Latin characters as well.
你能讀取沒有這些錯誤的整個文件嗎? –
@DanielLee不,我無法閱讀整個文件。我只能讀取它直到出現ASCII字符。一旦其他角色開始,他們會拋出一個錯誤。 –