2017-08-27 46 views
0

這裏列出是我的代碼:從文件中的每一行讀在Python

with open(path) as file: 
    lines = file.readlines() 
    print lines[0:5] 

但是我得到許多額外的字符,例如:

['cat2\xc2\xa0\xc2\xa0 2\xc2\xa0 0', 'cat1\xc2\xa00.5\xc2\xa0 0', 'cat2\xc2\xa0\xc2\xa0 1\xc2\xa0 0', 'cat1\xc2\xa0\xc2\xa0 0\xc2\xa0 0', 'cat2\xc2\xa0\xc2\xa0 0\xc2\xa0 3'] 

爲什麼我讓他們?

原始文本文件是這樣的:

cat2   2  0 
cat1 0.5  0 
cat2   1  0 
cat1   0  0 
cat2   0  3 
+0

看起來就像你在你的文件奇怪的字符... –

+0

因爲凡正試圖重新打開這樣的:所有的成分來解決這個問題是在鏈接的重複。 –

回答

2

\xc2\xa0non-breaking space。將其替換爲文件中的常規空格。

該序列出現在許多編碼中,包括UTF-8

查看更多關於Wikipedia

+0

你可以添加這些字符被發現的格式嗎? – Prajwal

相關問題