從csv讀取unicode字符時遇到問題。 CSV文件原本Unicode的標籤要素:從CSV讀取Unicode
"[u'Aeron\xe1utica']"
"[u'Ni\u0161']"
"[u'K\xfcnste']"
...
從中我不得不刪除U '' 標籤給一個CSV與
Aeron\xe1utica
Ni\u0161
K\xfcnste
....
現在我想讀的CSV和輸出入與字符的文件,即
Aeronáutica
Niš
Künste
....
我試圖在csv docs使用UnicodeWriter,但它給人的輸出作爲第二列表
這裏同樣是我所做的讀寫:
c = open('foo.csv','r')
r = csv.reader(c)
for row in reader:
p = p + row
#The elements in p were ['Aeron\\xe1utica', 'Ni\\u0161', 'K\\xfcnste'...]
c = open('bar.csv','w')
c.write(codecs.BOM_UTF8)
writer = UnicodeWriter(c)
for row in p:
writer.writerow([row])
我也試過codecs.open ('','','UTF-8'),但它沒有幫助
不,你*不*需要刪除'u'。這些是Unicode值,你*想*統一碼值。 –
當讀取帶有編碼字符的CSV時,爲什麼不使用'UnicodeReader'? –
澄清:是否[u'Aeron \ xe1utica']是文件中的文字 - 如果不是 - 是什麼? –