我在閱讀具有固定列長度格式的文件時遇到了一些麻煩。一些列可能包含變音符號。變音和切片
變音器似乎使用2個字節而不是1個。這不是我期待的行爲。有什麼樣的函數返回一個子字符串?切片在這種情況下似乎不起作用。
下面是一些示例代碼:
http://play.golang.org/p/ZJ1axy7UXe
umlautsString := "Rhön"
fmt.Println(len(umlautsString))
fmt.Println(umlautsString[0:4])
打印:
5
Rhö
感謝您的回答。我沒有意識到可以轉換爲'[]符文 - 這將允許我清理一些最近的代碼。 –
「UTF-8字符編碼爲符文」毫無意義。你能否澄清,重寫或刪除它? – rightfold
@rightfold你很粗魯。它至少對另外9個人有意義,所以刪除答案是毫無疑問的。你可能已經很好地要求澄清,但在這種情況下,你似乎懶得跟隨nemo發佈的任何一個鏈接,這兩個鏈接都詳細解釋了什麼是符文。 – fresskoma