0
我一直在研究Outlook導入(將導出鏈接到Outlook格式),但我遇到了編碼問題。從導出我的LinkedIn聯繫人中獲得的Outlook格式CSV不是UTF-8格式。當致電str.to_s.mb_chars.normalize
時,像ñ
這樣的字母會在mongoid_search
寶石中造成異常。我認爲編碼是問題,因爲當我撥打mb_chars
(see first code example)。我不確定這是否是寶石中的一個錯誤,但我仍然被建議清理數據。如何將文件編碼爲Rails 3的UTF-8?
從File Picker中,我嘗試使用他們新的社區支持的gem來上傳CSV數據。我試過三種編碼檢測器和轉碼器:
-
一個Python的
- 紅寶石出口11b
chardet
- 沒有按預期工作
- 將仍然包含Python代碼,防止它在我的應用程序運行的端口
rchardet19
寶石- 檢測
iso-8859
與.8/1
吐露NCE。 - 試圖用語言Iconv進行轉碼,但在
ñ
- 檢測
Charlock_Holmes
寶石- 檢測
windows-1252
與33/100
信心 - 墜毀,機上 「非法字符」 我認爲這是實際的編碼,並
rchardet
了iso-8859
因爲這個基於那個。 - 這個寶石使用ICU,並有一個支持Heroku的維護分支「bundle-icu」。當我嘗試使用
charlock
轉碼,我得到的錯誤U_FILE_ACCESS_ERROR
,ICU的錯誤代碼,意思是「無法打開文件」
- 檢測
有人知道這裏做什麼?