2012-10-29 36 views
0

我一直在研究Outlook導入(將導出鏈接到Outlook格式),但我遇到了編碼問題。從導出我的LinkedIn聯繫人中獲得的Outlook格式CSV不是UTF-8格式。當致電str.to_s.mb_chars.normalize時,像ñ這樣的字母會在mongoid_search寶石中造成異常。我認爲編碼是問題,因爲當我撥打mb_charssee first code example)。我不確定這是否是寶石中的一個錯誤,但我仍然被建議清理數據。如何將文件編碼爲Rails 3的UTF-8?

從File Picker中,我嘗試使用他們新的社區支持的gem來上傳CSV數據。我試過三種編碼檢測器和轉碼器:

    一個Python的
  1. 紅寶石出口11b chardet
    • 沒有按預期工作
    • 將仍然包含Python代碼,防止它在我的應用程序運行的端口
  2. rchardet19寶石
    • 檢測iso-8859.8/1吐露NCE。
    • 試圖用語言Iconv進行轉碼,但在ñ
  3. Charlock_Holmes寶石
    • 檢測windows-125233/100信心
    • 墜毀,機上 「非法字符」 我認爲這是實際的編碼,並rchardetiso-8859因爲這個基於那個。
    • 這個寶石使用ICU,並有一個支持Heroku的維護分支「bundle-icu」。當我嘗試使用charlock轉碼,我得到的錯誤U_FILE_ACCESS_ERROR,ICU的錯誤代碼,意思是「無法打開文件」

有人知道這裏做什麼?

回答

相關問題