我有2.000+個表格,其中有幾百個表格,我從Web服務(植物學名稱)下載並保存到磁盤以供進一步檢查。如何引用R中的不同數據框架
由於一些文本字段有回車,我決定引用一切。但是有些領域有「角色,其他角色」,所以這些角色不能用於引用(我可以嘗試逃避它們,但有些已經逃脫了,這很容易變成一團糟,我認爲這會更容易使用不同的引用字符)我嘗試%,只是發現一些字段也使用這個字符,所以我需要一些不同的東西,我嘗試了¨☺π和人,但似乎沒有任何工作,它們全部在屏幕上正確顯示(在Ubuntu 14.04中的RKWard),所有的都用write.table正確保存,但NONE可以用read.table或read.csv讀取,我使用UTF-8作爲fileEncoding,我得到消息「invalid multibyte string」,即使☺(這是ASCII 1個字符)。
Sys.getlocale(category="LC_ALL")
給
"LC_CTYPE=en_US.UTF-8;LC_NUMERIC=C;LC_TIME=pt_BR.UTF-8;LC_COLLATE=en_US.UTF-8;LC_MONETARY=pt_BR.UTF-8;LC_MESSAGES=en_US.UTF-8;LC_PAPER=pt_BR.UTF-8;LC_NAME=pt_BR.UTF-8;LC_ADDRESS=pt_BR.UTF-8;LC_TELEPHONE=pt_BR.UTF-8;LC_MEASUREMENT=pt_BR.UTF-8;LC_IDENTIFICATION=pt_BR.UTF-8"
我試過改變語言環境爲中文,使用人(不應該需要,我想,因爲它顯示和保存正確),但也沒有工作。我得到
OS reports request to set locale to "chinese" cannot be honored
OS reports request to set locale to "Chinese" cannot be honored
OS reports request to set locale to "zh_CN.utf-8" cannot be honored
現在最奇怪的:如果中國字符是數據的主體,他們沒有問題讀。看起來他們不能像引號一樣去!
任何想法?提前致謝。
「由於一些文本字段有回車符,我決定引用所有內容。」爲什麼?你不希望回車破折線?我認爲你的解決方案可能與你真正想要完成的任何事情有關,而不是使用非標準字符作爲引號。 – Molx
回車位於文本字段內,所以如果沒有正確引用它們就會弄亂表格。回車後的文本成爲下一行的第一個字段,下一個字段成爲下一行的第二個字段,依此類推。 – Rodrigo
另外,如果read.table可以選擇包含ANY字符作爲引號,那麼爲什麼系統的其他部分會如此奇怪呢? – Rodrigo