我的數據集testdata
有2個變量命名PWGTP
和AGEP
變量名稱越來越受損,我該如何預防或修復?
的數據是在.csv
文件。
當我這樣做:
> head(testdata)
的變量顯示爲
ï..PWGTP AGEP
23 55
26 56
24 45
22 51
25 54
23 35
所以,出於某種原因,R是閱讀PWGTP
爲ï..PWGTP
。沒什麼大不了的。
然而,當我使用一些功能來引用變量ï..PWGTP
,我得到的消息:
Error: id variables not found in data: ï..PWGTP
同樣,當我使用一些功能來引用變量PWGTP
,我得到的消息:
Error: id variables not found in data: PWGTP
2個問題:
有什麼我應該做的源文件,以防止改變變量名
PWGTP
?將
ï..PWGTP
重命名爲其他內容應該是微不足道的 - 但R
無法找到名爲這樣的變量。你對如何修復變量名的想法?
如果您知道您正在閱讀的列數和名稱順序,您可以使用'names(testdata)< - c(「PWGTP」,「AGEP」,...)' –
在我看來,像一個可能的編碼問題......您的輸入文件是否爲帶有BOM的UTF-8? –
@DominicComtois它可能是'.csv'編碼問題。我有一個更大的數據集,變量名顯示正常。我通過複製和粘貼較大數據集的前幾百行(和標題行)來創建'testdata'。在這個過程中出現了問題。然而,在文本編輯器或Excel中檢查'testdata'看起來很正常。所以我很想找到解決辦法,以防將來發生這種情況。 –