2011-10-11 88 views
1

使用foreign包,我正在讀取.sav文件。當我用PSPP打開文件時,有95個變量。但是,read.spss("file")以353個變量的列表作出響應。額外的變量是空白填充字段,有220個空格。有沒有人經歷過這個?read.spss額外變量/字段

在問你之前,我無法提供一個可重複的例子,因爲數據文件及其內容是專有的。

一個顯而易見的解決方案是搜索僅包含空格的列表元素,並將它們的列表元素設置爲NULL或每個具有220個空格的元素爲NA,然後放置NA列。

但我想避免必要時進一步後處理我的文件。有沒有人有這方面的修復?

+1

您可以嘗試導出到SPSS中的'便攜式'文件(* .por),並在R中打開(也使用'read.spss')。我在某處經常更可靠地閱讀這篇文章,但是現在它讓我在某個SPSS數據集上失敗了,而第二個工作。或者試着將數據集保存到一個新文件中,做一些這樣的事情,幫助我一次,顯然它會重寫可能會清理問題的整個文件結構。祝你好運! – ROLO

+0

@ROLO我會盡力的,謝謝! –

回答

2

我以前有過類似的東西。數據從SPSS CATI(實地訪談應用程序)輸出時發生,而不是我們所知和所愛的SPSS。

在我的情況下,分辨率是與參數玩到read.spss。我發現,設置use.missings=FALSE解決了這個問題,即是這樣的:

read.spss(global$datafile, to.data.frame=TRUE, use.missings=FALSE) 

祝你好運,我的同情。我知道這對我來說有多令人沮喪。

+0

+1這裏沒有骰子,但完全值得一試。 –