我對R非常陌生,我很努力去理解如何以特定方式省略NA值。我有一個很大的數據框與多列(最多40)和行(最多200ish)。我想使用其中一列的數據來做簡單的統計(wilcox.test,boxplot等):一列有連續變量(V1),而另一列有二進制變量(V2; 0或1),其中分爲2組。我想爲連續變量使用不相關的不同V2二進制變量做到這一點。我在Excel中組織這些數據,將其保存爲CSV並使用R Studio。當分析數據來自一個非常大的數據幀的2列時,在特定行中省略NA
所有這些列都有散佈的NA值,而且當我使用omit.na時,它會將NA值存在的每一行都取下,這會消除可怕的數據負載。有沒有簡單的解決方案來做到這一點?我已經看到類似主題的一些答案,但沒有一個看起來完全是我需要做的。
非常感謝您的任何答案。再次,我是R的寶貝級新手,可能忽略了其他主題中的某些內容!
那麼你想要的輸出是什麼呢?你想要刪除一整行取決於只有在某些列而不是整個數據集的「NA」值? –
大衛嗨!確切地說,我想省略每一個配對結果,也就是說,如果我在任何一行中只考慮兩列感興趣的列(V1和V2,比V1和V3等等),我想省略整行wilcox測試可以正常工作,而無需爲每對列創建單獨的CSV並在每個df中運行na.omit。非常感謝您的幫助! –