我有一個數據集,需要大量的格式化清理,並且在某些時候我想計算研究人員在釣魚的時間。如果捕魚開始和停止的時間是正常格式,這很容易,但由於某些原因數據不是有用的十進制格式。例如,早上10:45記錄爲10.45,而11:10將是11.10。將時間重新格式化爲可以操縱的數據
我已經試過要求Excel用冒號替換所有的句點(它不會這樣做,而其他人已經試圖幫助我使Excel合作)。我可以考慮一些在R中這樣做的方法,但我不知道如何繼續。首先,如果有一些方法可以將小數點後面的部分除以60,那麼十進制格式將是有意義的。那麼,10.45將是10.75,減法不成問題。或者,它也會工作,只是寫一些簡單的代碼來代替冒號的時期,然後(我在想?)使用類似chron軟件包的方式來處理它。
我不知道如何編碼這些選項 - 有沒有人有任何建議?我認爲除以60可以通過在期間之前和之後分解碎片的功能來實現(如粘貼的反面),但是我找不到這種功能的名稱。第一個也是我想象的更簡單,雖然第二個實際上可能揭示了我在R中遇到的一個更大的問題,該問題試圖弄清楚如何使命令變得一般化。我明白我該如何強制它將10.45改爲10:45,但是我希望我知道是否有一種格式只是爲了說「XX.XX並改爲XX:XX」而不管實際的數字是什麼。但我想一次只有一件事。
發表一個簡短的例子。最好使用'dput(head(X))'(其中'X'是你的數據集)來產生這個,以避免混淆。 –
Time.Start = c(9.10,9.10,9.10,10.10,9.10,10.10),Time.Stop = c(14.25,14.25,14.25,14.25,14.25,14.25) (我已經有很多重複有辦法處理) – HFBrowning
@HFBrowning。將來,請編輯您的問題,而不是在評論中回覆。 –