我正在使用readLines
以文本格式讀取數據文件。第一個'列'是我不需要的複雜文本。下一列包含我確實需要的數據。第一個'列'和數據由冒號(:)分隔。我希望在第一個冒號分割每一行並刪除結果文本字符串,只保留數據。在第一個冒號處分割字符串
下面是一個示例數據文件。一個潛在的複雜情況是一行數據包含多個冒號。這條線可能在某個時候成爲我的頭。所以,我可能不應該在每個結腸,就在第一個結腸分裂。
my.data <- "first string of text..: aa : bb : cc
next string ........ : 2 0 2
third string......1990: 7 6 5
last string : 4 2 3"
my.data2 <- readLines(textConnection(my.data))
my.data2
我試圖在這裏提出代碼:
Split on first comma in string
這裏:以上在第一個鏈接
R: removing the last three dots from a string
代碼似乎只在第一個冒號分割第一行。第二個鏈接中的代碼可能會做我想做的,但對於我來說太複雜了,無法對其進行成功修改。
下面是我希望得到的數據,在這一點上,我可以用一個很簡單的gsub
語句簡單替換第一行空的空間在剩餘的冒號:
aa : bb : cc
2 0 2
7 6 5
4 2 3
很抱歉,如果這是一個重複我沒有找到我的帖子,並感謝您的任何建議或協助。
謝謝你的回答和傑出的解釋。 –
+1的解釋 –