閱讀不同格式的文件有效r中

我有以下文件閱讀不同格式的文件有效r中

*NEWRECORD 
MH = Public Service Announcements as Topic 
AQ = CL EC ES HI LJ SN ST TD UT 
MN = L01.143.805 
UI = D066308 

*NEWRECORD 
RECTYPE = D 
MH = Public Service Announcements 
MN = V02.736 
MH_TH = NLM (2016) 
ST = T170 
DA = 20150701

的格式基本上我上面有我的文件內容。我的目標是獲得MH和MN值。該文件很大，主要以上述格式。

來源

2016-01-29 user1631306

我會尋找一個解決方案，使用sed或awk預處理文件。 – Roland

Will這樣的工作？

d <- readLines('mydata.txt') # Read in data 
out <- strsplit(d[grep(pattern = "MH|MN", x = d)], ' = ') #Look for those lines 
do.call(rbind, out) # Bind it together

如果您想指出它來自哪個記錄，您可能需要在將它綁定在一起之前添加一個id列。

來源

2016-01-29 14:57:19

閱讀不同格式的文件有效r中

回答

相關問題