2014-09-18 102 views
-1

只是一個簡短的問題分開非結構化數據......有人plz幫助我如何讀R中的下列文本文件..如何閱讀#R中

如果#(分隔符)是彼此相鄰。 ..這意味着缺失值...

任何想法?或小費?謝謝你的種類

20040215#680# - 。6#7.6#1457#-7.3#735#1.2#340.3#13.6#1427#0#0 ## - 7.3#735#7.6#1457 ## = 18#680#0.4#11.1#1541#-7.3#635#0.9#130.1#6.6#1137#0#0 ## - 7.3#635#11.1#1541 ## = 20040221#680 ########## 7#2#1600#1.7#559#7.3#1604 ## = 98835
20040222#680 ########## 1 #### #6.8#1108 ## = 98836
20040223#680 ########## 0#0 #### 6.8#1602 ## = 98837

+0

所以你說'# '是文件分隔符,它也代表NA值?你可以看看你的例子在讀入R之後應該看起來像什麼嗎? – 2014-09-18 16:14:43

+0

你嘗試了什麼?它看起來像'scan'和'strsplit'可以提供幫助。 – DrDom 2014-09-18 16:15:31

+0

@Jacob Green 6 upvotes並沒有被接受? – akrun 2014-09-19 20:45:02

回答

6

這似乎做了相當整潔的工作 - 只是告訴read.table分離哈希和不使用哈希作爲註釋(否則事情負荷擔心迷路評論):

> read.table("hash.hsv",sep="#", comment="") 
     V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V11 V12 V13 V14 V15 
1 20040215 680 -0.6 7.6 1457 -7.3 735 1.2 340.3 13.6 1427 0 0 NA -7.3 
2  18 680 0.4 11.1 1541 -7.3 635 0.9 130.1 6.6 1137 0 0 NA -7.3 
3 20040221 680 NA NA NA NA NA NA NA NA NA 7 2 1600 1.7 
4 20040222 680 NA NA NA NA NA NA NA NA NA 1 NA NA NA 
5 20040223 680 NA NA NA NA NA NA NA NA NA 0 0 NA NA 
    V16 V17 V18 V19  V20 
1 735 7.6 1457 NA = 98829 
2 635 11.1 1541 NA = 98834 
3 559 7.3 1604 NA = 98835 
4 NA 6.8 1108 NA = 98836 
5 NA 6.8 1602 NA = 98837