2012-12-28 20 views
0

有沒有人在Ubuntu中使用過cedergren數據集。我有問題下載它,因爲我有Ubuntu操作系統。它基本上用於logistic迴歸Cedergren數據集在Ubuntu下載

http://nlp.stanford.edu/~manning/courses/ling289/cedegren-varbrul.html

將使用GLM FUNC,看看它是如何工作的這個數據集

任何幫助表示讚賞!

+0

你的問題是什麼?看起來您將不得不在WINE下運行Windows版本,如參考頁面所示。 ('apt-get install wine') –

+0

@BenBolker我認爲這將用於安裝goldvarb軟件,我只想讀取數據cedergren並在R中使用它(基本上想要應用glm func) – getitstarted

+0

明白了: http://www.cloudstat.org/index.php?do=/attachment/download/id_95/ – getitstarted

回答

0
> require(utils) 
> inp <- read.fwf(file=url("http://www-nlp.stanford.edu/~manning/courses/ling236/handouts/panama-mac.tok"), 
       widths=rep(1, 5), colClasses=c("NULL", rep("factor",4))) 
> str(inp) 
'data.frame': 8955 obs. of 4 variables: 
$ V2: Factor w/ 3 levels "0","1","L": 2 2 2 2 2 2 2 2 2 2 ... 
$ V3: Factor w/ 6 levels "a","A","d","m",..: 4 4 4 4 4 4 4 4 4 4 ... 
$ V4: Factor w/ 4 levels "C","P","S","V": 1 1 1 1 1 1 1 1 1 1 ... 
$ V5: Factor w/ 5 levels "1","2","3","4",..: 1 1 1 1 1 1 1 1 1 1 ... 

如果需要的話,使這個更自我記錄您可以重命名這些列和供應標籤的因素,但由於是可運行的GLM數據集。