2016-01-07 24 views
5

Julia中是否有類似R的表函數?我已閱讀xtab,但不知道如何使用它。Julia的R表函數(用於DataFrames)

假設我們具有R的data.framerdatacol6Factor類型。

[R示例代碼:

rdata <- read.csv("mycsv.csv") #1 table(rdata$col6) #2

爲了讀取數據,並在朱莉婭讓我的因素做這樣的:

using DataFrames jldata = readtable("mycsv.csv", makefactors=true) #1 :col6 will be now pooled.

...,但如何建立R的表像朱莉婭(如何實現#2)?

+0

看到這個正在進行的討論:[StatsBase](https://github.com/JuliaStats/StatsBase.jl/issues/32) – SalchiPapa

回答

4

您可以使用StatsBase.jl中的countmap函數來計算單個變量的條目。目前缺乏一般的交叉表和統計測試。正如Ismael指出的那樣,這已經在問題跟蹤器StatsBase.jl中討論過了。

4

我來到了類似的效果可以用by實現結論:

jldata:gender列。

julia> by(jldata, :gender, nrow) 3x2 DataFrames.DataFrame | Row | gender | x1 | |-----|----------|-------| | 1 | NA | 175 | | 2 | "female" | 40254 | | 3 | "male" | 58574 |

當然它不是一個table但至少我得到了相同的數據類型的數據源。令人驚訝的是by似乎比countmap快。

+0

這真的很整潔。我更喜歡用'countmap'作爲數據框。 – niczky12

+0

值得一提的是,這個方法可以用來做多個交叉表,而'countmap'目前無法做到。 – niczky12