2017-08-23 37 views
0

如何在Python中爲子框架h2o子集。 如果x是一個DF &產地是大熊貓則變量我們一般可以通過python中的子集h2o框架

x[x.Origin == 'AAF'] 

但H2O幀它提供了以下錯誤做子集: 「H2OResponseError:服務器錯誤java.lang.IllegalArgumentException異常: 錯誤:「x.hex」的名稱查找失敗「

回答

3

有許多不同的方法可以按行劃分H2OFrame。這些方法在Slicing Rows的H2O用戶指南部分中進行了概述。

這裏是基於列被設置爲使用虹膜數據集的特定值子集劃分的H2OFrame的Python的例子:

import h2o 
h2o.init() 

# Load data 
path = "http://h2o-public-test-data.s3.amazonaws.com/smalldata/iris/iris_wheader.csv" 
df = h2o.import_file(path=path) 

# Subset data 
mask = df["class"] == "Iris-setosa" 
newdf = df[mask, :] 

# equivalent to both of these, which also work 
# newdf = df[df["class"] == "Iris-setosa", :] 
# newdf = df[df["class"] == "Iris-setosa"] 

newdf = df[df["class"] == "Iris-setosa"]版本幾乎是相同的你有以上,除了H2OFrames格式不支持引用像這樣的列:df.class;您必須使用:df["class"]