2015-09-28 74 views
2

我想簇上20萬點,通過以下:Sklearn inifinity價值,而這樣做k均值聚類

km = KMeans(n_clusters=5) 
km.fit_transform(ends) 

但我得到以下錯誤: km.fit_transform(結束)

所以矩陣尺寸是200kX2

File "/Users/fleh/anaconda/lib/python2.7/site-packages/sklearn/cluster/k_means_.py", line 814, in fit_transform 
    X = self._check_fit_data(X) 
    ... 
ValueError: Input contains NaN, infinity or a value too large for dtype('float64'). 

據我一直在追蹤數據..數字並不那麼大。 我該如何解決這個問題? 感謝

+1

那麼NaNs呢?嘗試'np.nan_to_num(結束)'。 – hellpanderrr

回答

0

如果您使用的數據處理熊貓,你可以運行這個命令:然後

import pandas as pd 
df = pd.DataFrame(ends) 
df.replace([np.inf, -np.inf], np.nan) 
df.info() 

該信息()函數會告訴你,如果你有一個是非可計算的任何值。