我正在使用sklearn.pipeline.Pipeline
對象進行聚類。從sklearn.pipeline.Pipeline獲取變壓器結果
pipe = sklearn.pipeline.Pipeline([('transformer1': transformer1),
('transformer2': transformer2),
('clusterer': clusterer)])
然後我通過使用側影評分來評估結果。
sil = preprocessing.silhouette_score(X, y)
我想知道怎樣才能從管道得到了X
或轉換數據,它只返回clusterer.fit_predict(X)
。
我明白,我可以通過只拆分管道作爲
pipe = sklearn.pipeline.Pipeline([('transformer1': transformer1),
('transformer2': transformer2)])
X = pipe.fit_transform(data)
res = clusterer.fit_predict(X)
sil = preprocessing.silhouette_score(X, res)
做到這一點,但我想只是做這一切在一個流水線。
要清楚,我對獲取中間結果感興趣,例如'transformer1.fit_transform(df)'和'transformer2.fit_transform(transformer1.fit_transform(df))' – jbolilia