2017-03-16 25 views
0

我想要的野薔薇得分比較在Azure的ML工作室兩個分類:比較荊棘的成績。Azure的ML分類

import pandas as pd 
import numpy as np 
from sklearn.metrics import brier_score_loss 

def azureml_main(dataframe1, dataframe2): 
    colnames_1 = dataframe1.columns 
    y_true_1 = np.array(dataframe1[colnames_1[1]]) 
    y_prob_1 = np.array(dataframe1[colnames_1[-1]]) 
    brier_score_1 = brier_score_loss(y_true_1, y_prob_1) 

    colnames_2 = dataframe2.columns 
    y_true_2 = np.array(dataframe2[colnames_2[1]]) 
    y_prob_2 = np.array(dataframe2[colnames_2[-1]]) 
    brier_score_2 = brier_score_loss(y_true_2, y_prob_2) 

    data = {'brier_score': [brier_score_1, brier_score_2]} 
    result = pd.DataFrame(data, columns=['brier_score']) 

    return result 

我的問題是,該腳本只輸出第一行用一個值第一個數據集的brier得分。第二行是空的。這是我如何連接腳本: azure

+1

我回顧了'brier_score_loss'方法的引用,並試圖重現您的問題,但失敗了,因爲我可以得到有兩行的結果。第二行似乎不可能消失,即使不是南/無值。你能發佈一些樣本數據來幫助分析這個問題嗎?謝謝。 –

+0

感謝您看看它。我已經聯繫了Azure開發人員支持。他們正在看看它。我會讓你知道他們發現了什麼。 – Wessi

回答

0

我發現問題是由第二個數據幀中的幾個NaN值造成的。 將dataframe2 = dataframe2.dropna()添加到腳本的頂部解決了問題。