data-science

    1熱度

    1回答

    我是數據科學的新手,我下載了將在下週告訴觀衆的代碼。 但是,在下面的代碼中,我無法理解以下函數的作用,以及它如何預測值。 數據集爲每個值爲7。爲什麼只有9個插入大括號? regr1 = linear_model.LinearRegression() regr1.fit(x1, y1) predicted_value1 = regr1.predict(9) 什麼thess線將

    -2熱度

    2回答

    我正在構建一個迴歸模型來預測設備的效率。有沒有辦法扭轉這種情況,並從輸出中得到模型的輸入?我知道像決策樹和隨機森林這樣的模型可以看到特徵的重要性,對於線性模型,您可以看到賦予每個特徵的權重,但是可以從該模型生成一些輸入嗎?例如。給定最佳效率,預測輸入組合。

    0熱度

    2回答

    我試圖通過散景到我的連接到熊貓數據框的情節添加一個滑塊。 該圖利用日期時間指數顯示空氣質量指數如何超過一年。 我想補充一個滑塊每個月,1至12月2016 我無法找到與滑塊連接到連接到一個數據幀大熊貓的陰謀代碼一個明顯的例子。請有人幫忙! 我能夠找到下面的代碼,但繪圖是隨機數據生成的。這段代碼的輸出正是我想要做的,但對時間序列數據。 from bokeh.io import output_noteb

    0熱度

    1回答

    我想用神經網絡最後的隱藏激活圖層輸出做一些測試,使用sklearn的MLPClassifier在fit之後查看數據。 例如,如果我創建一個分類,假設數據X_train用標籤y_train和大小(300,100) clf = MLPClassifier(hidden_layer_sizes=(300,100)) clf.fit(X_train,y_train) 的兩個隱含層我希望能夠以某種方式

    1熱度

    1回答

    我已經使用Python和SciKitLearn堆棧創建了一個腳本來匹配巴西城市之間的氣候數據。目前,我正在使用帶有60M +條目的氣候集合的MongoDB,並且使用Pandas查詢並加入這些表格。 我用一個簡單的算法比較來自每個巴西城市的氣候數據,爲每個城市對生成一個最終得分。 問題是它需要很長時間(每對11秒)。這真的很慢,因爲我想獲得所有12M +可能組合的分數。我怎樣才能讓它更快?下面是相關

    0熱度

    1回答

    我抄這些數據集,現在我想在標準化形式這些數據集,我是一個初學者機智對於數據的科學,所以我怎麼能通過使用Python代碼 IS_MOBILE,n_products_viewed,visit_duration,is_returning_visitor,TIME_OF_DAY進一步做,user_action 1,0,0.657509946,0,3,0 1,1,0.568571234,0,2,1 1,0,

    2熱度

    2回答

    有趣的是,我在計算器和其他網站上看到了很多不同的答案: 在處理我的訓練數據集時,我使用決策樹模型來推算某列的缺失值。所以這是我的問題。使用所有可用數據(訓練&測試)來製作插補模型(而不是預測)還是公平的?或者在做這些工作時只能觸摸訓練集?另外,一旦我開始在我的測試集上工作,我是否必須只使用測試集數據,使用我的訓練集中製作的相同插補模型進行插值,還是可以使用所有可用數據重新訓練我的插補模型? 只要我

    0熱度

    1回答

    我寫下面的代碼使用多項式迴歸。能夠適應模型,但無法預測! def polynomial_function(power=5, random_state=9): global X_train global y_train X_train = X_train[['item_1','item_2','item_3','item_4']] rng = np.rand

    0熱度

    1回答

    正常工作,我有兩個數據集 - structured_data(有4000個+記錄)和record_data(有400條記錄)。我想比較什麼都記錄存在於record_data與structured_data匹配。 filter_df = record_data [record_data.UnitNumber.isin(structured_data.UnitNumber)& record_data.

    1熱度

    1回答

    我是一個完整的新手,對不起,如果標籤不正確我不完全確定mac終端和unix/linux之間的差異。 我正在處理我的mac終端上的文本文件。 我試圖用約翰到濾光片列4,以便只行顯示。然後將第三行導出到csv。 例如: 1 | 11/11/11 | 8:01 | John was here<br/> 2 | 12/11/11 | 8:02 | Derek was here<br/> 3 | 13/