scikit-learn

    0熱度

    2回答

    我正在訓練HOG + SVM模型,並且我的訓練數據具有各種大小和縱橫比。 SVM模型不能在可變大小列表上進行訓練,因此我正在計算無論圖像大小如何都是相同長度的梯度直方圖。 有沒有一個聰明的方法來做到這一點?或者更好地調整圖像大小或填充它們?

    0熱度

    1回答

    因此Sci-kit學習的一些模型如Logistic迴歸支持我大量使用的predict_proba方法。對於像Lasso這樣的模型,是否有其他方式輸出類似的概率數組,因爲它們不支持predict_proba? 另外:我正在處理三個結果數據集,其中結果之間的概率可能相對均勻 - 任何有關模型/調諧以嘗試提高概率精度的一般建議,可以處理50個以上的特徵列? =) 謝謝!

    0熱度

    2回答

    我是Python編程的新手。當我嘗試爲主要組件分析標準化數據時,出現以下錯誤消息。 Python版本:2.7.4。 df = pd.read_csv('E:/Downloads/Datasets/PCA_data.csv') df.head() number_people date timestamp day_of_week \ 0 37 2015-08-14

    0熱度

    1回答

    我是新來的機器學習和第一次嘗試Sklearn。我有兩個數據框,一個用於訓練邏輯迴歸模型(具有10倍交叉驗證)的數據和另一個用於使用該模型預測類('0,1')的數據。 這裏是我到目前爲止的代碼使用教程我在Sklearn文檔和Web上發現的位: import pandas as pd import numpy as np import sklearn from sklearn.linear_mo

    0熱度

    1回答

    所以彈性網應該是嶺迴歸(L2正則化)和套索(L1正則化)之間的混合。但是,即使l1_ratio是0,我也沒有得到和脊一樣的結果。我知道山脊使用梯度下降和彈性網使用座標下降,但最優方法應該是相同的,不是嗎?此外,我發現彈性網通常會引發ConvergenceWarnings,原因不明,而套索和脊線則不會。這裏有一個片段: from sklearn.datasets import load_boston

    0熱度

    1回答

    我正在嘗試創建一個用於預測工作薪水的Web應用程序。我已經在我的電腦上離線訓練了我的模型,現在正在嘗試使Flask應用根據用戶輸入做出預測。 Training script: https://github.com/datomnurdin/webscraping-indeed/blob/master/analyzer.ipynb Model: https://github.com/datomnu

    -1熱度

    1回答

    我有一個非常大的數據集與日期和值。我可以使用線性迴歸與日期和值來獲得預測公式。 我有日期和使用價值。 我可以將日期轉換爲數值並獲得預測公式,但我認爲這不起作用。 你能幫我解決這個用例嗎?什麼是最好的機器學習技術?我更喜歡線性迴歸,但不確定如何使用。

    0熱度

    1回答

    我使用Scikit學會做工作 K最近Neigbour分類: from sklearn.neighbors import KNeighborsClassifier model=KNeighborsClassifier() model.fit(train_input,train_labels) 如果打印我的數據: print("train_input:") print(train_inpu

    0熱度

    1回答

    我對SKlearn,機器學習及其相關領域頗爲陌生。我搜索了一天,但仍然無法找出答案。 model = LogisticRegression(C=1) model.fit(X, y) print(model.predict_proba(X_test)) // output [[ 1.01555532e-08 2.61926230e-01 7.37740949e-01 3.32810963e-

    -1熱度

    1回答

    是否有一種使用GridSearch自動調整隨機森林分類器的方法。我們沒有提供這些值,而是有任何方法可以找到最佳的最佳參數值。 rfc = RandomForestClassifier(n_jobs=-1, max_features='sqrt', oob_score = True) # Use a grid over parameters of interest param_