training-data

    0熱度

    1回答

    我是分析領域的新成員。也許這個問題對你來說很愚蠢。我正在使用R進行審查分類。我必須將評論分爲50個不同的類別。我手動爲模型的培訓目的標記數據。我有點困惑如何標記審查? 我在這裏做的是, 首先我將單個評論轉換成句子,然後給這些句子一個特定的類別。我在這裏做什麼? 或者我必須給類別標記的審查而不打破句子?如果審查屬於多於一個類別,那麼該怎麼辦?

    0熱度

    1回答

    我有兩個數據集分別有200和50分的問題。將這40個數據點當作測試集。我選擇了kNN作爲考慮五個最近鄰居的分類器。 n_neighbors = 5 std = 5 # generate data X0, y0 = make_blobs(n_samples=200, centers=2, n_features=2, cluster_std = std, random_state=42)

    0熱度

    1回答

    我有一個包含大量列的數據集,我已經編寫了我的應用程序,使得如果給定列的值爲如果沒有,那麼它將充滿平均值作爲印象策略的重要性值。 但是,我有點擔心,如果整個列的所有值都丟失了,那麼執行器將如何執行,在這種情況下,正確的方法是什麼?

    0熱度

    1回答

    我有一組帶有三個標籤'd','e'和'k'的分類數據。我想訓練一個分類器來識別'd'並將它們從數據集中移除,然後標識'e'。目前,我將數據分成三部分,我將其稱爲X1,X2,X3。我在X1上訓練一個學習者L1,使用那個學習者去除X2上的'd'標籤,然後我用它來訓練第二個學習者L2,我在X3上測試它。這是一種合理的方法,在這種情況下是否有公認的標準?

    0熱度

    1回答

    昨天我給wit.ai-Project增加了一些新的培訓例子,但培訓狀態被卡住了。當我添加新的示例時,狀態總是保持「乾淨」(綠色圖標) - 看起來,培訓過程無法再被觸發。這很煩人,因爲沒有新的例子工作。 任何人都可以幫忙嗎?難道我做錯了什麼? (如果wit.ai中的某人讀到:項目名稱爲ts_bot_dev_1)。

    -3熱度

    1回答

    我的任務:我需要訓練卷積神經網絡來識別車號牌。 輸入:圖像(像素陣列(我可以正常化它)) 輸出:約號牌的位置信息。 問題: 1)哪種形式最好得到結果?例如:如果我想識別數字,我將使用10個元素的向量,其值將包含適當數字的概率。但我不知道在我的情況下使用哪種輸出形式。 2)哪種尺寸更適合用於輸入圖像? 3)這個問題與第一個有關。我如何構建我的訓練數據集?我的變體:位的掩碼,其中1表示這裏是一個號碼板

    34熱度

    4回答

    我目前正試圖制定一個程序,以區分腐爛的橘子和可食用的橘子,只根據它們的外觀。爲此,我計劃使用卷積神經網絡來訓練腐爛的橙子和普通的橙子。經過一番搜索後,我只能找到約一個數據庫。黑色背景上有150個橙子和150個普通橙子(http://www.cofilab.com/downloads/)。很顯然,機器學習模式至少需要幾千個桔子才能達到90%左右的精確度。但是,我可以通過某種方式改變這150個橙子來制

    0熱度

    1回答

    我想在Weka中建立一個分類器。我有兩個數據集:培訓和測試。這兩個文件是相同的:具有相同數量和類型的屬性。然而,Weka瀏覽器給我錯誤說Train和測試集不兼容。如何解決這個錯誤? 這裏是兩套瞬間: training set testing set

    0熱度

    1回答

    我正在訓練非常不平衡的訓練數據集上的SGD神經網分類器。爲了彌補未表現的類,我對一套隨機抽樣的s.t進行實際訓練。更少的例子可以更頻繁地挑選出來。 什麼是選擇後者集合的數量與將要運行的時代數量的原則性方法?建議非常感謝。

    0熱度

    1回答

    在訓練網絡時我已經使用了這兩個函數,並且每個時期都給出了大致相同的值。他們不完全一樣。我用network.calculateError(trainingdata)。 getError()函數和calculateError()函數有什麼區別? getError()在訓練期間是否給MSE提供了1個紀元?