training-data

    1熱度

    1回答

    我正在嘗試向nl-personTest.bin文件添加額外的訓練數據,其中OpenNLP。 現在是我的問題,當我運行我的代碼添加額外的訓練數據時,它將刪除已經存在的數據並只添加我的新數據。 如何添加額外的訓練數據而不是替換它? 我沒有使用下面的代碼,(得到它來自Open NLP NER is not properly trained) public class TrainNames {

    -1熱度

    1回答

    數據集源:https://archive.ics.uci.edu/ml/datasets/wine 完整的源代碼(需要與NumPy,Python 3中):https://github.com/nave01314/NNClassifier 從我讀過的東西,看來80%左右,培訓20%VA的分裂驗證數據接近最優。隨着測試數據集大小的增加,驗證結果的差異應以降低有效訓練爲代價降低(驗證準確度較低)。 因此

    2熱度

    2回答

    我有以下問題:我試圖學習張量流程,但我仍然沒有找到將培訓設置爲在線或批處理的位置。舉例來說,如果我有以下的代碼來訓練神經網絡: loss_op = tf.reduce_mean(tf.pow(neural_net(X) - Y, 2)) optimizer = tf.train.GradientDescentOptimizer(learning_rate=learning_rate) trai

    0熱度

    1回答

    我有一個由圖像組成的訓練集,從女巫我必須預測由固定數量的字母和數字組成的標籤。 將這些標籤添加到張量流中的最佳方式是什麼?我想創建一個數字列表,其中一個用於標籤中的所有字符/數字。 我創建了一個清單,阿拉的可能值: __dict = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q

    1熱度

    1回答

    根據this文章訓練卷積神經網絡時,訓練集的準確性增加太多,而測試集的準確性穩定。 下面是與6400個訓練樣例,在每個曆元隨機選擇的一個例子(這樣一些實例中可能在先前時期中可以看出,一些可能是新的),和6400 相同試驗例。 對於一個更大的數據集(64000或100000個訓練樣例),訓練精度的提高更加突兀,在第三個時代將達到98。 我也試過使用相同的6400訓練例子每個時代,隨機洗牌。如預期的那

    0熱度

    1回答

    我試圖訓練斯坦福NER分類器來識別文本數據庫中的特定內容。我製作了一個新的.prop文件和一個培訓文件,並且我得到了結果,但是如果我不經過訓練即可運行分類器,它們會成爲默認結果。我能做什麼來適應這個? 這是我的代碼: import edu.stanford.nlp.io.IOUtils; import edu.stanford.nlp.ling.CoreAnnotations; import

    1熱度

    2回答

    我真的是python世界的新手。 我已經看到了在trainset和testset中分裂的例子。但僅限於數字類型。例如: import random with open("datafile.txt", "rb") as f: data = f.read().split('\n') random.shuffle(data) train_data = data[:50] test

    1熱度

    1回答

    我想用卷積神經網絡做多類多標籤圖像分類。 對於培訓過程,我打算使用單熱標籤來準備我的標籤。例如,有總共8個等級的是,和的樣本圖像可被分類爲類別2,4和6。因此,標籤將類似於 [0 1 0 1 0 1 0 0] 然而,該模型當前我的輸入管線捎帶上不會帶有多標籤的訓練數據。我的同事並沒有修改模型的輸入流水線,而是建議替代重複訓練數據。使用前面的示例,而不是使用3個標籤輸入一個訓練數據,而是輸入三個

    0熱度

    1回答

    我試圖用下面的代碼來訓練一個模型,但我一直收到DocumentCategorizerME.train()方法的錯誤,它告訴我將factory更改爲doccatfactory。爲什麼? public void trainModel() { DoccatModel model = null; InputStream dataIn = null; try {

    1熱度

    1回答

    我有一組標記的訓練數據,我正在訓練ML算法來預測標籤。但是,我的一些數據點比其他數據點更重要。或者,類似地,這些點比其他點的不確定性更少。 是否有一種通用方法在模型中爲每個訓練點添加重要性代表權重?是否有一些具有這種能力的具體模型,而其他的則不是? 我可以想象複製這些點(也許稍微塗抹它們的特徵以避免精確重複)或下采樣不太重要的點。有沒有更好的方法來解決這個問題?