1

我正在使用我的convnet的CrossEntropyCriterion。我有150班,每班的培訓文件數量爲非常不平衡(5至2000個文件)。根據該文件,我可以彌補這一點使用權:Torch7使用不平衡訓練集的權重

criterion = nn.CrossEntropyCriterion([weights]) 

「如果提供了可選參數的權重應該是一維的張量分配權重給每個班的這當你有一個不平衡是特別有用訓練集「。

權重應採用何種格式?例如:n班的培訓文件數/培訓文件總數。

回答

1

我假設你想在這個意義上平衡你的訓練,那麼小班變得更加重要。一般有無限多的可能的權重導致各種結果。其中一個simpliest的,其簡單地假定每個類應該是同樣重要的(因此有效地在刪除被經驗之前)的是把重量成正比

1/# samples_in_class 

例如

weight_of_class_y = # all_samples/# samples_in_y 

這樣,如果你有5:2000的比例,較小的班級變得比模型重要400倍。

+0

完美,謝謝。 –

相關問題