5
我已經閱讀了大量有關哈爾訓練的內容,我不清楚應該使用多少張圖片作爲正面和負面的樣本集。我看到它建議使用許多圖像,有些人推薦數千。我也不清楚正面和負面樣本圖片的數量是否應該相同?Haar訓練時用於正面和負面樣本的圖像數量?
我已經閱讀了大量有關哈爾訓練的內容,我不清楚應該使用多少張圖片作爲正面和負面的樣本集。我看到它建議使用許多圖像,有些人推薦數千。我也不清楚正面和負面樣本圖片的數量是否應該相同?Haar訓練時用於正面和負面樣本的圖像數量?
這是關於哈爾訓練的最佳教程。你試過這個嗎? http://note.sonots.com/SciSoftware/haartraining.html
它說他們使用了5000正數和3000負數。
這link表示3000爲正,5000爲負。 無論如何,更多的圖像提高了準確性,但它也增加了訓練時間。
另外檢查其他SO鏈接here。
感謝您的鏈接。第二個我沒有看到。謎題之一是負樣本的概念。負樣本包含來自正樣本的圖像部分是否有意義,但沒有正樣本?大多數教程都提到使用包含與正樣本無關的隨機圖像的負樣本。在我看來,如果你從一份水果市場照片中採集正面水果樣本,你會希望負面樣本是水果市場同樣照片中的其他水果樣本? – Rhubarb
好,問題很有意義,但我恐怕我不知道它的答案。一般來說,它就像在答案中的鏈接中給出的那樣。 –
你是對的,@Rhubarb。就像陽性樣本應該儘可能代表你正在努力學習的東西一樣,陰性樣本應該代表你正在學習的東西,而不是儘可能地學習。在你的例子中,顯然理想是如你所說;然而,如果算法的歧視不是非常尖銳,那麼與您的正面例子(類似的果實)太相似的負面例子可能實際上沒有幫助。進一步說,在課程學習的背景下,人們可能會更難以辨別培訓進展中的例子。 – Ninjakannon