1
所以我被告知,對於監督式學習或分類算法,訓練和測試的輸入數據也包括標籤(或目標)。有監督機器學習的歷史標籤
所以我有這個非常混亂的想法,標籤來自哪裏,人們手動標記記錄?可能是一個非常龐大的訓練和測試數據集,如果有一個「程序」或方法自動標記記錄,那麼這意味着對於未來的數據,我們也可以擁有標籤?那麼爲什麼要預測呢?
也許我想念一些東西......任何人都可以幫助我一個真實世界的例子嗎?就像信用欺詐和非欺詐一樣,銀行工作人員可能會將帳戶標記爲欺詐或非欺詐行爲,或者如果他們有一個「公式」來表明欺詐,那麼「公式」應該一直使用銀行,主管學習在哪裏發揮作用?
'人們手動標記記錄?' - 是的。你沒有錯過任何東西 - 這完全是正確的想法。另一種可能性是,他們對少數情況進行了非常昂貴的實驗,然後預測其他情況,因爲測量所有成本太昂貴。 – cel
嗯,所以應用監督式學習的場景會如何如下:這個數據集沒有標籤,然後手動將標籤應用於選定的子集,或者可能是整套數據,但是這是太多的勞動和人類參與,現在我們想要一個解決方案,在未來的計算機可以爲我們做的事情? – vcharlie