2016-04-07 55 views
1

所以我被告知,對於監督式學習或分類算法,訓練和測試的輸入數據也包括標籤(或目標)。有監督機器學習的歷史標籤

所以我有這個非常混亂的想法,標籤來自哪裏,人們手動標記記錄?可能是一個非常龐大的訓練和測試數據集,如果有一個「程序」或方法自動標記記錄,那麼這意味着對於未來的數據,我們也可以擁有標籤?那麼爲什麼要預測呢?

也許我想念一些東西......任何人都可以幫助我一個真實世界的例子嗎?就像信用欺詐和非欺詐一樣,銀行工作人員可能會將帳戶標記爲欺詐或非欺詐行爲,或者如果他們有一個「公式」來表明欺詐,那麼「公式」應該一直使用銀行,主管學習在哪裏發揮作用?

+0

'人們手動標記記錄?' - 是的。你沒有錯過任何東西 - 這完全是正確的想法。另一種可能性是,他們對少數情況進行了非常昂貴的實驗,然後預測其他情況,因爲測量所有成本太昂貴。 – cel

+0

嗯,所以應用監督式學習的場景會如何如下:這個數據集沒有標籤,然後手動將標籤應用於選定的子集,或者可能是整套數據,但是這是太多的勞動和人類參與,現在我們想要一個解決方案,在未來的計算機可以爲我們做的事情? – vcharlie

回答

0

監督學習的重點恰恰是猜測標籤是什麼。

因此,在您的信用卡詐騙案件中,人們確實已經手動將案件標記爲欺詐或不公開。與ML的想法是,你可以猜測,鑑於人們已經提出了什麼標籤,如果他們看到未來的數據,他們會想出什麼。