有監督機器學習的歷史標籤

所以我被告知，對於監督式學習或分類算法，訓練和測試的輸入數據也包括標籤（或目標）。有監督機器學習的歷史標籤

所以我有這個非常混亂的想法，標籤來自哪裏，人們手動標記記錄？可能是一個非常龐大的訓練和測試數據集，如果有一個「程序」或方法自動標記記錄，那麼這意味着對於未來的數據，我們也可以擁有標籤？那麼爲什麼要預測呢？

也許我想念一些東西......任何人都可以幫助我一個真實世界的例子嗎？就像信用欺詐和非欺詐一樣，銀行工作人員可能會將帳戶標記爲欺詐或非欺詐行爲，或者如果他們有一個「公式」來表明欺詐，那麼「公式」應該一直使用銀行，主管學習在哪裏發揮作用？

2016-04-07 vcharlie

'人們手動標記記錄？' - 是的。你沒有錯過任何東西 - 這完全是正確的想法。另一種可能性是，他們對少數情況進行了非常昂貴的實驗，然後預測其他情況，因爲測量所有成本太昂貴。 – cel

嗯，所以應用監督式學習的場景會如何如下：這個數據集沒有標籤，然後手動將標籤應用於選定的子集，或者可能是整套數據，但是這是太多的勞動和人類參與，現在我們想要一個解決方案，在未來的計算機可以爲我們做的事情？ – vcharlie

監督學習的重點恰恰是猜測標籤是什麼。

因此，在您的信用卡詐騙案件中，人們確實已經手動將案件標記爲欺詐或不公開。與ML的想法是，你可以猜測，鑑於人們已經提出了什麼標籤，如果他們看到未來的數據，他們會想出什麼。

2016-04-07 14:08:50 Carlos

回答