我正在嘗試構建一個程序,該程序可以正確,自信地識別Google Cloud Vision中的對象(表示爲GCV)。返回的結果在大多數時間都是正確的,因此每個標籤都有一定的準確度分數。如何自信地驗證從Google Cloud Vision返回的對象檢測結果
{
"banana": "0.92345",
"yellow": "0.91002",
"minion": "0.89921",
}
我正在使用的環境具有不同的閃電條件組合,並且物體預期放置在隨機位置。當放置不同位置的物體時,從GCV返回的結果會稍有不同,因爲會查詢不同的圖像。例如,
{
"banana": "0.82345",
"lemon": "0.82211",
"yellow": "0.81102",
"minion": "0.79921",
}
我的程序設計,即,與精確度高於一定值時檢測到的對象banana
時,則下一個動作將被分派的方式。
有3個對象類型的集羣。例如,banana
轉到容器A
,apple
轉到容器B
和orange
轉到容器C
。
當我向我的教授介紹我的工作時,他質疑我如何可以自信地定義和驗證每個項目的閾值,並尊重其各自的羣集。
我試圖通過培訓數百個香蕉圖像來獲得香蕉的平均分數,但最終我發現這可能不是定義閾值的正確方法。我的教授建議使用K Nearest Neighbor來找到這些圖像的相似性,但這不是GCV的一部分?即使他的建議是正確的,使用GCV返回的有限數據來訓練後GCV分類器的正確方法是什麼?