Microsoft Computer Vision API或Google的Cloud Vision API是否可以獲取對象的位置？

我想開發一個應用程序，需要知道圖像中標記對象的位置。知道圖像中存在「鋼琴」是不夠的，我需要知道鋼琴在圖像中的位置。Microsoft Computer Vision API或Google的Cloud Vision API是否可以獲取對象的位置？

微軟的計算機視覺API和谷歌的雲視覺API都提供了某種形式的裁剪建議/智能縮略圖生成服務，這讓我認爲某些對象的位置正在被檢測 - 但是有沒有辦法獲得這些信息（像微軟計算機視覺API或Google的Cloud Vision API中圍繞每個檢測到的物體的邊框）？

編輯：我明白，這兩個API可以返回一個圖像中檢測到的面部的位置，但是我正在尋找位置和每個對象的大小的圖像在：汽車，鋼琴，樹木，人物。 ..anything。

來源

2016-12-23 abagshaw

[如何使用視覺識別api獲取圖像上自定義對象的位置]（http://stackoverflow.com/questions/38634409/how-to-get-a-position-of-custom-object -on-image-using-vision-recognition-api） – Nakilon

Microsoft Vision API不爲檢測到的對象提供像素座標（請參閱返回功能：https://dev.projectoxford.ai/docs/services/56f91f2d778daf23d8ec6739/operations/56f91f2e778daf14a499e1fa）。

但是，如果要檢測人員，Microsoft API可以返回面部矩形的座標。

來源

2016-12-23 21:06:35 DaveStat

查看我的編輯 - 我正在尋找的不僅僅是臉部位置，但我明白這些API可能不是我所期待的。 – abagshaw

在這種情況下，Microsoft API不適用 – DaveStat

關於Google API或任何其他API的任何想法？ – abagshaw

我不知道任何API在這個時候爲您提供對象的座標。我推薦使用的是YOLO，它提供了對象的座標。您可以使用預先訓練的模型或訓練您自己的模型。

但是，它不是API，你需要編寫一些後端遠程運行。

來源

2017-04-25 10:59:33

Microsoft Computer Vision API或Google的Cloud Vision API是否可以獲取對象的位置？

回答

相關問題