3

我想開發一個應用程序,需要知道圖像中標記對象的位置。知道圖像中存在「鋼琴」是不夠的,我需要知道鋼琴在圖像中的位置。Microsoft Computer Vision API或Google的Cloud Vision API是否可以獲取對象的位置?

微軟的計算機視覺API和谷歌的雲視覺API都提供了某種形式的裁剪建議/智能縮略圖生成服務,這讓我認爲某些對象的位置正在被檢測 - 但是有沒有辦法獲得這些信息(像微軟計算機視覺API或Google的Cloud Vision API中圍繞每個檢測到的物體的邊框)?


編輯:我明白,這兩個API可以返回一個圖像中檢測到的面部的位置,但是我正在尋找位置和每個對象的大小的圖像在:汽車,鋼琴,樹木,人物。 ..anything。

+0

[如何使用視覺識別api獲取圖像上自定義對象的位置](http://stackoverflow.com/questions/38634409/how-to-get-a-position-of-custom-object -on-image-using-vision-recognition-api) – Nakilon

回答

0

Microsoft Vision API不爲檢測到的對象提供像素座標(請參閱返回功能:https://dev.projectoxford.ai/docs/services/56f91f2d778daf23d8ec6739/operations/56f91f2e778daf14a499e1fa)。

但是,如果要檢測人員,Microsoft API可以返回面部矩形的座標。

+0

查看我的編輯 - 我正在尋找的不僅僅是臉部位置,但我明白這些API可能不是我所期待的。 – abagshaw

+0

在這種情況下,Microsoft API不適用 – DaveStat

+0

關於Google API或任何其他API的任何想法? – abagshaw

0

我不知道任何API在這個時候爲您提供對象的座標。我推薦使用的是YOLO,它提供了對象的座標。您可以使用預先訓練的模型或訓練您自己的模型。

但是,它不是API,你需要編寫一些後端遠程運行。

相關問題