3

Watson Image Recognition (IR) demo中,您可以爲應用程序提供圖像,並對圖像進行分類,並告訴您圖像中的內容。它是如何實現的?使用Watson圖像識別「分類」圖像

據我可以從文檔中看出,你只能給它正面和負面的圖像,它只能說'是',這是披薩,或'不',這不是比薩餅。它不能指定是比薩餅還是意大利麪。

有沒有辦法實現這個目標?

回答

5

該服務通過使用分類器集合起作用;每個分類器僅適用於單個標籤,必須使用它自己的一組正面和負面圖像進行訓練。要獲得比薩與意大利麪,您必須創建兩個分類器並對每個分類器進行正面和負面圖像的訓練。 (然而,在這種特殊情況下,披薩的負面圖像可能只是麪食的負面圖像,反之亦然。)

有一個可用的分類器的默認集合,它具有相當廣泛的標籤範圍,所有這些已經以這種方式訓練;我相信the demo使用默認集合+ AlchemyVision(它有更廣泛的分類,但不可訓練)的組合。你可以看到the demo's source code on github

您可以在視覺識別服務文檔中閱讀更多:http://www.ibm.com/smarterplanet/us/en/ibmwatson/developercloud/doc/visual-recognition/index.shtml