我在使用Google Goggle和Google的「按圖搜索」時提出這個問題是因爲好奇。創建可以識別圖像上下文的軟件的可能性?
如果您嘗試向Google提供圖片進行搜索,它會顯示一些結果。相同的圖像效果最好(當然),但拍攝各種物體的照片可能會很困難。
我猜Google Goggle通過使用文本識別和圖像匹配識別有點解決方法。如果文本識別發現了文本,例如「SONY」,那麼事情可能會變得更簡單。如果檢測到品牌形象,那麼事情也應該更簡單。其他着名品牌和着名地標也是如此,如艾菲爾鐵塔。擁有文字和品牌形象可以幫助輕鬆識別事物。
但是,如果我們要搜索更晦澀的東西(這裏需要更好的措辭),例如,拿這張拉麪圖片。
如果你把這個圖像到谷歌,你會得到具有相似的顏色,有時類似形狀的各種其他圖像的圖像。哎呀,結果中還有其他的拉麪圖像,但我認爲如果這些拉麪圖像位於最上面,那麼會更好,因爲我們輸入了拉麪圖像,我們的上下文是拉麪。
所以這裏是我的問題,是否有可能創建這樣一個軟件,可以理解圖像的上下文?我們如何在軟件中表達上下文?
-1關閉粘糊糊的可以食用的東西。 –
+1對於粘糊糊的可以食用的東西。 :) –