我想用雲視覺來識別和隔離圖片中的「主要」文本(比如說包裝上最大的文字)。我認爲雲視覺能夠通過查看字體大小/每個字母佔用多少像素來在後端執行此操作,但我不確定API中是否有輸出。我可以告訴Google Cloud願景以隔離它在圖像中讀取的最大(字體大小)文本嗎?
在哪裏這個信息將是在文檔中我最好的猜測是,在下面的鏈接,但我看不到與此相關的任何東西:https://cloud.google.com/natural-language/reference/rest/v1beta1/documents/annotateText
獲取字體大小(像素)聽起來像是你需要做的[OCR](https://en.wikipedia.org/wiki/Optical_character_recognition),然後編寫一些代碼來獲取具有最大字體大小屬性的片段......我不確定雲視覺能否幫助您。 OCR不是圖像識別。 – lenz