我試圖創建一個算法,給定一組網站中的元素,它將返回更可能是描述產品的「一個」元素的算法。根據矩形大小對圖像進行評分的算法
這當然不是一個100%準確的算法,並需要以人爲本的選擇之後,但我想獲得至少3幅最可能的圖像列表。這是我做的,到目前爲止:
1 - 擺脫其平方大小比50x50px
2小 - 在頁面
3計算所有的平均平方大小 - 給出分數每個取決於與平均平方尺寸的差異(平方尺寸越大,得分越高)
4 - 如果寬度>比(高度* 5),得分=得分* 0.5(我這樣做是因爲這可能是一個橫幅這一頁)。
這裏是我想改變什麼,但我看不出這將是這樣做的一個很好的方式。在步驟3,我現在所做的權利賦予以下分數:
score_of_image = average_square_size - square_size_image
我想有將被共享出來給所有取決於它們的大小分的特定量。份額應該反映一張與其他圖片相關的圖片的大小。爲了分享這些觀點,什麼是一個好的算法?
困惑!...你是在談論一個簡單的面積計算還是你在談論圖像的平方?我假設你是試圖寫一些蜘蛛類型算法來收集有關產品的網站信息,我會想到一個簡單的面積計算d給出了「產品」形象的最佳標誌。我不確定你爲什麼試圖將它轉換成分數? –
什麼是「元素」?它是一個位圖圖像?什麼是「方形尺寸」?是位圖圖像的尺寸(寬度乘以高度)?你的觀點(4)有一些錯誤的語法,但它對我來說似乎是錯誤的...一個不錯的方形圖像的寬度>高度* 0.5,所以我不會懲罰它。如果寬度>高度* 2,我可能會懲罰圖像,這是非常不同的。 –
我想在第3步中你想要一個百分比的差異。所以使用像'image_score = square_size_image/average_square_size'。因此,比平均值大的圖像的分數大於1.0。 –