2012-04-15 76 views
3

我正在一個小的價格/產品比較網站,這是一個利基網站相關的筆記本電腦和平板電腦,內置php。如何匹配類似產品的價格比較網站

我的問題是如何做到以下幾點:「匹配來自不同商家的同類產品」。我的意思是,當產品具有EAN/ISBN時,一個簡單的%LIKE%就可以做到。但是我得到的數據饋送有很多產品缺少ean或任何其他唯一ID。價格比較網站如何處理這個問題?

我想尋找的產品名稱之間的串相似性,但我不希望匹配:宏碁ICONIA TAB A500

宏碁ICONIA TAB A500情況下同類產品。有任何想法嗎?

謝謝!

回答

1

要實施比較,您必須爲產品添加一些標籤。並且當某人搜索產品時,列出具有相同標籤的其他產品。

例如:一臺筆記本電腦標籤是像筆記本電腦,宏碁,14" ,$ 500(價格)等

因此,當有人搜索筆記本電腦,列出所有的筆記本電腦,這樣他可以選擇其中的2 。並作出比較。

希望你有這個概念。

+0

謝謝穆罕默德的迴應!但是這需要手動工作,而我不能爲10000個產品做這個。不過,我認爲比較產品的價格也可以提供幫助! – Jdiid 2012-04-15 15:29:15

+1

爲了闡述這個想法,即使手動標記是不切實際的,這個想法也是你的產品已經被分類爲** some **類。如果您的產品具有正常的類別 - 如購物車等不可能具有的那樣 - 這意味着您可以進行非模糊比較,例如,類似產品可以是「類別x中的所有產品,具有類似的價格範圍。 「另外,您可以考慮使用描述字段等來生成這些標籤。 – hexparrot 2012-04-15 16:22:24

0

我遇到了類似的問題。有不同的解決方案。

你可以找到一些搜索技術類似項目(全文搜索引擎可有用)或使用一些數據挖掘方法(看看識別品牌,型號,顏色等的命名實體識別。特別是用於文本挖掘的機器學習方法)。如果你做得好,後者可以更加準確。

在這兩種方法中,您都可以使用一些額外的模糊邏輯來進行字符串比較,這些字符可以用不同的方式書寫。和一般預定義的規則來消除錯誤的項目。例如,考慮到價格可以區分一個項目及其附件,雖然它們的標題非常相似。