我目前工作的一個解決方案,使食物的種類與10K餐館基於其描述數據庫服務。我使用關鍵字列表來決定提供哪種食物。
我讀了一點關於機器學習的知識,但我根本沒有實際經驗。任何人都可以向我解釋如果/爲什麼它會更好地解決這樣的簡單問題?我發現準確性比表現更重要!
簡單的例子:
["China", "Chinese", "Rice", "Noodles", "Soybeans"]
["Belgium", "Belgian", "Fries", "Waffles", "Waterzooi"]
可能的描述可能是:
「香港花園餐廳提供美味的,價格合理的中國給我們的客戶。如果你發現你有一個突然的渴望。 米,麪條或大豆在星期六晚上8點,別擔心!我們是每週七天營業並提供結賬服務。你可以得到薯條這裏還有!」
這裏很難提出一個實際的建議......這是一個相當具體的問題......你可以使用自然語言處理(如'nltk')來獲得「名詞」,然後使用'pybrain'來訓練一個神經網絡,但最終,這是出於商業目的,我不能依靠機器學習來完全準確,我傾向於考慮將數據庫分成500塊,並僱用20人一天工作 –
(對喬恩克萊門茨的+1),而不是僱用20人,我可能會自己給1-2人標籤500,然後使用機械特克(或競爭者)來標記其餘人,使用標記的案例作爲地面真相以及檢查turkers工作的冗餘分配。 – MattBagg