2014-03-04 96 views
6

最近,我讀了博客文章題爲土匪知道最好的產品價格」 (http://pkghosh.wordpress.com/2013/08/25/bandits-know-the-best-product-price/),其中概述瞭如何使用多臂老虎分析價格優化。多臂老虎分析價格優化

關於多武裝強盜分析是否優於A/B測試(例如「每行將擊敗A/B測試的20行代碼」:http://stevehanov.ca/blog/index.php?id=132?utm_medium=referral與「爲什麼多武裝強盜算法不是'better'than A/B testing「:http://visualwebsiteoptimizer.com/split-testing-blog/multi-armed-bandit-algorithm/)。

我知道有一個名爲」bandit「的R包,可以用於這樣的分析。

是否有人有玩具的例子 -堪比一個在博客文章 - 它展示瞭如何應用使用(價格優化的範圍內)R這個方法?

感謝您的幫助。

+1

有跡象表明,總稱「多臂強盜(MAB)」下前來多種算法。我在這裏提到的帖子中使用了其中的兩個。對於所有重要和流行的MAB算法的概述,這裏是我的另一篇博客文章http://pkghosh.wordpress.com/2013/06/29/learning-but-greedy-gambler/ – Pranab

回答

3

我正在做一個關於最近bandit算法的項目。基本上,數據集很大程度上決定了bandit算法的性能。這對於持續測試攪動數據非常有用。所以你需要做什麼來測試和調整測試數據的模型。

爲了更好地理解盜匪,你可以閱讀這本書,網站優化的bandit算法:http://shop.oreilly.com/product/0636920027393.do。它很好地解釋了基本的強盜算法,並在Python中實現。你可以在Github上找到它的代碼:https://github.com/johnmyleswhite/BanditsBook。但是,他們並沒有在書中談論背景匪徒。

對於R,我不太確定。但我剛剛在網上搜索,我發現一個人在R實施了土匪,這裏是代碼:https://github.com/lotze/bandit

希望它可以幫助你。