2014-01-27 53 views
1

比方說,我想建立一個系統模擬遊客到城市的行爲。建模和比較旅程的簡單系統是什麼?

爲了論證的緣故,這座城市有5個名勝古蹟:A,B,C,D和E.所有人都有可能成爲第一個去過的地方,而且所有人都可以輕鬆到達彼此。

我很感興趣,得出結論類似如下:

  • 「誰訪問C用戶通常去拜訪B.」
  • 「訪問A的用戶很少去訪問D.」
  • 「訪問B的用戶同樣可能訪問C和E.」

我的問題,我理解他們如下:

  1. 我不知道圖論什麼。 (但我準備閱讀它)。
  2. 我不確定存儲這種數據的最佳方式。如果不是SQL DB,什麼?
  3. 我將對數據執行什麼樣的操作?我可以使用像Ruby這樣的通用語言嗎?

感謝您的任何指導。

回答

1

存儲的類型顯然取決於您擁有的數據類型。如果它只是你在這裏描述的話可以代表每個旅程的字符串:

ABCB 
DCDE 
... 

這也符合在數據庫中,但當然這樣的列表可以使用任何手段來存儲,無論最容易獲得的您。你可能甚至不需要整個列表,累計版本可能就足夠了,在那裏你存儲每個字符串恰好一次,其計數一起:

ABDC 177 
DEA 2996 
... 

對於這樣的表的數據庫是合適的,但它仍然簡單到足以存儲在純文件中。

爲了檢查數據,你不關心圖論,而是閱讀統計和機器學習。你想要分析的第一件事是各個地方的correlation。您可以使用簡單的字符串操作(例如對子字符串「AD」進行計數,以瞭解人們從A到D的頻率。關於語言:您想要計算和可視化相關性,所以也許您會選擇某種東西不太難。這可能是像Matlab或R專門的東西,或者更像Python/Matplotlib/scikit-learn一般的東西。我不知道Ruby。

相關問題