2014-10-22 89 views
-1

我正在製作一個文本文件的索引。索引將是每個單詞和符號的列表(〜!@#$%^ & *()_- {}:「<>?/。,'; [] 1234567890 |)並計算每個令牌的次數發生在文本文件中,按照升序的ASCII值順序打印所有內容實現python列表和二進制搜索樹

我要讀取一個.txt文件,並將文字和特殊字符拆分並存儲在一個列表中。如何在這種情況下使用二進制搜索

+0

它看起來像[XY問題](http://meta.stackexchange.com/q/66377/137096)。以'collections.Counter()'開始,計算每個單詞的符號頻率。 – jfs 2014-10-22 06:05:37

回答

0

如果你的查詢很小(比如說,最多1000條記錄),那麼你可以使用字典;你可以使用pickle()它,或者將它寫出到文本文件。 (對於這個尺寸)反正是相當小的。

如果您的查詢表較大,或每次運行的查詢次數較少,我會建議使用鍵/值數據庫(例如, DBM)。

如果使用dbm過於複雜,請使用SQL(例如sqlite3,MySQL,Postgres)或NoSQL數據庫。根據您的應用程序,您可以從這些附加功能中獲得巨大收益。

在任何一種情況下,所有的努力工作都是爲您完成的,比您期望自己做的更好。這些格式都是標準的,所以你會得到簡單易用的工具來讀取數據。