簡單的用我的鏈接抽取程序(寫在python3.3)我想用一個數據庫來存儲各地100.000網站:快速的關係數據庫,與Python
- 只是URL,
- 時間郵票
- 和每個網站的幾個屬性
我沒有對數據庫中的知識的列表,卻發現下面可能適合我的目的:
- PostgreSQL的
- SQLite的
- 火鳥
我感興趣的速度(來訪問數據庫並獲取想要的信息)。例如:對於網站x,屬性y是否存在,如果是,則讀取它。寫作的速度當然也很重要。
我的問題:速度有很大差異還是對我的小程序無關緊要?也許有人可以告訴哪個數據庫符合我的要求(並且很容易用Python來處理)。
也許我還不夠清楚。我的程序將在服務器上全天候運行,應該可以從其他機器連接到數據庫。 – zwieback86
在這種情況下,您應該使用更混合的方法,如mongodb。數據庫是內存映射的,所以你可以快速訪問,它也在磁盤上。 http://docs.mongodb.org/manual/faq/storage/ – v2b