1
我正在一個網站上工作。它正在從各個網站上抓取產品詳細信息(名稱,功能,價格等),並對其進行處理和顯示。我正考慮每天運行更新腳本並保持數據新鮮。存儲屏幕抓取數據的正確方法是什麼?
- 刮數據
- 過程他們
- 店鋪數據庫
- 讀取(從DB),並顯示它們
我'已經存儲在SQL模式中的所有數據,但我我不確定。每次更新後,所有舊記錄正在消失。如果被刮掉的新數據以某種方式被破壞,就沒有什麼可顯示的。
那麼,有什麼常用的方法來歸檔舊數據?哪一個更方便:單獨的sql模式或xml文件?或者是其他東西?