我剛開始使用luigi
庫。我經常抓取一個網站並將任何新記錄插入到Postgres數據庫中。由於我試圖重寫部分腳本以使用luigi
,因此我不清楚"marker table"應該如何使用。使用luigi更新Postgres表
工作流程:
- 抽取數據
- 查詢數據庫,以檢查是否有新的數據從舊的數據不同。
- 如果是這樣,則將新數據存儲在同一個表中。
但是,使用luigi的postgres.CopyToTable
,如果該表已存在,則不會插入新數據。我想我應該使用table_updates
表中的inserted
列來確定應該插入哪些新數據,但是我不清楚該過程是什麼樣的,我在網上找不到任何明確的示例。