我寫了一些Scrapy蜘蛛。它將數據導出到我通過命令行傳遞的名稱:E:\Anaconda3\envs\Blog2Doc\Lib\site-packages\scrapy\cmdline.py runspider blog2doc_scrapy\spiders\blog_spider.py -o ..\data\out.html
。如果這個文件已經存在,這個蜘蛛只是將內容附加到已存在的文件中。如何檢查輸出文件是否已經存在並且是否存在 - 刪除它。爲了導出到文件,我編寫了Blog2DocExporter(BaseItemExporter)類。它沒有打開輸出文件,在構造函數中它已經打開了文件對象。所以在這個導出器類中,我無法檢查導出的文件是否已經存在。在Scrapy中如何檢查導出的文件是否已經存在?
0
A
回答
0
Scrapy覆蓋輸出文件是一個已知的公開問題。例如見:
- output as xml appending to existing file when spider re-executed resulting in invalid xml
- Add a command-line option for overwriting exported file
我自己提出了修復與增加後綴重命名文件。但是實現不是向後兼容的。 您可能會發現這很有仍然:https://github.com/scrapy/scrapy/pull/2093
它改變了FileFeedStorage
,但你可以實現類似的東西,並期待在this other answer使用這種自定義源存儲類。
相關問題
- 1. 如何檢查文件是否已經存在於列表中?
- 2. 檢查文件名是否已經存在於文件夾中?
- 3. 如何檢查文件名是否已經存在?
- 4. 如何檢查文件名是否已經存在?
- 5. 檢查文件是否已經存在於webview緩存android
- 6. Rails,檢查url是否已經存在
- 7. MySQL檢查表是否已經存在
- 8. 檢查SPListItem是否已經存在
- 9. 檢查mysql表是否已經存在
- 10. 檢查數據是否已經存在
- 11. 檢查表單是否已經存在
- 12. 檢查是否值已經存在
- 13. 如何檢查文件是否已經在COBOL中打開?
- 14. 如何檢查文件夾中是否已存在文件
- 15. 檢查文件是否已經存在於相同的路徑
- 16. 如何檢查表中的字段是否已經存在?
- 17. 檢查文件夾和所有數據是否已經存在
- 18. 使用VBA powerpoint檢查文件是否已經存在
- 19. 如何用PHP檢查ip是否已經存在於MySQL中?
- 20. 如何檢查EC2中是否已經存在keyname
- 21. 如何檢查一個IP是否已經存儲在mysql中?
- 22. 如何檢查目錄是否已經存在於MFC(VC++)中?
- 23. 如何檢查PHP數據庫中是否已經存在url?
- 24. 如何檢查DOM中是否已經存在三個元素
- 25. 如何檢查查詢字符串是否已經存在
- 26. 檢查文件是否已經打開
- 27. 如何檢查表上的數據是否已經存在?
- 28. 如何檢查表單的實例是否已經存在?
- 29. 檢查內存中的值是否已經存在
- 30. 如何檢查一個關係是否已經存在?