0
時候當我試圖抓取此網頁:使用遇到trustAsHtmlFilter爬行
scrapy shell url
然後做一個
view(response)
我看到頁面上顯示trustAsHtmlFilter。頁面佈局在那裏,但是沒有顯示所有的內容。所以我猜這個網站使用這個過濾器來阻止我的抓取工具。
我做過谷歌它,它似乎像這個過濾器來自AngularJS?不知道這一點
所以我的問題是:
什麼可能是觸發此過濾器的原因是什麼?我幾天前爬過這個頁面,當時很好。
有沒有辦法解決這個問題?
謝謝!
您是否嘗試過在請求中使用'user agent'? 'scrapy shell -s USER_AGENT ='user agent''http:// www.example.com'' – Rahul
我用過它,仍然被該過濾器阻止 – user2628641