1
我正嘗試構建一個網站,該網站可以抓取.onion域上託管的各種網頁。這意味着它不像調用requests.get("http://XXX.onion")
那麼簡單,因爲.onion只能通過TOR連接纔可用。最簡單的方式來抓取.onion域的網站?
我可以使用像onion.to這樣的重定向器,但需要點擊瀏覽,這在我爬行時不起作用。
我不關心anononimity,我只是想要數據。
我正嘗試構建一個網站,該網站可以抓取.onion域上託管的各種網頁。這意味着它不像調用requests.get("http://XXX.onion")
那麼簡單,因爲.onion只能通過TOR連接纔可用。最簡單的方式來抓取.onion域的網站?
我可以使用像onion.to這樣的重定向器,但需要點擊瀏覽,這在我爬行時不起作用。
我不關心anononimity,我只是想要數據。
你爲什麼不設置Tor和使用一堆wget和torsocks的?
例如
# torsocks wget -c -mirror http://kpvz7ki2v5agwt35.onion
你在乎洋蔥嗎? –
我想說明一下,您的用戶名與問題是一種痛苦的結合。 – orlp