我正在學習scrapy來創建搜索引擎。根據我的理解,如果我想創建一個搜索引擎,那麼我需要做的第一件事就是抓取Internet並將其緩存到我的服務器。現在爲了抓取我需要一個URL,通過它我會去下一個,下一個等。 但是如果我沒有起始網址並且想要搜索我想要的內容呢?如何創建搜索引擎,無需任何起始網址
0
A
回答
0
隨着this question我發現You can't hide your IP address on the internet. They aren't secret.
我寫了一個腳本,並遍歷IP地址,發現網站名稱傳遞給Scrapy。這就是我需要的。
1
如果您沒有起始網址,想法可能是選擇一個。對我來說,這聽起來像你很迷茫。
要抓取內容,您需要向其他網站發送HTTP請求,但如果您沒有網址,則無法向其他網站發出HTTP請求。
這就像試圖映射在你周圍的物理世界中的每條道路。如果您沒有指定起點,您可以期待什麼?
相關問題
- 1. 如何阻止搜索引擎索引從origin.domainname.com開始的所有網址
- 2. 如何從搜索引擎中刪除廣告網址/廣告搜索網址
- 3. 創建內部網站搜索引擎
- 4. 如何創建搜索引擎或修改現有搜索引擎僅用於網站內的搜索?
- 5. 在經典ASP中創建搜索引擎友好的網址
- 6. 用PHP創建搜索引擎友好的網址
- 7. 使用htaccess創建搜索引擎友好的網址
- 8. 創建搜索引擎
- 9. 如何爲軌道模型創建搜索引擎友好的網址?
- 10. 如何創建一個搜索,搜索引擎友好(mod_rewrite htaccess)
- 11. 如何創建搜索引擎,自動搜索語音識別
- 12. 如何使用php創建搜索引擎友好搜索?
- 13. mod_rewrite的網址,搜索引擎優化
- 14. 在搜索引擎Laravel網址有index.php
- 15. 網址搜索引擎優化JOOMLA
- 16. 搜索引擎不會更正網址
- 17. 搜索引擎友好的網址
- 18. 搜索引擎友好的網址與/
- 19. 搜索引擎友好網址.htaccess
- 20. 搜索引擎如何抓取網站?
- 21. 搜索引擎索引 - 任何替代PhantomJs快照的搜索引擎優化?
- 22. 如何讓Google等搜索引擎顯示其標籤/網址?
- 23. 搜索引擎優化友好的網址 - 如何?
- 24. 如何構建概念搜索引擎?
- 25. 如何構建內部搜索引擎?
- 26. .htaccess搜索引擎優化的友好網址不起作用
- 27. .htacess搜索引擎優化網址和重定向網址
- 28. 網址是&,而不是搜索引擎處理的網址?
- 29. SEO - 如何避免搜索引擎爬蟲無法讀取整個網址
- 30. 構建網絡搜索引擎
是的。但是如果有一條路線沒有映射到較大的路線上呢?我在想的是伸手去那些道路。我不知道這是否可能,所以我把它放在這裏。 –
然後你可以問我們一個字符串是多長時間...... –
假設你有100分之一的機會會有一個你選擇的一個會導致死路一條......只是選擇一組URL來減少風險,那個概率。如果我是你,我會把所有這些擔憂放在一邊,並首先得到一個概念證明 –