有沒有人知道關於谷歌的網絡爬蟲(又名GoogleBot)的更多細節?我很好奇它寫的是什麼(我自己做了幾個爬蟲,並且準備做另一個爬蟲),如果它分析圖像等。我假設它在某處沿線,b/c images.google.com中的圖像全部調整大小。它也不會讓我感到驚訝,如果它全部是用Python編寫的,並且它們對所有的東西都使用了所有的庫,包括html/image/pdf解析。也許他們不會。也許它都是用C/C++編寫的。提前致謝-Google Bot信息?
0
A
回答
0
谷歌正式允許的語言,我認爲是Python/C++/Java。
該機器人可能使用全部3個不同的任務。
1
你可以找到一些有關Googlebot如何在這裏工作:
http://www.google.com/support/webmasters/bin/answer.py?hl=en&answer=158587
例如「取像Googlebot」工具,可以讓你看到一個頁面,Googlebot看到它。
1
爬行程序很可能是用C或C++編寫的,至少backrub的爬行程序是用其中的一種編寫的。
請注意,抓取工具只抓取頁面的快照,然後將其存儲在臨時數據庫中供以後處理。索引和其他附加算法將提取數據,例如圖像引用。
相關問題
- 1. 如何獲取Telegram Bot統計信息?
- 2. 爲什麼bot信息不能發送?
- 3. Google Weave API信息
- 4. Google Chrome信息欄
- 5. 發送消息到模擬器Bot Bot
- 6. Google Books API限速信息?
- 7. Google Map API信息窗口
- 8. Google Place詳細信息
- 9. Google datastore統計信息
- 10. Google-Finance:信息 - 網址
- 11. Google帳戶信息與oauth
- 12. Google地方信息和cURL
- 13. Google Places API - 詳細信息
- 14. Google地方信息和ZERO_RESULTS
- 15. 發佈到Google+信息流
- 16. Google DevTools缺少UI信息
- 17. Google地圖顯示相同信息的信息窗口
- 18. 快速回覆在Messenger Bot歡迎信息中工作嗎?
- 19. 如何終止Bot對話(並獲取客戶詳細信息)?
- 20. Can Bot框架處理Facebook音頻信息
- 21. Bot Framework模擬器和Cortana用戶信息
- 22. 你如何製作Facebook Messenger bot廣播信息?
- 23. Facebook Messenger Bot - 如何使用NodeJS獲取用戶信息?
- 24. HipChat Nodejs Bot - 不能接收房間信息
- 25. Node.js Bot拉鍊接消息
- 26. IRC bot的消息過濾
- 27. Telegram bot發送消息
- 28. Slack Bot互動消息
- 29. 如何區分Google Bot訪問和Bing Bot訪問
- 30. 從google地方獲取詳細信息
它有什麼不同? – jalf 2010-04-14 10:57:18