-2
A
回答
1
對於網絡爬蟲部分,可以去看gocrawl:https://github.com/PuerkitoBio/gocrawl
免責聲明:我是作者。
1
你可以嘗試在Go的標準庫中的suffixarray實現:http://golang.org/pkg/index/suffixarray/
看看godoc它如何被使用。
相關問題
- 1. 開源PHP搜索引擎
- 2. 開源雲搜索引擎
- 3. 開源搜索引擎
- 4. 如何編寫搜索類?
- 5. 開源或付費搜索引擎API
- 6. 開源PHP搜索和分頁腳本?
- 7. .Net基於開源搜索引擎?
- 8. 如何使用Go刪除App Engine上的搜索索引?
- 9. 尋找一個用python編寫的裸機開源編輯器
- 10. 使用函數式編程語言編寫的開源項目
- 11. .htaccess URL重寫搜索編號
- 12. 編寫SQL搜索引擎查詢
- 13. 編寫一個SQL查詢搜索
- 14. 小寫搜索
- 15. Go中的低級XML流編寫器?
- 16. 是否有任何可用於搜索Deep Web的開源庫?
- 17. 開源搜索可以使用REST服務的UI項目
- 18. 開源用於搜索整合的語音識別軟件
- 19. 展開搜索編程魅力
- 20. ElasticSearch - 使用搜索縮寫
- 21. 用Scala編寫的開源的JavaScript解釋器
- 22. 用C++編寫的最漂亮的開源軟件
- 23. 用Visual C++編寫的最大的開源項目是什麼?
- 24. 在C編寫鏈表的通用搜索函數?
- 25. 如何使用C++編寫廣度優先搜索的代碼
- 26. 用python編寫的最佳搜索引擎
- 27. 用javascript編寫的搜索表達式解析器
- 28. 使用PHP編寫適當的搜索查詢MySQL
- 29. Go 1.5的引導式編譯器比用C編寫的Go 1.4編譯器慢嗎?
- 30. 用Python編寫源代碼
謝謝您的免責聲明!它有多好?它可以做什麼? –
看起來你們兩個同時回答了我的一半問題。我不知道該給誰打勾號 –
這是一個非常通用的爬蟲程序,基本功能是可擴展性,良好的網絡公民(尊重robots.txt規則,延遲),它爲每個主機運行一個goroutine ,所以多臺主機可以並行抓取。自述文件中的回購已經有相當詳細的記錄,如果您對圖書館有特定問題,請隨時打開問題或發郵件給我。 – mna