2014-11-21 95 views
0

我打算使爬網程序可以抓取200+域,哪種語言將適合它。我對PHP非常熟悉,但是是Python的業餘愛好者。PHP與Python對於網絡爬蟲

+0

這兩種語言都很慢。我會使用C,C++,C#,Java或Julia來處理任何需要性能的東西 – Julius 2014-11-21 05:32:23

回答

1

我已經建立了這兩種語言的抓取工具。雖然我個人覺得在python中製作一個抓取工具很容易,因爲有大量免費的html解析庫可供使用,但我建議您使用最適合的語言。使用您熟悉的語言構建精心設計的高效抓取工具,您將在該語言中獲得更好的表現。這兩種語言都沒有不能實現的功能,因此只需作出決定並開始工作即可。

祝你好運。

1

你可以嘗試兩種。在PHP中創建一個,在Python中創建一個。即使你有經驗,它也會幫助你學習語言。從不拒絕練習的機會。