下午好,親愛的社區,使用XPath提取信息
我終於編譯了一個工作的XPaths列表,用於從我需要的URL中提取所有信息。
我想問你的建議,對於編碼的新手什麼是最好的方式來使用只有XPaths(每個鏈接約100 xpaths)的50k鏈接刮?
Import.io是我目前最好的工具,甚至是Excel的SEO工具,但他們都有自己的侷限性。導入io是昂貴的,excel的SEO工具不適合提取超過1000個鏈接。
我很願意學習系統建議,但請爲我的項目建議一個好方法!
#已解決!搜索引擎優化工具爬行實際上是超級有用的,我相信我找到了我需要的東西。我想我會阻止Python或Java,直到我遇到另一個棘手的障礙。 謝謝大家!
可能的重複[如何在Python中使用Xpath?](http://stackoverflow.com/questions/8692/how-to-use-xpath-in-python) – n1c9