2
如果有其他類寫入這樣做,一個鏈接將是非常棒的。如果不是,我怎麼用PHPCrawl做到這一點?PHP的網絡爬蟲,數據結構和存儲,它會與PHPCrawl?
是否可以根據特定於網站的一組規則存儲來自已爬網站點的特定信息?例如,[div.wantThis, img#defaultPicture]
是網站A返回的數組,只有[div.shortTextContent]
是網站B返回的數組?
在PHPCrawl中,我如何從$page_data
數組中獲取這些信息?
需要
必須能夠只針對某些元素。
能夠從變量(可能是指定要定向的元素的數組)中讀取數據存儲規則。