可能有人幫助我如何解析這個鏈接的curl?如何解析LinkedIn頁面
https://www.linkedin.com/in/williamhgates/
這是我的代碼:
只要運行它,看看結果:
$url = "https://www.linkedin.com/in/williamhgates/";
$ch = curl_init($url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_BINARYTRANSFER, true);
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE);
curl_setopt($ch, CURLOPT_HTTPHEADER, array('Host: www.linkedin.com/in/williamhgates/'));
$output = curl_exec($ch);
curl_close($ch);dd($output);die;
我只是想獲得全部源的一個文件,但它顯示了:
Could not process this client request HTTP method request for URL
也許它缺少像useragents頭。 – Jer
我用html_dom和curl嘗試不同的方法,但是它們都不起作用! – Hamed
如果您在php.ini中啓用了file_get_html,則可以使用'$ html = file_get_html(https://www.linkedin.com/in/williamhgates/');'並使用DOM類從中提取數據。 –