我試圖用file_get_contents
放棄從網站的數據,而不是網頁源我得到下面的代碼:的JavaScript阻止的file_get_contents
<body onload="challenge();">
<script>eval(function(p,a,c,k,e,r){e=function(c){return c.toString(a)};if(!''.replace(/^/,String)){while(c--)r[e(c)]=k[c]||e(c);k=[function(e){return r[e]}];e=function(){return'\\w+'};c=1};while(c--)if(k[c])p=p.replace(new RegExp('\\b'+e(c)+'\\b','g'),k[c]);return p}('1 6(){2.3=\'4=5; 0-7=8; 9=/\';a.b.c()}',13,13,'tax|function|document|cookie|ddosdefend|1d4607e3ac67b865e6c7263260c34e888cae7c56|challenge|age|0|path|window|location|reload'.split('|'),0,{}))
引擎是WordPress的。有沒有機會獲得真正的來源?
您是否嘗試下載該網頁'wget'並檢查文件? file_get_contents函數似乎可以精確地完成它的工作,您只需運行該網頁的嵌入式JavaScript代碼即可獲得任何有意義的輸出。 –
似乎輸出來自DDOS保護(例如像CouldFlare這樣的內容),可能會在提供所需內容之前向您的抓取工具提供驗證碼。 –
以及當我試圖進入的網站,瀏覽器,它通常加載沒有驗證碼和重定向 –