2014-07-02 85 views
-7

我知道我可以通過file_get_contents方法獲取網頁內容, 但是有沒有辦法獲得腳本標籤之間的所有內容? 即假設該頁面建立,我希望得到的保持一個對象:獲取一個網址的完整源代碼

<script src="js.js"> 
    dataLayer = [{dest":"Lithuania","type" : "small", "code" : "4"}]; 
</script> 

有沒有什麼辦法可以用PHP或任何其他方法的內容?

+2

「*之間的所有內容」是什麼意思? –

+0

在'php'中使用'DOMDocument'。在特定標籤之間獲取內容。 –

+1

「*有什麼方法可以讓我得到內容......?」是的,是的。 – esqew

回答

0

您可以使用正則表達式獲取所有腳本標記和HTML文檔。

這裏只是一些PHP行,以檢索所有腳本標籤:

$matches = array(); 
$pattern = '/<script[^>]*>(.*?)<\\/script>/ius'; 
$subject = file_get_contents('YOUR URL'); 
preg_match_all($pattern, $subject , $matches); 

這裏$匹配是包含所有的字符串匹配模式的數組。鍵0包含完整的模式匹配和密鑰1包含(之間)僅匹配組:

[ 
    0 => [ 
    0 => "<script>script content 1</script>", 
    1 => "<script>script content 2</script>", 
    ... 
    ], 
    1 => [ 
    0 => "script content 1", 
    1 => "script content 2", 
    ... 
    ] 
] 

上的功能的一些細節:

我希望這個幫助:)

+0

非常感謝你=) – user2209644