2014-05-07 26 views
0

我使用php簡單的dom解析器。我有一個需要以純文本下載的網址列表(即urls.txt)。我試圖在這裏實現的是迭代URL,提取HTML /文本並逐漸將提取的文本寫入文本文件(即plain.txt)。我編寫了兩個獨立的代碼,但我需要更多關於將它們成功集成到一個代碼中以便自動化過程的更多見解。謝謝。整合兩個小的php代碼

<?php 
include('simple_html_dom.php'); 

$Handler = fopen("urls.txt", "a+"); 
$Urls = fgets($Handler); 

while (!feof($Handler)) { 
    $Urls = fgets($Handler); 
    echo $Urls ."<br />\n"; 
    } 
fclose($Handler); 

?> 

<?php 

$html = file_get_html('http://example.com')->plaintext; 
$Dump = fopen("plain.txt", "a+"); 
fwrite($Dump, $html); 
fclose($Dump); 
?> 

回答

0

您可以創建第二個腳本的功能:

function func($url) { 
    $html = file_get_html($url)->plaintext; 
    $Dump = fopen("plain.txt", "a+"); 
    fwrite($Dump, $html); 
    fclose($Dump); 
} 

,然後你的第一個腳本成爲:

include('simple_html_dom.php'); 

$Handler = fopen("urls.txt", "a+"); 
$Urls = fgets($Handler); 

while (!feof($Handler)) { 
    $Urls = fgets($Handler); 
    func($Urls); 
} 
fclose($Handler); 
+0

它給錯誤。 – user2928990

+0

你能更具體嗎?什麼是錯誤?還有什麼返回fgets? – ValentinH