我正在使用php,我想以更快的方式從url獲取內容。
這是我使用的代碼。
代碼:(1)使用php以更快的方式獲取內容使用php
<?php
$content = file_get_contents('http://www.filehippo.com');
echo $content;
?>
這是很多其他方法來讀取文件,如fopen()
,readfile()
等,但我認爲file_get_contents()
比這些方法快。
在我上面的代碼中,當你執行它時,你會發現它從本網站的所有東西甚至圖像和廣告。我只想得到計劃HTML文本沒有CSS樣式,圖像和廣告。我怎樣才能得到這個。
看到這個瞭解。
CODE:(2)
<?php
$content = file_get_contents('http://www.filehippo.com');
// do something to remove css-style, images and ads.
// return the plain html text in $mod_content.
echo $mod_content;
?>
如果我是這樣做上述然後我會在錯誤的方式,因爲我已經得到變量$content
的全部內容,然後修改它。
這裏可以是任何函數方法或其他任何從url直接獲取純文本html文本的方法。
下面的代碼只是爲了理解而寫的,這不是原來的php代碼。
IDEAL CODE:(3);
<?php
$plain_content = get_plain_html('http://www.filehippo.com');
echo $plain_content; // no css-style, images and ads.
?>
如果我能得到這個功能,它會比別人快得多。這可能嗎?
謝謝。
頁面'HTTP:// www.filehippo.com'嵌入了已經腳本和樣式。你不能選擇不下載它,但你可以過濾它。 –