我是PHP新手。有人可以幫我弄清楚如何抓取單個html頁面並打印該頁面源代碼中的所有單詞嗎?單頁網頁爬蟲PHP
0
A
回答
1
$words = explode(" ", strip_tags(file_get_contents("www.example.com"));
function trim_and_print(&$value)
{
trim($value);
if(strlen($value > 3)
echo $value;
}
array_walk($words, 'trim_and_print');
這應該打印長度> 3.感謝的話moteutsch爲的file_get_contents
1
您的問題不是很清楚,但您需要下載頁面(使用cURL或PHP的文件功能)並以某種方式處理文件。下面是一個基本的解決方案:
echo strip_tags(file_get_contents('http://www.google.com'));
相關問題
- 1. PHP網絡爬蟲
- 2. PHP中的網頁爬蟲鏈接/頁面邏輯
- 3. Python BeautifulSoup提取標題網頁爬蟲
- 4. 用飛鏢寫的網頁爬蟲
- 5. 自動登錄谷歌網頁爬蟲
- 6. 虛榮URL + REST +網頁爬蟲
- 7. 減輕爬蟲網頁負載
- 8. 與Python 2.7.9分頁網絡爬蟲
- 9. 使用python beautifulsoup進行網頁爬蟲
- 10. 使用Ajax/JavaScript的網頁爬蟲
- 11. php爬蟲(抓取單個網站)
- 12. 簡單的網絡爬蟲
- 13. 網絡爬蟲
- 14. Grails中的網頁爬蟲計算頁面深度
- 15. C++網絡爬蟲
- 16. Python網絡爬蟲
- 17. java網絡爬蟲
- 18. 網絡爬蟲類
- 19. php爬蟲檢測
- 20. 網絡爬蟲是否僅依靠主頁上的鏈接來進行爬網?
- 21. 在Java中的網絡爬蟲。下載網頁問題
- 22. 使網絡爬蟲在本地下載多個網頁
- 23. 網頁爬蟲與JavaScript數組的網址?
- 24. 爲什麼爬蟲不去下一頁?
- 25. 基於ajax的網站的php爬蟲?
- 26. 提前PHP爬蟲,網站與後端
- 27. PHP與Python對於網絡爬蟲
- 28. 在android上的簡單網絡爬蟲?
- 29. 簡單的網絡爬蟲(例程)
- 30. 簡單的Python網絡爬蟲
你說的「打印所有詞語的該頁面的源代碼的意思「? – Omer 2011-06-09 22:35:47
我的意思是..解析通過頁面的正文和打印長度超過3的所有單詞.. – rkt 2011-06-09 22:38:27
定義單詞?你在談論文字中的單詞嗎?標籤?這很令人困惑 – Omer 2011-06-09 22:39:44