0
A
回答
0
2
這需要解析HTML,這是在PHP相當大的挑戰。爲了節省很多麻煩,請下載HTML解析庫,例如PHPQuery(http://code.google.com/p/phpquery/)。然後,您必須選擇所有與pq('a')
的鏈接,通過它們循環獲取它們的href
屬性值,併爲每個鏈接將其從相對轉換爲絕對,並在生成的URL上運行file_get_contents
。希望這些指針能讓你開始。
1
所以你想找到給定文件中的所有URL?正則表達式來救援......而在其下面一些示例代碼應該做你想要什麼:
$file = file_get_contents($url);
if (!$file) return;
$file = addslashes($file);
//extract the hyperlinks from the file via regex
preg_match_all("/http:\/\/[A-Z0-9_\-\.\/\?\#\=\&]*/i", $file, $urlmatches);
//if there are any URLs to be found
if (count($urlmatches)) {
$urlmatches = $urlmatches[0];
//count number of URLs
$numberofmatches = count($matches);
echo "Found $numberofmatches URLs in $url\n";
//write all found URLs line by line
foreach($urlmatches as $urlmatch) {
echo "URL: $urlmatch...\n";
}
}
編輯:當我正確地理解你的問題,你現在要下載的發現URL的內容。您可以在foreach
循環中爲每個URL調用file_get_contents
,但您可能需要事先進行一些篩選(如不要下載圖像等)。
相關問題
- 1. sed從html頁面提取鏈接
- 2. 如何從.html頁面中提取鏈接和標題?
- 3. 如何從Java中的HTML頁面提取JavaScript鏈接?
- 4. 解析HTML頁面以提取鏈接
- 5. 從html頁面獲取相對鏈接
- 6. iphone - 如何從HTML提取youtube鏈接?
- 7. 如何提取從HTML鏈接
- 8. 如何從html頁面提取文本?
- 9. 如何從html頁面提取文本?
- 10. 從HTML中提取鏈接
- 11. 使用BeautifulSoup從html頁面提取鏈接
- 12. 如何從此頁面獲取鏈接?
- 13. 從HTML頁面提取所有鏈接,排除特定表格中的鏈接
- 14. 如何從Google HTML結果頁中提取鏈接?
- 15. 如何從Perl中的HTML頁面上的鏈接中提取文本?
- 16. 如何從html頁面提取javascript,css和img標籤的鏈接?
- 17. 如何鏈接Wordpress中的html頁面
- 18. 如何鏈接兩個HTML頁面
- 19. Objective C獲取html頁面的鏈接
- 20. 如何從android中的html鏈接獲取頁面的html源代碼?
- 21. cURL - 僅在html頁面提取數據(鏈接)
- 22. 從HTML頁面鏈接到MVC視圖
- 23. 從html表中提取鏈接
- 24. 鏈接多個HTML頁面
- 25. 超鏈接HTML頁面
- 26. HTML:無法鏈接頁面
- 27. 檢索鏈接HTML頁面
- 28. 新頁面鏈接menubar,html
- 29. 如何在JavaScript中提取指向Perl中的HTML頁面的鏈接?
- 30. HTML:轉到相同頁面鏈接的鏈接,如何保持頁面視圖?
通過調用file_get_contents將鏈接作爲參數傳遞來下載鏈接。 – Oswald 2011-01-06 15:25:05
[解析HTML的最佳方法]的可能重複(http://stackoverflow.com/questions/3577641/best-methods-to-parse-html/3577662#3577662) – Gordon 2011-01-06 15:27:29